Airbnb使用的动态定价模型

论智 2018-10-10 09:16 次阅读

在KDD 2018上,Airbnb的研究人员们发表了一篇名为Customized Regression Model for Airbnb Dynamic Pricing的论文。这篇文章描述了Airbnb使用的动态定价模型,以下是论智对文章的大致介绍。

价格优化的目的是帮助房东制定最优价格。传统定价策略是为大量相同的产品定价,但在Airbnb没有相同的产品,因为平台所提供的房屋都有独一无二的价值和体验感受。这样的独特性就很难估计传统定价策略所需要的需求曲线。

“研究人员所提出的策略模型在Airbnb上应用了一年多的时间。第一代模型刚一使用,网站的预定量就得到大幅提升,采用了这一方法的房东们受益也随之增长。经过多次迭代后,策略模型将进一步改善定价的质量。”

想给Airbnb上所有不同的房间定价是非常有挑战性的,即使我们可以收集同一区域中的同样大小的房间,但是其他因素(例如评分星级)也会影响价格。除此之外,由于不同的季节和区域因素,需求也是随时间波动的。同样,预定的早晚也是影响价格的因素,预定的越晚,房间预订成功的机会就越小,这也会导致需求函数的变化。

为了让房东的受益最大化,Airbnb提出了“Price Tips”和“Smart Pricing”工具。Price Tips可以提供价格日历,根据房东目前的定价,显示该房间每天被预定出去的概率是多少。点击某一天,页面中会显示Airbnb推荐的价格以及其他信息。

Price Tips截图

在Smart Pricing工具中,房东可以设置一个最低值和最高值,之后Airbnb会自动生成不同日期的新价格。

Smart Pricing截图

在理想情况下,我们会估计一个需求曲线F(P), 在给定价格P的情况下估计房间的需求量,之后选择P的值,使P×F(P)的值最大。之前我们已经提到过影响价格的因素有很多,而且,由于Airbnb并不是直接控制房间价格的,而是只能给出“建议价格”,所以想要直接拿不同的定价策略做实验来观察市场反应也是不容易的。

Airbnb最终采用的定价系统有三个要素:

一个二元分类模型,预测某一晚某房间预定的概率。

这些预测之后会被输入到一个定价策略模型中,会对空闲日期提出建议价格。

策略模型会加入其他个性化逻辑,以符合房东的目标、结合特殊事件等等。

定价系统概览

这篇论文的主要目的是定价策略模型,但是我们首先要简单了解下预定概率模型的细节。

预定概率模型

想知道某件房间会有多大概率被预定,这里是用的是Gradient Boosting Machines(GBM),除此之外还有一个针对各个市场训练的模型。对于训练数据的采样率在根据各市场密度的不同有所差别:

“房屋密度高的市场能从地理位置这一因素中获益最多,这里的采样率会高于全局常量的采样率。”

模型在做决策时考虑了三个方面:

页面所列出的各项特征,例如每晚的价格、房间类型、可住人数、房间数量、洗手间数量、房间设施、地理位置、评价、历史入住率、能否立即预定等等。

时间因素,例如季节、日期、可入住时间等等。

供给因素,例如周围是否有相似房源、评价、搜索率等等。

模型在不同价格点预测预定概率,可能会得到一个需求曲线。但是,由于上述的多重影响因素,想得到精确的需求曲线进行价格设置是非常困难的。

“我们试着基于估计的需求曲线,直接应用利润最大化策略,但是在线的A/B测试结果显示这些方法在实际中通常会失败。所以,我们决定找其他的替代方法。”

替代法使用预定概率模型的输出结果作为定价策略模型的输入因素之一。

定价策略模型

首先让我们思考:在缺少最优价的基础上,训练定价策略模型时,应该用什么评估尺度呢?

深思熟虑之后,研究团队确定了两种评估尺度:价格下降查全率(PDR)和预定反悔率(BR)。我们曾统计过,某间房间是否在某天被预定出去,以及预定的价格是多少。PDR和BR都能反映出这一点。

假设如果某间房没能以价格P成功预定,那么它也一定不会在比P更高的价格上预订出去。但是如果价格低于P,那么可能有被预定的机会。PDR就表示当实际价格高于模型的建议价格时,房间未被预定的比例。在下面的图表中,PDR为0.6(5晚中有3晚没有被预定出去)。

如果我们只有PDR,那么最终我们训练出的模型最后会把指导价格变为零!如果该房间某天被成功预订,价格为P,并且P≥指导价格,那么这个指导价格就没什么用了。预订反悔率就抓住了这之中的利润。BR按以下方法计算:对于所有被成功预订的日子,取零和预定价格与指导价格之间的百分比之中的最大值。然后从这些值中取中位数。

例如:

BR就是(14,5,6,0,0)的中位数,5%。

现在我们把这些思想合到一个单一的损失函数中,看起来是这样:

给定参数xi,fθ(xi)是输出的建议价格,L是下限函数,U是上限函数。

对于预订出去的日期,下限是预定价格Pi,对于没有预定出去的日子,是c1Pi,其中c1是0到1之间的常数。

对于没有被预订出去的日子,上限是价格日历中的价格Pi。对于预订出去的日子,上限是c2Pi,其中c2是大于1的常数。

当建议价格在上下限之间时,损失是零,否则损失就是建议价格和界限之间的距离。

在论文中,作者提到:

“我们并不用相同的常数表示价格增加和减少,因为我们想让训练系统非对称地学习比率。这样一来,建议价格可以反映需求的敏感度。”

参数θ1和θ2是在Airbnb上400多万个有效房源中训练出的,训练更关注最近的预定行为,从而更好地反映季节信号。

评估

和直接从预定概率模型中的需求估计曲线定价的简单策略相比,定价策略模型显著改善了PDR和BR。

除了定量评估,论文作者还检查了2018年2月8日生成的未来120晚的价格,下图分别是针对日本东京和美国加州太浩湖的房源价格走势:

可以看到,两地房间的价格都在周末有所上升,并且东京在三月末到四月初的房价也相对较高,因为那正是赏樱的好时节。“从这两个案例中,我们看到模型的确能捕捉到时间带来的房价波动”,研究者说。

热门推荐

原文标题:KDD 2018 | Airbnb用机器学习实现动态定价

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

如何融合密度峰值进行高斯混合模型聚类算法概述

针对高斯混合模型( GMM)聚类算法对初始值敏感且容易陷入局部极小值的问题,利用密度峰值(DP)算法....

发表于 12-18 18:33 9次 阅读
如何融合密度峰值进行高斯混合模型聚类算法概述

电力通信运维元数据建模技术的研究

随着电力通信技术的发展,产生了大量分布式的电力通信运维子系统以及海量的电力通信运维数据。这些运维数据....

发表于 12-18 17:21 9次 阅读
电力通信运维元数据建模技术的研究

如何使用K邻近算法进行城市道路短时的交通预测的详细资料概述

为了提高城市道路交通状态预测的准确度,适应交通状态剧烈变化,提出了基于K邻近算法的实时交通预测框架。....

发表于 12-18 16:11 12次 阅读
如何使用K邻近算法进行城市道路短时的交通预测的详细资料概述

数据库教程之数据库的基本概念详细资料说明

本文档的主要内容详细介绍的是数据库教程之数据库的基本概念详细资料说明主要内容包括了: 1.1 基本....

发表于 12-18 15:07 9次 阅读
数据库教程之数据库的基本概念详细资料说明

如何使用自适应嵌入的半监督多视角特征实现降维的方法概述

半监督模式下的多视角特征降维方法,大多并未考虑到不同视角间特征投影的差异,且由于缺乏对降维后的低维矩....

发表于 12-18 14:19 5次 阅读
如何使用自适应嵌入的半监督多视角特征实现降维的方法概述

COMSOL软件使用技巧:如何搜索特定App

通过 App 名称进行搜索比自由文本的用途更广。为了使搜索功能严格按照名称搜索模型,我们利用了前缀 ....

的头像 COMSOL 发表于 12-18 14:13 65次 阅读
COMSOL软件使用技巧:如何搜索特定App

如何用Python和循环神经网络预测严重交通拥堵?

Waze 从几年前开始,就和政府部门合作,进行数据开放共享。这样一来,政府可以通过 Waze 的数据....

的头像 澳门威尼斯人官网手机网工程师 发表于 12-16 10:47 868次 阅读
如何用Python和循环神经网络预测严重交通拥堵?

物联网加上5G,是2019年的投资重点

时序即将进入2019年,台湾中信银研究团队指出,2019年对于投资人将是风险与机会并存的一年,其中,....

发表于 12-16 09:27 155次 阅读
物联网加上5G,是2019年的投资重点

如何使用TF-IDF算法进行P2P贷款违约预测模型设计

针对目前P2P贷款违约预测模型受限于借贷双方信息不对称性,未考虑投资人之间差异性的问题,提出了基于信....

发表于 12-14 13:42 18次 阅读
如何使用TF-IDF算法进行P2P贷款违约预测模型设计

如何使用多中心卷积特征加权进行图像检索方法

深度卷积特征能够为图像内容描述提供丰富的语义信息,为了在图像表示中突出对象内容,结合激活映射中较大响....

发表于 12-13 17:56 40次 阅读
如何使用多中心卷积特征加权进行图像检索方法

如何使用粒子Mean Shift迁移进行红外人体目标跟踪算法概述

提出了一种基于粒子Mean Shift 迁移过程的红外人体跟踪方法。 算法通过采样粒子迁移和聚类动态....

发表于 12-13 16:05 29次 阅读
如何使用粒子Mean Shift迁移进行红外人体目标跟踪算法概述

基于概率信息不完备的群决策模型介绍

针对犹豫模糊元中元素发生的概率信息不完备的群决策问题,提出一种基于最优化模型和一致性调整算法的群决策....

发表于 12-13 10:58 30次 阅读
基于概率信息不完备的群决策模型介绍

V+云视听极光收视率数据,提供真实全面的收大屏视数据

2018年12月,中国广视索福瑞媒介研究(简称CSM媒介研究)联合腾讯视频TV端,在北京首次发布“T....

的头像 流媒体网 发表于 12-13 10:42 401次 阅读
V+云视听极光收视率数据,提供真实全面的收大屏视数据

如何使用混合卷积神经网络和循环神经网络进行入侵检测模型的设计

针对电力信息网络中的高级持续性威胁问题,提出一种基于混合卷积神经网络( CNN)和循环神经网络( R....

发表于 12-12 17:27 103次 阅读
如何使用混合卷积神经网络和循环神经网络进行入侵检测模型的设计

如何使用生成对抗网络进行信息隐藏方案资料说明

针对信息隐藏中含密栽体会留有修改痕迹,从根本上难以抵抗基于统计的隐写分析算法检测的问题,提出一种基于....

发表于 12-12 16:57 24次 阅读
如何使用生成对抗网络进行信息隐藏方案资料说明

使用信号配时的公交优先策略进行触发概率模型介绍

针对现有信号机控制逻辑无法响应公交车辆累积数、控制参数敏感性较低等问题,构建公交优先策略触发概率模型....

发表于 12-12 16:25 21次 阅读
使用信号配时的公交优先策略进行触发概率模型介绍

复杂产品协同设计中如何进行数据建模与驱动的方法

针对在传统基于工作流的协同设计中,不同专业设计人员交流和任务协调困难导致产品设计效率低下的问题,提出....

发表于 12-12 14:43 30次 阅读
复杂产品协同设计中如何进行数据建模与驱动的方法

如何降低相似度碰撞的证据融合方法

针对相似度碰撞引发证据融合结果错误的问题,提出一种新的证据融合方法。首先,提取证据的焦元序列特征并将....

发表于 12-12 11:49 23次 阅读
如何降低相似度碰撞的证据融合方法

聚类系数和度相关性均可调的HK扩展模型

现有的社交网络增长演化模型的度相关性大多为负值。针对这种情况,以HK(Holme和Kim)模型为基础....

发表于 12-12 11:39 45次 阅读
聚类系数和度相关性均可调的HK扩展模型

如何考虑社交网络的用户行为来进行网络病毒传播建模分析

针对已有病毒传播模型都没有考虑不同社交网络间的用户交互行为对网络病毒传播规律的影响,建立了考虑不同社....

发表于 12-11 16:44 102次 阅读
如何考虑社交网络的用户行为来进行网络病毒传播建模分析

基于T-S模糊模型的预测控制算法在城轨列车制动控制中的应用

城市轨道交通因其自身载运量大,速度快,零阻塞等诸多优点在现代城市生活中起着越来越重要的作用。制动系统....

发表于 12-10 11:25 34次 阅读
基于T-S模糊模型的预测控制算法在城轨列车制动控制中的应用

使用软件定义网络的网络流量异常检测技术资料说明

软件定义网络(Software-Defined Networking, SDN)作为一种新型的网络架....

发表于 12-10 11:25 33次 阅读
使用软件定义网络的网络流量异常检测技术资料说明

NGSAII-GPR模型在碳排放短期预测中的应用

针对于采矿过程中以电机为研究对象的碳排放来源的复杂性以及其影响因素的多样性引起的碳排放短期预测精度不....

发表于 12-10 11:25 26次 阅读
NGSAII-GPR模型在碳排放短期预测中的应用

变精度下不完备混合数据如何进行增量式属性约简

为了解决当不完备混合决策系统中数据动态增加时,静态属性约简方法的计算复杂度高的问题,提出变精度下不完....

发表于 12-07 16:12 31次 阅读
变精度下不完备混合数据如何进行增量式属性约简

使用引力模型的多标签分类算法的资料概述

针对多标签分类算法不能充分利用标签相关性的问题,通过建立标签的正、负相关性矩阵来挖掘标签间不同的相关....

发表于 12-07 11:53 34次 阅读
使用引力模型的多标签分类算法的资料概述

如何使用多分形谱及特征来优选说话人识别系统的资料说明

语音是复杂的非线性信号,这使得基于线性理论的传统说话人识别系统性能难以进一步提高。结合语音特点,基于....

发表于 12-06 15:29 24次 阅读
如何使用多分形谱及特征来优选说话人识别系统的资料说明

复合变邻域搜索算法如何解决长期车辆的合乘问题详细算法说明

针对于长期车辆合乘问题( LTCPP),提出一种复合变邻域搜索算法(HVNSA),将具有相同目的地的....

发表于 12-06 11:53 30次 阅读
复合变邻域搜索算法如何解决长期车辆的合乘问题详细算法说明

如何进行RGB图和HSI图的转换详细资料说明

所谓彩色模型就是指摸个三维颜色空间中的一个可见光子集。它包含某个颜色域的所有颜色。例如, RGB 颜....

发表于 12-05 16:44 32次 阅读
如何进行RGB图和HSI图的转换详细资料说明

TOSM和UOSM校准方法的基本原理与误差分析研究

传统的同轴系统校准方法通常叫TOSM----Through Open Short Match(又称S....

的头像 射频百花潭 发表于 12-04 16:09 2057次 阅读
TOSM和UOSM校准方法的基本原理与误差分析研究

中国为何要收集电动汽车数据

每隔30秒,每辆电动汽车都必须向政府发送数据,包括汽车的位置、方向和速度。但这种数据分享引发了隐私问....

的头像 1号机器人网 发表于 12-04 11:02 599次 阅读
中国为何要收集电动汽车数据

Numpy居然有这么多陷阱?

从 Out[101] 可以看到一个陷阱,a[:, 0] 过滤完应该是一个 3 x 1 的列向量,可是....

的头像 马哥Linux运维 发表于 12-03 16:37 341次 阅读
Numpy居然有这么多陷阱?

关系模型的进化算法收敛性对比的详细资料说明

研究建立了一种等态等价关系与强/弱态偏序关系模型,用于分析进化算法在收敛性上的等价性与可比性.基于吸....

发表于 12-03 14:15 43次 阅读
关系模型的进化算法收敛性对比的详细资料说明

Altium 如何生成Gerber文件?

Gerber文件是一种符合EIA标准,由GerberScientific公司定义用于驱动光绘机的文件....

的头像 澳门威尼斯人官网手机网工程师 发表于 12-01 10:18 350次 阅读
Altium 如何生成Gerber文件?

三维数字化集成检测系统实现关键技术分析

如何实现真正的无图化、无纸化的三维数字化集成检测,是当前制造业的一个重要发展方向,本文在三维数字化检....

发表于 11-30 11:11 160次 阅读
三维数字化集成检测系统实现关键技术分析

如何使用复杂网络进行舰艇作战模型的分析研究

借鉴复杂网络的作战描述模型,把作战单元抽象成节点,把各单元之间的相互作用抽象成有向边,将战场描述为1....

发表于 11-29 16:43 38次 阅读
如何使用复杂网络进行舰艇作战模型的分析研究

如何分析地下电缆绝缘状态监测的边缘电场法

根据地下电力电缆绝缘状念移幼监测对传感器的要求,提出运用边缘电场法进行水树老化检测的方案。针对利用传....

发表于 11-29 10:47 32次 阅读
如何分析地下电缆绝缘状态监测的边缘电场法

中国领跑2018计算机科学领域高被引学者榜单

值得一提,2018 年度的高被引学者首次引入了“跨学科”领域,以凸显那些在多学科领域具有重大影响但在....

的头像 新智元 发表于 11-29 09:38 2167次 阅读
中国领跑2018计算机科学领域高被引学者榜单

数据库教程之关系数据库知识点总结的详细资料概述

本文档的主要内容详细介绍的是数据库教程之关系数据库知识点总结的详细资料概述主要内容包括了:1 关系模....

发表于 11-28 19:44 51次 阅读
数据库教程之关系数据库知识点总结的详细资料概述

如何使用频繁模式发现进行时间序列异常检测详细方法概述

针对传统异常片 段检测方法在处理增量式时间序列时效率低的问题,提出一种基于频繁模式发现的时间序列异常....

发表于 11-28 11:09 42次 阅读
如何使用频繁模式发现进行时间序列异常检测详细方法概述

如何使用模型过滤的多任务回归应用在帕金森症预测中

传统基于语音的帕金森症(PD)病情预测方法则是分别预测运动症状评分(motor-UPDRS)和总体症....

发表于 11-28 09:53 47次 阅读
如何使用模型过滤的多任务回归应用在帕金森症预测中

基于分层路径计算单元与双矩阵博弈的多域光网络静态组播专用保护算法

在预先配置 组播业务的多域光网络中,如何保证静态组播业务的生存性已成为广泛关注的问题。针对此问题,通....

发表于 11-28 09:53 50次 阅读
基于分层路径计算单元与双矩阵博弈的多域光网络静态组播专用保护算法

如何使用狄利克雷多项分配模型进行多源文本主题挖掘模型

随着文本数据来源渠道越来越丰富,面向多源文本数据进行主题挖掘已成为文本挖掘领域的研究重点。由于传统主....

发表于 11-27 17:30 35次 阅读
如何使用狄利克雷多项分配模型进行多源文本主题挖掘模型

巴西最大的专业协会在线泄露其三个数据库中数百万个人数据记录

白帽黑客生态系统Hacken Proof的安全研究员鲍勃·迪亚琴科(Bob Diachenko)称其....

的头像 E安全 发表于 11-27 15:38 476次 阅读
巴西最大的专业协会在线泄露其三个数据库中数百万个人数据记录

斯人已逝,但ta能在AI程序中永生

Ursache称:“我们收集地理位置、动作、活动、健康应用程序数据、睡眠数据、照片、用户在应用程序中....

的头像 新智元 发表于 11-26 09:13 521次 阅读
斯人已逝,但ta能在AI程序中永生

信号与系统的教程课件资料免费下载

本文档的主要内容详细介绍的是信号与系统的教程课件资料免费下载主要内容包括了:1.信号的描述、分类、运....

发表于 11-26 08:00 29次 阅读
信号与系统的教程课件资料免费下载

Airbnb开发和部署的房源嵌入技术

使用最终预订的房源作为全局上下文 (Global Context) :我们使用以用户预订了房源(上图....

的头像 澳门威尼斯人官网手机网工程师 发表于 11-24 10:35 680次 阅读
Airbnb开发和部署的房源嵌入技术

基于Haar小波分析改进的多元线性回归算法在MBR中的应用

近年来污水处理成为热点话题之一,污水处理有很多种方法,而利用MBR 技术进行污水处理是其中比较高效的....

发表于 11-23 16:10 34次 阅读
基于Haar小波分析改进的多元线性回归算法在MBR中的应用

如何使用CNN和BiLSTM网络特征融合进行文本情感分析

卷积神经网络( CNN)和循环神经网络(RNN)在自然语言处理,上得到广泛应用,但由于自然语言在结构....

发表于 11-22 16:01 104次 阅读
如何使用CNN和BiLSTM网络特征融合进行文本情感分析

如何使用NARX神经网络进行热负荷预测中关键影响因素的分析

在区域供热(DH)网络中 , 精确预测热负荷已被认为是提高效率和节省成本的重要环节。为了提高预测精度....

发表于 11-22 16:01 49次 阅读
如何使用NARX神经网络进行热负荷预测中关键影响因素的分析

魏杰教授进行了深入分析,并且对中国宏观经济最新走势进行了推测

你们可以查一下资料,2007年,我们当时增长方式是出口导向型增长方式,07年GDP总量是27万亿人民....

的头像 智能制造 发表于 11-22 15:23 813次 阅读
魏杰教授进行了深入分析,并且对中国宏观经济最新走势进行了推测

CY8C5步骤模型

是否会出现以下组件的步骤模型? 1。CY8C5667 LTI-LP09 2。CY8C5868 AXI-LP032 以上来自于百度翻译 ...

发表于 10-15 15:23 70次 阅读
CY8C5步骤模型

请问使用Motorware时如何备份工程防止数据丢失?

使用Motorware时,如何备份工程,防止数据丢失? 我现在从Motorware中打开了一个工程,但是大部分的文件是链接形式的,我怎么...

发表于 09-30 11:24 498次 阅读
请问使用Motorware时如何备份工程防止数据丢失?

请问为什么在我这种结构第一次收到数据是完整的一帧65位,而第二次就收到33位数据?

发表于 09-20 16:30 371次 阅读
请问为什么在我这种结构第一次收到数据是完整的一帧65位,而第二次就收到33位数据?

Vuforia开发技巧:通过手指拖拽平移模型

AR/VR技术交流群 129340649 前面文章介绍了怎么对3D模型进行缩放、平移和旋转, 《(Unity3d)Vufori...

发表于 09-20 10:20 175次 阅读
Vuforia开发技巧:通过手指拖拽平移模型

BenchVue似乎只记录了1小时的数据

当我下载并安装BenchVue时,我有点热情,我将它连接到带有3个DMM 34401的GPIB上,随着时间的推移监控3个电池。 一切都...

发表于 09-18 15:59 192次 阅读
BenchVue似乎只记录了1小时的数据

tcp通讯只有超时了发送到数据才能显示出来?

如图,,为什么只有超时了,发送到数据才能显示出来? 连线图如下。 ...

发表于 09-13 15:45 324次 阅读
tcp通讯只有超时了发送到数据才能显示出来?

请问如何打包数据

我开始发现我的特点与cyble_gattcdiscoverallcharacteristics()去cyble_evt_gattc_read_by_type_rsp事件。 charreport =(cyble...

发表于 09-12 10:01 174次 阅读
请问如何打包数据

会议预告-2019北京国际数据中心技术设备展览会

数据中心展,据中心技术展,据中心设备展,北京数据中心展,北京据中心技术展,北京据中心设备展,2019数据中心展,2019据中心技...

发表于 09-11 17:17 253次 阅读
会议预告-2019北京国际数据中心技术设备展览会

这6点帮你解决参数未知的重要问题 | AI知识科普

班主任发现,经常有许多对人工智能领域跃跃欲试的小伙伴在后台发私信问我“怎样快速入门人工智能呢?” 对于这样的问题,班主...

发表于 08-10 11:47 422次 阅读
这6点帮你解决参数未知的重要问题 | AI知识科普

i32数据和u32数据有什么区别?

i32数据和u32数据有什么区别?

发表于 07-29 15:17 633次 阅读
i32数据和u32数据有什么区别?