当前位置:主页 > 毕业论文 >

大数据背景下的购买行为预测研究与应用

请输入课题关键词,搜索相关范文

文档下载

网盘链接 https://pan.baidu.com/s/1atwBpiwVTxxHA8185Lx14w

提取码: fh76


部分内容展示

随着计算机技术和网络技术的迅速发展,计算机和互联网已经得到普及,这一现状使得网络已经成为人们获取各种资源和信息的主要途径,在人们的学习、工作和日常生活当中扮演着非常重要的角色,并将进一步的影响人们的生活方式。根据中国互联网络信息中心发布第42次《中国互联网络发展状况统计报告》显示,截至2018年6月30日,我国网民规模达8.02亿,普及率为57.7%。与中国的总人口相比,互联网的普及率高达48.8%。互联网络技术的广泛使用,标志着人类社会开始进入“网络经济”时代,而电子商务则是这个时代最显著的特征之一。电子商务的出现使得消费者可以和企业之间产生最直接的接触,企业通过网络渠道,直接为消费者提供商品的各种信息并且进行销售活动,这一推广和营销模式打破了时间和空间的各种限制,缩短了消费者与设计者、制造商、批发商、零售商、服务商之间的距离,因此在很大程度上提高了营销效率和交易效率。在这种情况下,几乎所有的商家和消费者都有了从线下转到线上的意识。
电子商务交易规模的增长也产生了海量的客户购买行为数据,其中的客户历史交易数据、日志数据等成为电子商务企业拥有的最大财富。在大数据时代,依托网络信息技术手段,通过网络平台来收集客户行为数据,应用数据挖掘、机器学习等分析和挖掘客户行为数据来获得客户的个性化特征、偏好、情感倾向、行为习惯、客户之间的相互影响关系等来预测客户行为,从而能够准确把握顾客的购买意图。挖掘出客户的购买行为习惯和倾向,能够对电子商务中的潜在客户群体进行识别和定位,对潜在客户群进行确定,提高网站的客流量、达到最大利润把浏览者变为购买者、制定适当的企业战略、优化仓储、成为各企业追求的目标,这些方面的提升有助于电商企业发展精准的营销和实时的营销,同时能够精准的估计下一个阶段的进货量以及出货量,能够有效的控制成本。有着非常强的现实意义和经济价值。
首先,国内外企业对用户行为数据分析已有了较多研究。T.G.Wang以雅虎奇摩的用户为研究对象,研究了影响顾客忠诚度与重复购买率的主要因素,感知风险被假设为对重复购买意愿的负面影响,并对重复购买意愿的效用和享乐价值的影响进行适度的调整。较高的感知风险降低了效用价值的影响,增加了享乐价值对重复购买意愿的影响。以分析用户行为数据来预测用户购买意向的营销方式己经被广泛应用,早在2007年,沃尔玛就提出了“啤酒与尿布”的营销方案。沃尔玛超市通过消费者的历史购买数据发现,有很多用户均购买了尿布与啤酒的消费记录,而进一步调取详细数据发现这些几乎全部为男性消费者购买的,因此超市在以后的货物摆放时将尿布与啤酒放在相邻位置,能帮助消费者快速拿到想要的商品的同时,也提升了用户体验,增加了用户订单量。调查显示绝大部分消费者通过网络购物时有翻看评论的习惯,苏雪佳以BZC模式的代表电子商务平台之一亚马逊网站为例对用户评论这一特征展开了研究。郑淞月、刘益、杨伟等人以美团网的餐饮产品为研究对象,分析了影响用户团购的各因素与用户购买行为之间的关系,特征分析结果表明用户购买评论数多、使用限制少的商品几率更大,给商家的经营模式提出了指导性建议。
其次,国内外电子商务平台通过对大量的用户数据分析,纷纷推出了商品推荐模块,如各大平台的“猜你喜欢”模块、首页个性化推荐、根据搜索内容推荐等,而实现这些模块就是通过推荐算法,其中最常用的是根据关联规则的协同推荐算法。典型的有协同过滤方法,首先收集数据,然后找到相似用户和商品,从而生成推荐条目。黎芷杉分析了网络购买书籍的用户行为特点,提出了协同推荐算法,寻找与下单用户行为相似的其他用户,达到推荐的目的。W.Chen以在线学习环境中给用户推荐的课程为研究对象,使用基于项目的协同过滤发现与内容相关的项目集,然后将项目集应用于序列模式挖掘(SPM)算法,根据常见的学习序列筛选项目,这两种方法结合在一起,推荐可能有用的学习项目来指导用户当前的学习过程,用户反馈效果良好。陈洁(2010)提出使用购买率而不是人口特征对在线消费者进行细分,他们使用基于NBD的BG/NBD模型构建在线消费者的购买率预测模型,通过前26周的购买数据将准确地预测了都27周消费者的购买情况。李美其(2015)在Pareto /NBD模型加入用户评论次数和总购买金额两个协变量对大众点评网的用户购买行为进行预测[(47]。舒方电015)提出了基于SMC模型和HIPP模型的组合方法来预测客户的重复购买率并使用遗传算法来确定两个模型的最佳组合权值。
通过对国内外研究现状的分析发现,电子商务领域对用户数据挖掘的研究还处于探索阶段,大部分研究注重算法的应用与优化,也有少部分仅针对少部分特征进行了分析。国内互联网交易平台如淘宝网、携程、京东商城等均已推出了基于推荐算法的应用模块,但根据预测概率有针对性的帮助用户购物的研究还是少之又少,无论是国外的亚马逊,facebook还是国内的淘宝、美团等每天都在产生大量用户数据的平台,对用户行为数据的分析与处理研究尚不成熟,特征工程是从大数据中提取有价值的信息的必要工作,同时也要加强对机器学习算法的应用研究。
康复论文
本节将使用第三章的Extra-trees算法对上节构造的322个特征进行选择以供下一章的分类算法进行学习获得预测模型。由于原始数据中未购买行为远远超过了购买行为,所以标记后的训练集的最后一列—标记列的取值分布是不平衡的,标记变量取“0”,的样本数远远多于取,“1”的样本数。Extra-trees算法的本质是一个分类算法,分类算法往往无法处理不平衡数据。并且由于处理时间和内存容量的限制,在全部样本上运行算法也是不现实的,所以本文通过抽样来处理数据的不平衡以及样本规模过大的问题。由于训练集的标记列取值为,“1”的样本(有购买行为)对于预测用户未来一天是否购买商品意义重大,并且数量稀少,所以将其全部选出,共730个。然后从标记列取值为“0”的样本(无购买行为)共87383个中随机选出1500个组成训练集,缩小训练集中两类样本数的数目差距,使得其比例约为1:20最后使用Extra-trees算法选择特征。

  • 添加微信,提供课题关键词,帮你找

猜你喜欢

热搜课题