数据挖掘在淘宝文具市场店铺分析中的应用

 2022-01-17 11:01

论文总字数:18877字

目 录

1 引言 2

1.1研究背景 2

1.2研究意义 2

1.3研究方法 2

1.4研究框架 2

2 文献综述 2

2.1国内研究现状 2

2.2国外研究现状 2

2.3 研究评述 2

3 数据分析 2

3.1数据收集 2

3.2 店铺属性的解释 2

3.3 C5.0树分类模型 2

3.3.1 对数据进行C5.0树的建模 2

3.3.2 变量重要性 2

3.3.3 C5.0分类决策树 2

3.3.4 C5.0规则集 2

3.3.5 结论 2

3.3 QUEST树分类模型 2

3.3.1 对数据进行QUEST树的建模 2

3.3.2 变量重要性 2

3.3.3 QUEST决策树 2

3.3.4 结论 2

3.5 Apriori关联分析 2

3.5.1 关联规则 2

3.5.2 结论 2

4 总结和展望 2

4.1 结论 2

4.2 不足与展望 2

参考文献 2

致谢 2

数据挖掘在淘宝文具市场店铺分析中的应用

张良

Abstract:With the wide extension of Electronic Business platform in China, the c2c trading platform, which is dominated by Taobao, has become an indispensable part of people's online shopping. Therefore, how to improve store sales becomes the greatest significance to shop owners.

This paper analyzes the importance of certain attributes of the store to the sales impact through the C5.0 tree classification model at first. Through the establishment of the decision tree, the rule set is used to further prove that the store credit occupies the leading position in the influence of the store sales, the logistics and the goods are in conformity with description has an effect on store sales. Because in this analysis,other attributes of the store did not appear in the analysis, followed by the QUEST tree classification model, but only other attributes appeared in the importance analysis, and these attributes have very small impact on the store sales. so in the decision tree and rule set still did not appear in addition to shop credit, logistics and merchandise and description of the degree of matching other attributes, the analysis of the results further emphasized the C5.0 tree classification model . Finally, by using the data mining method, the association rule set is obtained by APRIORI correlation analysis under the condition that the minimum conditional support is set to 10.0%, the minimum rule confidence is set to 80.0%, and the maximum of the former is set to 5, and the analysis The final result of the analysis results in a small part of the deviation, through the classification of the data summary, the shop credit rating impact on sales results, and finally for some of the conclusions put forward their own guess, through statistical methods to verify.

Key words: store attribute analysis; data mining; decision tree; APRIORI correlation analysis

1 引言

1.1研究背景

电子商务(electronic commerce)是以信息网络技术为手段、以商品交易为主体的网络商务活动,在互联网开放的环境下,买卖双方进行各式各样的商业活动,从而实现消费者的网上购物,商户之间的网络在线交易以及在线支付和各种经济活动。C2C作为电子商务中的一种模式之一,为用户与用户之间提供了一个在线交易平台,是的买卖双方可以自主在平台进行交易,卖方能主动提供商品到网上进行贩卖,相对的买家就可以自主选择需要的商品进行购买。C2C在国内飞速成长,从1999年国内首个C2C平台易趣网上线以来,已有多个C2C平台先后上线【26】。截止至2013年,在C2C平台上活跃的店铺数量约为105万个,其中作为中国电子商务的“龙头老大”,淘宝店铺所占比例约为81%。

淘宝网是由阿里巴巴集团在2003年5月创立的C2C交易平台,是目前中国最受欢迎的网购零售平台。从淘宝网上线开始,没过多久就推出了第三方支付工具支付宝,以担保交易模式使得消费者开始信任淘宝网上的交易。第二年即推出了阿里旺旺,将即时聊天与网络购物平台相结合【22】。在2006年,淘宝网成为了亚洲最大的购物网站,它逐渐变成构成人们生活的基本要素,据调查数据显示,每天约有900万人上淘宝购物。也正是在这一年,淘宝网全年成交额突破400亿,成为中国第二大的综合卖场。截止至2014年底,淘宝网拥有注册会员近5亿,日活跃用户远超1.2亿,在线商品数量达10亿,在C2C市场,淘宝网占95.1%的市场份额。随着淘宝网规模的扩大和用户数量的增加,淘宝也从单一的C2C网络集市变成了包括C2C、分销、拍卖、直供、众筹、定制等等多种电子商务模式在内的综合性零售商圈【28】。就好比南京路作为上海最有名的商业街,由许多百货商店、餐厅、杂货店、娱乐设施等构成,每日的客流量以及消费量都不是单单的百货店就能达成的,这也足以说明为何淘宝网能达到如此之多的交易数目,想必国内除了淘宝网也没有其他电子商务平台能给达到这个数目了。

随着生活节奏的加快,人们习惯于在电子商务平台购物,据调查显示,绝大多数人比起前往实体店铺购物更倾向于在淘宝网等电子商务平台购物。淘宝网上有着数以万计的店铺,其中贩卖同类商品的店铺更是数不胜数。对于消费者而言,当然是希望买到物美价廉,物超所值的商品。他们往往会对比多家店铺的销量从而购买销量最高的店铺的商品。因此对于淘宝卖家而言,吸引消费者来提升店铺销量从而形成销量持续增长的良性循环,最终达到收益更多的目的是最为关键的。如何在诸多竞争对手中,通过提高店铺指标来提高销量是卖家所要面对的,同理消费者也要选择出销量、信誉以及服务都有保障的店铺。

1.2研究意义

淘宝网作为虚拟网络购物平台在人们的生活中变得日益重要,比起前往各大卖场选购商品,大多数消费者倾向于在便捷的网络购物平台上进行购物,以淘宝网为例,存在着许许多多的店铺,消费者会在众多店铺中选择某家店铺进行购物,对于店铺卖家而言,如何吸引消费者从而提升自家店铺销量为重中之重。消费者在各家店铺之间会进行比较,通过比较店铺的各项数值来决定去哪家店铺购物,众多店铺卖家纷纷采取各种举措来吸引顾客来到自家店铺购物。。现在网络用户基数如此之大,店铺存在着很多隐性顾客,若能吸引到更多的顾客前来购物,店铺销量也会随之上升。因此,对店铺属性的研究就变得至关重要,通过研究店铺何种属性对店铺销量存在着影响,可以为店铺卖家改从何下手来提升店铺销量提供启示。在数据挖掘技术逐渐完善的今天,对淘宝店铺属性的深入挖掘分析,有助于店铺卖家在众多店铺中脱颖而出,取得商业先机。

本文通过C5.0决策树对店铺的各项属性进行分析,从而得出影响店铺销量的具体因素,接着通过QUEST算法进一步论证先前得出的结论,最后通过APRIORI算法得出结论,为店铺卖家如何提升店铺销量提供建议和参考。

1.3研究方法

本文先通过C5.0树分类模型分析店铺各项属性对店铺销量的影响,再通过QUEST树分类模型对上述店铺属性进行进一步分析,加强结论的可信度。最后通过APRIORI关联分析来判断店铺属性与销量间存在的关系,对于结论中存在的疑问进行大胆假设,然后采用统计的方法进行验证。

1.4研究框架

本文一共四章,第一章为引言部分,主要介绍本文的研究背景、研究意义以及研究方法。第二章为文献综述,主要介绍了国内外的研究现状,并对其进行评述。第三章为数据分析部分,介绍了数据的来源和其定义,并用C5.0树分类模型、QUEST树分类模型、APRIORI算法对数据进行分析,从而得出影响店铺销量的因素。第四章为结论与展望,总结本文的工作以及结论,提出本文的不足。

剩余内容已隐藏,请支付后下载全文,论文总字数:18877字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;