SCI论文(www.lunwensci.com):
摘要:此次研究主要应用问卷调查法以及统计分析法等科研方式,使用八爪鱼数据采集工具获取相关语料集,之后使用Jieba分词工具进行文本分词处理,最终借助TF-IDF算法对各个评论进行权重分析,最终得出最具代表性的评论内容,以此探索在校大学生进行电商营销存在的难点及解决方案,希望能为大学生校园电商营销的创新创业提供一些借鉴。
关键词:“互联网+”;农产品;电子商务;天猫商城
Analysis of E-commerce Agricultural Products Review Based on Big Data Algorithm
XU Tongde,ZHAO Yang,TAO Haibo
(Gansu Police Vocational College,Lanzhou Gansu 730299)
【Abstract】:This study mainly applies scientific research methods such as questionnaire survey and statistical analysis,uses Octopus data collection tool to obtain relevant corpus,then uses Jieba word segmentation tool to process text word segmentation,and finally analyzes the weight of each comment with the help of TF-IDF algorithm,so as to finally get the most representative comment content,in order to explore the difficulties and solutions of College Students e-commerce marketing,we hope to provide some reference for the innovation and Entrepreneurship of College Students campus e-commerce marketing.
【Key words】:Internet plus;agricultural products;e-commerce;tmall mall
0引言
随着信息网络的高速发展,人类消费方式与消费理念也在因此而不断进行着变革,“互联网+”随即深入各个行业。互联网高速发展,当农产品以互联网为平台进行销售时,更多以零食的方式进行销售。目前大学生群体进入了借助互联网模式的创业热潮,越来越多的大学生选择回到家乡结合电商平台进行创业发展[1-2]。在因此本次研究主要以大学生为例,应用问卷调查的方式面向大学生获取相关农产品零食电商数据以及使用八爪鱼数据采集器获取天猫商城零食评论数据,对其高频词语进行提取,对所评论的数据应用TF-IDF等方法分析下农产品零食的发展现状,以提出一些有针对性的对策,以促进大学生电商营销的进行。
1研究方法
先通过调研问卷的方法,面向学校学生以及通过八爪鱼等数据收集工具获得的相关语料集,之后通过jieba分词工具进行文本分词,通过停用词表进行去停操作,之后再通过词频统计以及结合TF-IDF等方法提取关键字,TF-IDF算法主要是一种资讯检索与资讯探勘的常用加权技术,应用这种技术可以更好的对其权重进行计算,在此背景下之后再对评论中关键字进行权重统计,并将关键词中权重较大者按照所标注的词性进行分析,形成以品牌、口味、满意度等为属性的多维分析表,从而实现文本评论分析。具体实现方法如图1所示。
2文本获取及处理
2.1数据来源
本文使用问卷调查方式面向大学生获取相关农产品零食电商数据以及使用八爪鱼数据采集器获取天猫商城零食评论数据,实现对文本数据的采集。在评论的信息中通常存在挖掘的价值。通过对文字信息进行分析,商家可以了解用户的喜好,改进产品的信息,从而能够在市场竞争中获得主动权。因此研究主要选择了大学生群体进行数据分析。本次所调查的受访者基础信息如表1所示。
如表1所示,本次调查的人群主要集中在大学生群体,其年龄主要集中在20~25岁,对于天猫商城的使用年限主要集中在1~3年,使用年限相对较长,因此选择该群体具有一定的代表性。
2.2数据处理
对经过筛选后的文字数据进行了数据清洗,主要包括去除重复和无意义的文本评论,随后需要完成评论集中的文本分词。本文选用对中文分词效果较好的jieba分词器对评论文章进行分词。分完词之后整篇文档就成了词语集合,对于与文本内容相关度较低的词语,通过“百度停用词表”对评论文本中的停用词进行过滤。
2.3文本统计及分析
2.3.1词频统计及标注
经过以上计算,本文选择词频大于46的词语进行词性标注,并对分词后词语加以词性说明。分别标记为名词(n)、动词(v)、形容词(adj)、名称词(ns)。在此基础上使用TF-IDF算法对检索出来文本的关键词进行权重计算。使用TF-IDF所计算出的词语权重的大小代表该词语的重要性,权重值越大表示该词语所表示的含义在商量评论数据集中的重要程度越高。
对问卷的内容进一步分析,假设数据中所有的评论用C表示,某一评论用d表示,利用TF-IDF算法对去权重i的计算公式。公式如下:
其中fij指词语i在文档dj中出现的频率,Ni表示文档中出现词语i的文档数,β为一个经验值,一般取0.01、0.1。通过对词语系统聚类,求出不同维度的权重和,通过对不同维度的权重和进行做图筛选,之后选出的权重大于0.05进行聚类,然后将权重值较大的关键词语进行分析,最后进行营销策略分析。
对抓取的数据进行筛选、清理,最后得到14个高频评论如表2所示。
结果显示,消费者提到的最多的词是“吃”,其次是“便宜”和“实惠”,这符合农产品零食的经营特性。农产品零食主要做到便宜实惠,赢得了消费者的青睐;其次的高频词分别为“好”和“口感”,说明农产品零食在做到价格优惠外的另一特点就是口感符合消费者的需求,从而满足消费者的要求。
2.3.2文本中心词分析
首先对评论数据集进行初步处理,在此基础上应用TF-IDF算法提取出关键词,并对所提取的关键词所占的权重及逆行分析,同时将这些词语依次归类到商品以及质量、口感、物流、满意度、其他价值这五个层次上。
评论中关键词所占的权重主要反应了词语的重要程度,权重值越高,说明其重要程度越高,反之越低,通过对词汇聚类,求出不同层次的权重和,然后根据不同层次的权重和作展示图。如图2所示。
产品的品质主要表现为农产品的新鲜度、口感等内容,此外还包括了农产品的包装等内容。从品质所占权重比来看,随着社会的发展,人们对农产品的品质重视程度愈发增加。
在评价方面,“喜欢”“满意”等主观态度的评价所占权重比较高,其次是“回购”“开心”等,表示在该商品消费中的较大比重来自于老消费者回购,还说明部分顾客对于产品的购买望主要来自于内心最原始的需求。
物流配送方面,消费者对发货速度和物流方式的选择需求较高,因此发货速度快更能够获得客户的满意。
3对策与建议
3.1强化农产品标准化体系,做好品质保障
品质保障是农产品销售的最基础的要求,因此满足消费者需求,强化品质标准,提高质量要求是电商农产品发展的大势所趋。在此背景下,商家需要严格做好选择农产品的企业,提高农产品检验体系,从根本上保障良好的产品品质;其次还要做好品质检验的保障,严格把关检验的每一个步骤,从根本上保障产品的品质[3]。
3.2做好加工与冷链,做好口感保障
农产品的口感保障主要在于冷链运输与产品加工。因此农户在运输流程中要围绕农业上行性政府推动科学制订适合市场预期的配套技术规范、政府规章、政策,建立适合农业网货规范的农业生产与商品流通制度[4]。
3.3推动第三方物流发展,做好物流保障
从长期眼光来分析,第三方物流与配送系统的差异化、多样性,不单纯可以提高农产品的附加值与价格,实现经济效益的规模化,减少物流成本,还可以使经营者与生产者的必要成本下降,从而增加其利益。
3.4做好服务细节,做好满意度保障
公司在经营实施过程中,也可以通过建立公司网络的自动客户服务管理系统,根据顾客的要求,自主、适时地利用互联网进行优质服务,在消费者心目中形成良好的印象,从而鼓励消费者持续购物,和消费者建立起一种长久依存的关系。
4结论
基于大数据的发展背景,借助TF-IDF算法对大学生农产品电商评论内容进行权重分析,选择权重值比较大的词语进一步计算与分析,从而判断农产品电商发展的相关影响因素,在此基础上提出有针对性的建议,以促进大学生农产品电商的发展。
参考文献
[1]梁甜甜.“互联网+”背景下安徽省农产品电商发展研究[J].农村经济与科技,2021,32(13):153-155.
[2]安冯竞.“互联网+”经济背景下农产品电商发展趋势分析[J].商展经济,2021(7):38-40.
[3]吴斯科,李小芳.互联网背景下农产品电商物流发展策略研究[J].中小企业管理与科技(下旬刊),2021(1):108-109.
[4]陈小芳.论互联网+背景下农产品电商供应链构建策略[J].邢台学院学报,2020,35(1):109-112.
关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.lunwensci.com/jisuanjilunwen/36357.html