2018电子商务中数据挖掘方法浅谈
[论文关键词] 商务 Web数据挖掘 Web日志[论文摘要] 在电子商务中,数据挖掘有助于发现业务发展的趋势,帮助企业做出正确的决策。本文对目前电子商务中的Web数据挖掘方法进行了,并对电子商务中的Web数据对象进行了分类,对网络数据挖掘的作用进行了分析,为今后电子商务中实用Web数据挖掘软件的开发与应用提供了参考。
一、电子商务和数据挖掘简介
电子商务是指个人或企业通过Internet网络,采用数字化电子方式进行商务数据交换和开展商务业务活动。目前国内已有网上商情广告、电子票据交换、网上订购,网上、网上支付结算等多种类型的电子商务形式。电子商务正以其低廉、方便、快捷、安全、可靠、不受时间和空间的限制等突出优点而逐步在全球流行。
数据挖掘(Data Mining)是伴随着数据仓库技术的发展而逐步完善起来的。数据挖掘主要是为了帮助商业用户处理大量存在的数据,发现其后隐含的规律性,同时将其模型化,来完成辅助决策的作用。它要求从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取人们事先不知道的但又是潜在有用的信息和知识。数据挖掘的过程有时也叫知识发现的过程。
而电子商务中的数据挖掘即Web挖掘,是利用数据挖掘技术从www的资源(即Web文档)和行为(即We服务)中自动发现并提取感兴趣的、有用的模式和隐含的信息,它是一项综合技术涉及到Internet技术学、人工智能、、信息学、学等多个领域。
二、Web数据挖掘对象的分类
Web数据有3种类型:HTML标记的Web文档数据,Web文档内连接的结构数据和用户访问数据。按照对应的数据类型,Web挖掘可以分为3类:
1.Web内容挖掘:就是从Web文档或其描述中筛选知识的过程。
2.Web结构挖掘:就是从Web的组织结构和链接关系中推导知识。它的目的是通过聚类和分析网页的链接,发现网页的结构和有用的模式,找出权威网页。
3.Web使用记录挖掘:就是指通过挖掘存储在Web上的访问日志,来发现用户访问Web页面的模式及潜在客户等信息的过程。
三、电子商务中数据挖掘的方法
针对电子商务中不同的挖掘目标可以采用不同的数据挖掘方法,数据挖掘的方法有很多,主要包括下面3大类:统计分析或数据分析,知识发现,基于预测模型的挖掘方法等。
1.统计分析。统计分析主要用于检查数据中的规律,然后利用统计模型和数学模型来解释这些规律。通常使用的方法有线性分析和非线性分析、连续回归分析和回归分析、单变量和多变量分析,以及时间序列分析等。统计分析方法有助于查找大量数据间的关系,例如,识别时间序列数据中的模式、异常数据等,帮助选择适用于数据的恰当的统计模型,包括多维表、剖分、排序,同时应生成恰当的图表提供给分析人员,统计功能是通过相应的统计工具来完成回归分析、多变量分析等,数据用于查找详细数据,浏览子集,删除冗余等。
2.知识发现。知识发现源于人工智能和机器学习,它利用一种数据搜寻过程,去数据中抽取信息,这些信息表示了数据元素的关系和模式,能够从中发现商业规则和商业事实。利用数据可视化工具和浏览工具有助于开发分析以前挖掘的数据,以进一步增强数据发掘能力。其他数据挖掘方法,如可视化系统可给出带有多变量的图形化分析数据,帮助商业分析人员进行知识发现。
3.预测模型的挖掘方法。预测模型的挖掘方法是将机器学习和人工智能应用于数据挖掘系统。预测模型基于这样一个假设:消费者的消费行为具有一定的重复性和规律性,这使得商家可以通过分析收集存储在数据库中的交易信息,预测消费者的消费行为。按消费者所具有的特定的消费行为将其分类,商家就能将销售工作集中于一部分消费者,即实现针对性销售。
页:
[1]