2018数据挖掘技术在电子商务中的应用研究
[摘要] 电子商务在现代商务活动中的正变得日趋重要,而商务数据的处理则凸显出数据挖掘的重要。本文讨论了数据挖掘的主要方法,具体阐述了数据挖掘技术在电子商务中的作用及应用。[关键词] 数据挖掘 电子商务 数据库
一、概述
数据挖掘(Data Mining)起源于数据库中的知识发现(Knowledge Discover in Database,KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡且最终可理解的及有潜在应用价值的信息或模式。数据挖掘技术是计算机技术发展的热点之一。通过对历史积累的大量数据的有效挖掘,可以发现隐藏的规律或模式,为决策提供支持,而这些规律或模式是不能够依靠简单的数据查询得到,或者是不能在可接受的时间内得到。这些规律或模式可以进一步在专业人员的识别下成为知识,并可以应用到以客户为中心的企业决策分析和管理的各个不同领域和阶段。
电子商务(E-Commerce)是以指利用电子数据交换(Electronic Data Interchange,EDI)、电子邮件(E-mail)、电子资金转账(Electronic Funds Transfer,EFT)和Internet等主要技术在个人、企业和国家之间进行无纸化的信息交换,包括商品信息及其订购信息、资金信息及其支付信息、安全及其认证信息等,即以现代信息技术为手段,以经济效益为中心的现代化商业运转模式。其最终目标是实现商务活动的网络化、自动化与智能化。
随着Internet的迅速发展,电子商务的应用不断深入。在电子商务应用系统中,相关的用户数据日益增多,数据挖掘技术具有从大量复杂数据中发现特定规律的能力。商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入了解客户需求信息和购物行为特征的可能性。
二、数据挖掘的主要方法
数据挖掘融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。比较典型的数据挖掘方法有分类、关联规则分析、聚类分析和孤立点分析等。
1.分类。分类是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,一般用规则或决策树模式表示。实际上就是通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其他数据库中的记录进行分类。
2.关联规则分析。关联规则分析用于发现关联规则。若两个或多个数据项的取值重复出现且概率很高时,它就存在着某种关联,可以建立起这些数据项的关联规则,一般用“支持度”和“置信度”两个闽值来淘汰那些无用的关联规则。关联规则分析能发现数据库中诸如“90%的顾客在一次购买活动中购买商品A的同时购买商品B”之类的特征。
3.聚类分析。聚类分析的对象是一组未分类记录,并且这些记录应分成几类事先也不知道。聚类就是通过分析数据库中的记录数据,根据一定的分类规则,合理地划分记录集合,确定每个记录所在类别。它所采用的分类规则是由聚类分析工具决定的。采用不同的聚类方法,对于相同的记录集合可能有不同的划分结果。
4.孤立点分析。数据库中的数据常有一些异常记录,这些记录称为孤立点,常常包括很多潜在的知识,如分类中的反常实例、不满足规则的特例、观测结果与模型预测值的偏差、量值随时间的变化等。孤立点分析基本方法是寻找观测结果与参照之间的差别。
页:
[1]