6906172 发表于 2018-8-20 17:32:11

2018聚类算法在电子商务客户细分中的应用

   [摘要] 国内外电子商务类网站日益兴起。许多电子商务类网站都提供了一定程度的个性化服务,最明显的就是提供商品推荐服务。而构成这些个性化服务的基础主要就是数据挖掘技术。本文研究了数据挖掘技术及其在电子商务中客户细分的应用,提出了数据挖掘在电子商务营销服务各方面的具体应用内容。
  [关键词] 数据挖掘 客户细分 聚类算法
  
  一、数据挖掘在电子商务中的引入与应用
  数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery In Database,KDD),是指从大型数据库或数据仓库中提取隐含的、未知的、非平凡的及有潜在应用价值的信息或模式,它是数据库研究中的一个很有应用价值的新领域。数据挖掘技术在电子商务领域中得到了比较普遍的应用,它是以市场营销学的市场细分原理为基础,其基本假定是“消费者过去的行为是其今后消费倾向的最好说明”。对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。
  数据挖掘是进行数据查询,它能够找出过去数据之间的潜在联系,从而促进信息的传递。数据挖掘工具能够对将来的趋势和行为进行预测,从而很好地支持人们的决策。将其运用到客户关系管理中,就能在数据量庞大的客户数据库中,将看似无关联的数据进行筛选,净化,提取出有价值的客户关系,对客户需求作出恰当的回应,并预测需求趋势。
  二、聚类算法用于电子商务客户细分
  聚类是数据挖掘中的一种主要技术,是把一组个体按照相似性归成若干类别,即“物以类聚”。它的目的是使得属于同一类别的个体之间的距离尽可能地小,而不同类别上的个体间的距离尽可能地大。聚类和分类根本不同的是:分类问题中我们知道训练例的分类属性,而在聚类中,就需要我们在训练例中找到这个分类属性值。聚类分析问题可描述为:给m维空间Rm中的n个向量,把每个向量归属到S聚类中的某一个,使得每个向量与其聚类中心的“距离”最小。聚类分析问题的实质是一个全局最优问题。在这里m可认为是样本参与聚类的属性个数,n是样本的个数,S是由用户预先设定的分类数目。本文采用层次方法实现聚类分析。
; 层次方法就是对给定的数据对象集进行层次的分解。根据层次的分解如何形成,层次聚类分析算法分为“分解算法”和“凝聚算法”,分别体现了“自顶向下”和“自底向上”两种互逆的思想。分解算法从整个样本集开始,把它分成几个子集,然后把每个子集分成更小的集合,逐步分区,最终,分区算法生成一个由粗到细的分区系列。凝聚算法首先把每个单独的对象当作一个初始类。然后把这些特征相近的合并成一个更粗略的分区,反复合并直至得到最后一个分区,所有的对象都在一个大类内。这种聚类过程是一个自底向上的过程,分区是从细到粗。在凝聚或者分裂层次聚类方法中,通常以用户定义希望得到的类的数目作为结束条件。在类的合并或分裂过程中,需要考察类间的距离。分解算法和凝聚算法的过程示意如图所示:
页: [1]
查看完整版本: 2018聚类算法在电子商务客户细分中的应用