答案家

 找回密码
 立即注册
查看: 340|回复: 0

2018Web挖掘在电子商务中的应用研究

[复制链接]

1

主题

1

帖子

41

积分

幼儿园

Rank: 1

积分
41
发表于 2018-8-20 14:10:33 | 显示全部楼层 |阅读模式
   [摘 要] 当今电子商务蓬勃发展,其网站服务器上积累了大量的数据,这些数据隐含着很多对市场分析及预测有用的知识,可以运用web挖掘技术加以获得,从而增强企业的竞争力。本文主要介绍了Web挖掘的概念和分类,论述了电子商务中Web挖掘的过程和方法,最后阐述了Web挖掘技术在电子商务中的应用。
  [关键词] 电子商务 数据挖掘 Web挖掘
  
  电子商务采用数字化方式进行商业活动,是在电子网络环境中进行商品和服务的贸易活动。近年来,随着网络的普及和Internet的发展,各企业均积累了大量的数据。如何从这些数据中发现潜在的规律,来帮助制定企业今后的发展战略,是各电子商务平台急待解决的问题。Web挖掘作为数据挖掘的一个重要分支,为上述问题提供了有效的解决途径。
  一、web挖掘
  数据挖掘就是从大量的、不完全的、有噪声的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的知识的过程。它融合了数据库、人工智能、机器学习等多个领域的理论和技术。Web 挖掘是数据挖掘在web上的应用,是指从与web相关的资源和行为中抽取感兴趣的、有用的模式和隐含知识。一般地,Web挖掘可分为三类:
  1.Web内容挖掘,是从文档内容或其描述中抽取知识的过程。它又可以分为Web 页面内容挖掘和搜索结果挖掘。页面内容挖掘指的就是对Web 页面上的数据进行挖掘, 而搜索结果挖掘则指的是以某一搜索引擎为基础,对已搜索结果进行挖掘。
  2.Web结构挖掘,是从www的组织结构和链接关系中推导知识。它又可以分为外部结构挖掘、内部结构挖掘和URL挖掘。Web结构挖掘的目的是通过聚类和分析网页的链接, 发现网页的结构和有用的模式, 找出权威页面。
  3.Web使用挖掘,即Web日志挖掘,是通过挖掘Web日志记录,发现用户访问Web页面的模式。它又可分为一般访问模式挖掘和个性化服务模式挖掘。
  二、Web挖掘的过程
  1.数据收集。Web挖掘的数据对象包括服务器日志数据、代理服务器数据、web页面内容、web超链接信息、用户注册信息等,其中服务器日志数据是web挖掘的主要对象。
  2.数据预处理。数据预处理是web挖掘的重要步骤,直接影响到最后挖掘结果的正确性和准确性。它通常包括以下几个方面:
  (1)数据清洗,是指根据需要删除与web挖掘任务无关的数据,过滤掉不需要的记录。(2)反蜘蛛化。现在互联网上有大量的蜘蛛程序,它们模拟用户在各网页间爬来爬去。但它们并不代表真实的电子商务用户,因此需要把服务器日志中的蜘蛛记录过滤掉,以更真实地反映实际情况。(3)客户认证,是从服务器日志中识别出访问网站的每个用户。(4)会话识别。会话是指客户在一次访问中所访问的所有web页面,通过分析可以得到,用户对电子商务站点的兴趣所在。(5)路径补全。由于客户端缓存的存在,会造成一些重要的访问信息被遗漏,所以需要对用户访问的前后页面进行推理,补全访问路径。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

CopyRight(c)2016 www.daanjia.com All Rights Reserved. 本站部份资源由网友发布上传提供,如果侵犯了您的版权,请来信告知,我们将在5个工作日内处理。
快速回复 返回顶部 返回列表