2018计算机Web数据挖掘技术在现代商业中的应用
[摘要] 数据挖掘是近年来随着数据库技术和人工智能技术的发展而出现的一种全新的信息技术。随着Internet的普及,使Web成为获取市场信息的最重要的载体。本文介绍了Web数据挖掘过程,以及特点,最后重点研究了Web数据挖掘技术现代商业中的应用。[关键词] 数据挖掘 人工智能 载体
一、Web数据挖掘概述
Web挖掘是从Web资源上抽取信息或知识的过程,它是将传统的数据挖掘的思想和方法应用于Web,从Web文档和Web活动中抽取感兴趣的、潜在的、有用的模式和隐藏信息。Web挖掘可在多方面发挥作用,如搜索引擎结构的挖掘,搜索引擎的开发,改进和提高搜索引擎的质量和效率,确定权威页面。Web挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术、统计学、人工智能中的机器学习和神经网络等。特别是电子商务领域,通过对用户特征的理解和分析,如对用户访问行为、频度、内容等的分析,提取出用户的特征,从而为用户定制个性化的界面,有助于开展有针对性的电子商务活动。
二、Web挖掘流程以及特点
1.Web挖掘的流程
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。与传统数据和数据仓库相比,Web上的信息是非结构化或半结构化的、动态的、并且是容易造成混淆的,所以很难直接以Web网页上的数据进行数据挖掘,而必须经过必要的数据处理。Web挖掘的有以下几个过程:
(1)资源发现。任务是从目标Web文档中得到数据,值得注意的是有时信息资源不仅限于在线Web文档,还包括电子邮件、电子文档、新闻组,或者网站的日志数据甚至是通过Web形成的交易数据库中的数据。
(2)信息选择和预处理。任务是从取得的Web资源中剔除无用信息和将信息进行必要的整理。例如从Web文档中自动去除广告连接、去除多余格式标记、自动识别段落或者字段并将数据组织成规整的逻辑形式甚至是关系表。
(3)模式发现。自动进行模式发现。可以在同一个站点内部或在多个站点之间进行。
(4)模式分析。验证、解释上一步骤产生的模式。可以是机器自动完成,也可以是与分析人员进行交互来完成。
2.Web挖掘的特点
Web挖掘技术具有许多优点,如不需要用户提供主观的评价信息;可以处理大规模的数据量;用户访问模式动态获取,不会过时;使用方便等。但是与传统数据库和数据仓库相比,Web是一个巨大、分布广泛、全球性的信息服务中心,涉及经济、文化、教育、新闻、广告、消费、娱乐、金融、保险、销售、电子商务等信息,内容极其丰富,数据最大特点就是半结构化;而传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据。显然,面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多,会面临很多具体问题,主要有:
(1)半结构化数据。Web页面以某种格式呈现的半结构化数据,其数据结构不规则或不完整,复杂程度远远高于普通的文本文档,其数据结构隐含、模式信息量大、模式变化快。大量的文档无任何排列次序,无分类索引。
(2)Web是一个异质、分布、动态的信息源。Web及其数据的更新、增长速度极快,也无固定的模式。Web上的信息几乎都是隐藏的、潜在的、未知的,从Web上发现这些未知的信息和有用的模式,仅用传统的基于关键字的检索方式很难实现,现在的搜索引擎尚不具备这些功能。
(3)面对一个非常广泛的形形色色的用户群体。不同的用户访问Web的兴趣、爱好和使用目的千差万别,面对一个非常广泛的形形色色的用户群体,能否使用户根据自己的爱好兴趣定制网页,甚至能否根据发现的用户。自动为用户定制网页,从而提供个性化的信息检索和查询服务。
3.Web挖掘在电子商务中的应用
目前对于,Web挖掘的对象和使用的方法层出不穷,但随着电子商务网站的兴起,电子商务将是未来Web挖掘的主要发展方向之一,因此它在各种商业领域都存在广泛的使用价值。在当电子商务在企业中得到应用时,企业信息系统将产生大量数据,这些海量数据使数据挖掘有了丰富的数据基础,同时高性能计算机和高传输速率网络的使用也给数据挖掘技术提供了坚实的保障。介绍以下几个方面的应用:
(1)分析查找获得潜在客户。随着以客户为中心的经营理念不断深入人心,分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。通过对电子商务系统收集的交易数据进行分析,可以按各种客户指标(如自然属性、收入贡献交易额、价值度等)对客户分类,然后确定不同类型客户的行为模式,以便采取相应的营销措施,促使企业利润的最大化。
页:
[1]