2018面向电子商务的智能搜索引擎技术的研究
[摘要] 随着Internet的快速发展,商务信息爆炸式的增长以及网络环境的日益复杂,搜索引擎作为信息检索的重要工具在网络经济中的作用变得越来越重要,文章试从搜索引擎在电子商务中的应用角度介绍、分析和研究智能搜索引擎的相关问题,从搜索引擎存在的问题及解决策略几个方面探讨面向电子商务的智能搜索引擎技术的发展问题。[关键词] 搜索引擎 电子商务 智能搜索 人工智能
一、搜索引擎的现状
当前搜索引擎数据库检索和应用性差,不利于用户使用;排序技术指标单一,查找到的信息有效性低;信息分类类目和标准不统一,导致界而友好性低;自身搜索技术不成熟,误检率高,不利于电子商务使用。
搜索引擎主要由搜索器、索引器、检索器和用户接口四部分组成。搜索器一般采用一种被称为Spider的网络自动跟踪索引程序。索引器的功能是理解搜索器所索引的信息,从中抽取索引项、建立起自己的物理索引数据库。检索器的功能是根据用户的查询在索引库中快速检索出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输人用户查询,显示查询结果,提供用户相关性反馈机制。
目前搜索引擎根据构建时的不同策略,大致可以分为三种模式:一、建立在分类基础上的搜索引擎,优点是准确率比较高,不足是查全率不是很好。二、建立在索引文档基础上的搜索引擎,优点是搜索网络信息效率高,查全率好于第一种,但查准率不及第一种;三、建立在概念的基础上,突破了传统搜索引擎中相对比较简单的基于关键词的匹配,它借助数据字典扩展条件,通过模式的提取和识别抽象化搜索条件与文档之间的联系,这种搜索引擎的查准率较差,而查全率是三者中最高的。
利用人工智能先进技术重新设计搜索引擎,使搜索引擎更具智能化,使检索结果更能反映用户的需求,这类搜索引擎称为智能搜索引擎。把信息检索从目前基于关键词层面提高到基于知识层面,是解决问题的根本和关键。
二、智能检索技术的分析研究
1.网络Robot的智能技术分析研究
网络Robot是一种软件,它完成任务必须具备一定的智能,可以概括为以下几个方面:
(1)提取网页中的有效链接
智能Robot从分析一组指定的URL开始,按照电子商务的电子词典对文档的相关性进行判断提取超链,滤去不适宜的文档,降低索引的混乱程度,满足条件的超链按照标题或单词建立索引并产生本地数据库,使搜索结果更加纯净。
(2)识别访问过的链接,剔除广告等无意义的链接
智能Robot排除掉那些在目标URL中已被访问过的URL;由于WWW的巨大规模,为避免Robot搜索得太深,从而回不到原处的情况发生,必须对搜索的深度进行限制;剔除图像、音频、视频等无法进行索引的文档。
页:
[1]