2018分布式网络信息资源重构模式及系统实现
【内容提要】分布式网络信息资源重构模式是为实现由分布式人机交互环境组成的网络信息资源收集、组织和发布机制而提出的一种知识治理方式。该模式通过实现一个网络资源治理系统,向具有学术背景的内容治理员提供资源收集工具、资源监测和评估以及知识挖掘等功能,使人的知识和聪明在被用来使纷繁复杂的网络信息资源有序化的同时,又成为其中不可或缺的组成部分。该系统在清华大学图书馆网络资源治理方面已经得到了应用。网络信息资源在数目和复杂程度上的同步增长使机械遍历式的信息搜集和检索技术越来越难以满足大部分用户的信息需求。这些信息的终极用户需要对信息个体的正确定位,对信息源的权威导航和评估,个性化的主动信息提供服务以及基于信息内容的跨平台链接,而且实现这一切是以一个繁复、无序和庞大的信息世界为基础和条件的。任何纯粹基于人工智能的软件或算法都难以提供一个完美的解决,本文试图提出一个由分布式人机交互环境组成的网络信息资源收集、组织和发布机制,通过这个机制,人的知识和聪明在被用来使纷繁复杂的网络信息资源有序化的同时,又成为其中不可或缺的组成部分。
一、网络信息资源重构的概念和方法
网络信息资源是由信息组织或个人建立的以网络为传播媒体的数字信息天生、治理和发布系统,是微观有序化和宏观无序化的有机同一体。每一个网络信息资源个体都是有序的,其所含信息内容是有组织和可访问的;而作为一个整体,网络信息资源又具有高度的系统复杂性,难以从整体上加以充分的利用。这就是要对网络信息资源进行重新组织的主要原因。
所谓网络信息资源的重构就是针对网络信息源及其内容,按照特定的线索化方式,由人工或计算机软件实施的信息收集、组织、整理和传播工作的总和。经过重构后,网络信息资源整体(或某个局部)上成为有序化结构,并且为访问者提供获得其所需信息的充分检索手段,同时,在一定程度上,不同信息源之间的物理界限在逻辑上被屏蔽。
假如说网络信息资源宏观的无序化是实施其重构的主要原因的话,网络信息资源微观的有序化则是实施其重构的必要条件。换句话说,网络信息资源个体有序化程度和水平,尽管不能直接导致网络信息资源整体的有序化,但却可以影响通过重构以实现其有序化的方式和难易。例如,一个信息源假如在信息描述、数据库定义和访问方式等方面遵守一定的国际标准,它就更轻易成为一个网络信息资源集合的有机组成部分。
一个网络信息资源集合是由若干信息源组成(如数据库),而一个信息源又是由若干同序的信息实体组成(如数据库记录)。因此,对于网络信息资源的重构可以分为两个层次:针对信息源的重构和针对信息实体的重构。针对信息源的重构将导致一种导引性的信息组织及相应的服务方式,其功能是满足用户对于获知信息存放位置或信息来源的需求。针对信息实体的重构将导致一种实体性的组织方式和推送式的服务方式,其功能是直接满足用户对获得信息本身的需求。前者的实例包括一些网络资源导航、资源链接目录和信息源数据库等。而后者则正是我们正在或将要实现的。在本系统中,逻辑上信息源和信息实体被同一视为某个信息对象来加以描述、整序和治理。
利用人工和计算机是实现网络信息资源重构的主要手段,尤其是后者,由于其高效率和全面的信息覆盖能力而在近几年逐渐成为主流。大型的信息导航网站(如Yahoo等)和检索引擎(如Google等)都是利用软件自动搜索网上的信息资源并加以组织和整理,然后供用户检索和使用的。人工的手段由于本钱、规模和效率的限制***处于辅助性地位,只能应用在一些局部性的系统中。然而,由于人工智能技术的局限,计算机软件在对信息形式和内容(尤其是内容)进行辨别、理解、描述和分析时所能达到的质量还远远不能和人的智力相提并论,特别是计算机软件无法对信息内容的学术质量加以权威性的鉴定和评估(显然,只有人,而且是具有一定学术背景的人才能完成这个工作)。
页:
[1]