当前位置: 迅达文档网 > 党团工作 >

基于多智能Agent计算机科学信息检索个性化服务的探讨

| 来源:网友投稿

(齐齐哈尔大学 图书馆,黑龙江 齐齐哈尔 161006)
摘 要: 文章论述了智能Agent搜索理论的提出背景,阐述了智能Agent的搜索理论及多种智能 Agent的功能和工作原理,并在此基础上构建了一个基于多种智能Agent个性计算机科学信息 检索系统,得出该系统是当今图书馆智能化的主动服务模式。
关键词:智能Agent;智能化;主动服务;信息检索
中图分类号:G252.7  文献标识码:A  文章编 号:1007—6921(2009)04—0093—02
1 问题的提出 

近年来,随着振兴东北老工业基地战略的实施,齐齐哈尔大学加快计算机科学专业的建设与 发展, 检索大量的有关计算机科学专业的信息资源成为学科馆员的必须工作,但网上计算机科学  信息资源浩如烟海,专业数据库不计其数。通过计算机科学类信息检索实践发现浩瀚如 海且不断变化的计算机科学信息资源与有效获取之间存在着尚需解决的技术问题,且越来越 明显,主要表现在以下几个方面:
1.1 搜索准确性问题

目前我们使用的大部分搜索引擎和专业数据库检索都是依据查询字段的匹配来收集信息,在 查询的结果中,常常包含着一些无用信息即信息过载和资源迷向,浪费了用户的时间与精力 。 
1.2 个性同化问题

不同的用户使用同一个搜索引擎对同一个关键词进行查找,得到的结果均是相同的,毫无个 性可言。
1.3 结果差异问题

我们对相同的“计算机编程”进行搜索时,在百度能搜到770个网页,而在雅虎中却可搜到 8 832 765个网页,在中国期刊全文数据库中搜到10 624篇(精确)论文,而在 重 庆维普数 据库中却搜到208篇(精确)论文,体现出不同搜索引擎产生不同的结果,对同一关键词使 用不同的搜索引擎得出的结果差别很大。 
1.4 主动服务问题

我们目前所使用的搜索引擎 都是通过在搜索引擎中键入关键词搜索才能得到所需要的信息 ,而引擎本身不能为用户提供主动的服务, 这是一种较为被动的信息获取方法。
1.5 动态监测问题

网络中计算机科学方面的信息是实时动态变化的,如果为计算机科学的研究提供更新的信息 ,我们只有花费很多时间与精力实时查询网络,才能做好服务工作,而在现有搜索引擎技术 条件下,对我们来说是极为不便的。 

这些问题正是数字图书馆个性化信息服务所要解决的。对于搜索引擎来说,也是其自身无法 克服的,为适应信息的个性化需求,一种智能Agent搜索工具已被研发出来,在工业、商业 领 域广泛应用,本文拟将该理论引入数字图书馆的个性化服务中来,探讨其在计算机科学信息 检索中的应用。
2 Agent智能搜索理论

智能Agent的研究起始于20世纪90年代,是人工智能和代理技术的集成运用,它代表了信息 技术最前沿的发展方向, 是一个全新的研究开发领域。是具有划时代意义的智能化、主动 服务用户的研究热点。


Agent智能搜索理论,核心功能就是智能代理,利用一种计算机软件(实体)自动执行用户 委托的任务来达到用户的检索需求,如学习Agent、中介Agent、通信Agent、信息协作查询A gent、信息采集Agent、信息分析Agent、信息传递Agent等等,每种智能Agent都需要相应的 技术支持,这些技术包括了人工智能和代理技术、神经网络技术、信息检索技术、计算机网 络技术、数据库数据挖掘技术、自然语言处理技术等,这些技术,近年来的研究已非常成熟 ,在这些技术支持下的多种Agent组成的智能系统已被开发者广泛应用于工业和商业领域, 智能Agent能把用者的需求通过自身的自治性、代理性、学习性、分析性描绘读者需求、建 立导出信息模块、自动搜索信息。专家学者设计了许多面向Agent的建模语言以支持基于借 助于面向Agent的软件,和支持不同系统模型之间转换的软件,以使各系统之间相互兼容, 从而建立起一种逐步求精的Agent系统,为解决网络中计算机科学专业信息服务与计算机科 学专业信息搜索问题提供了新思路。遵循这一理论,我们进行计算机科学专业专业智能检索 的探讨。  
3  基于多种智能Agent的计算机科学专业检索系统的工作原理

完成用户的完整的检索过程需要许多智能Agent的有机配合,以下分别介绍相关的Agent在完 成用户检索过程的工作原理。
3.1 信息采集Agent执行网络的搜索任务

信息采集Agent 是该系统的核心部分,信息采集Agent 是一组独立运行于各个物理节点上的 网络信息搜索程序,它根据所分配的任务和知识库中的信息对网络站点进行遍历,并把采集 到的信息存进本地信息库中。


信息采集Agent工作流程如下:①初始化时,信息采集Agent派遣信息协作Agent 取回知识库 中适当的外部地址作为运行种子;②由取回的外部地址作为初始种子,采集该网站信息,并 把采集到的内部地址信息存储到本地信息库中的内部地址列表结构中去 ;③从本地信息库 中的内部地址列表中取地址,采集信息;④内部地址列表为空,则表示完成该网站采集任务 ,执行步骤。
3.2 学习Agent总结用户检索习惯形成个性化的检索模式 

学习 Agent安装在用户个人机上,每个用户一个学习 Agent,学习Agent根据用户注册信息 了 解用户背景、兴趣、爱好、检索目的、任务等,自动从用户提交的初始的兴趣样本中提取特 征自动学习,并且根据用户经常的检索习惯,自动完成用户检索习惯的反馈学习任务和用户 个性化模式的生成。学习Agent根据用户的注册信息能主动地分析和获取用户的个性信息并 根据用户的兴趣模型或当前的环境状态了解用户的潜在需求,以主动服务方式提供服务,例 如, 设定计算机科学的信息, 学习Agent 可根据用户的信息和检索习惯,获取信息服 务 网站地址,自动监测相关网站的更新情况,自动将新信息推送给用户,将主动报告网络上计 算机科学资源的使用现状。

工作流程:①学习Agent将用户使用类似自然语言的描述限制在一个概念区域中,拥有完 成 学习任务的准备知; ②然后Agent在用户的教导下不断训练,直至能有效地找到用户感兴趣 的检索语言; ③学习Agent发挥它的学习和适应能力,形成一种记忆型的模式,能自动代表 用户将用户经常检索的问题在网上搜索,推送给用户。
3.3 中介Agent协调整个信息搜索过程

中介Agent在整个搜索过程中至关重要,是实现系统分布式透明性的关键。主要用于协调 采集、管理、统计、查询等各种Agent,按其功能分类或建立联盟,保证各种Agent之间的安 全通信机制。

工作流程:①当学习Agent从本地机知识库储存的信息状态,了解到用户和个性化信息及多 次关于计算机科学专业的检索习惯形成固定的检索模块;②根据用户的需求自动推送计算机 科学专业信息给中介Agent检索;③中介Agent首先把信息传递给各个采集系统中的信息采集 协作Agent;  ④信息采集协作Agent,与各个信息采集Agent进行交流;⑤与此同时中介Age nt与信息分析Agent交流;⑥信息分析Agent通过调取本地知识库进行分析,把结果通过信息 分析Agent递给信息中介Agent,中介Agent从信息分析系统中获得数据,再传递给信息采集 系统,完成信息采集。
3.4 信息协作Agen在动态的情况下自主完成搜索任务

这是一个可移动的Agent(Mobile Agent ),能根据当前动态变化的环境状态, 在无需外 界 参与的情况下, 独立地发现和利用完成任务所需的资源, 独立地制定完成任务的规划,  最终实现规划、达到目标。

工作流程:①信息协作查询Agen移动于采集系统和分析系统;②从信息采集Agent和数据传 送Agent 处接受协作信息查询请求;③再从中介Agent系统获得目标系统地址后,移动到这个 新的目标主机,完成信息查询任务。
3.5 信息传输Agent

信息传输Agent负责把本地信息库中已经采集到的信息安全传送到SAD中去。由于各子系统分 别处于不同 的物理节点上,数据传送的安全性和可靠性就变得尤为重要。数据传送Agent 通过与信息协 作查询Agent 以及中介Agent 的合作有效解决了这一问题。

工作流程:①数据传送Agent向信息协作查询Agent 发出对目的地系统地址的查询请求;② 信息查询Agent 从中介Agent 处取得数据分析子系统的IP地址,并返回给数据传送Agent ; ③数据传送Agent 根据所得到的目的地址,创建一个数据接收Mobile Agent ,并移动到数 据分析系统所在地;④数据接收MobileAgent 对数据分析系统所在地的网络通讯质量和系统 空闲时间进行评价;⑤若评价值满足数据传送质量的要求,数据传送Agent 开始向数据接收 Agent传送数据,直到数据传送完毕,收回并销毁数据接受Mobile Agent,若评价值不能满 足要求,直接收回并销毁数据接收Mobile Agent。
3.6 数据分析Agent通过智能筛选呈现给用户理想的检索结果

数据分析Agent负担着对采集回来的数据进行文本化、中文分词和评价网站的任务。由数 据接收MobileAgent、信息协作查询Agent 、数据分析Agent协作完成。平时,数据分析Agen t处于休眠状态,不加载入内存,当有新数据传送到SAD本地时,数据分析Agent 被激活 ,从硬盘上读入状态数据,进入工作状态。 

工作流程:①把采集到的数据进行统一化,采集到的数据可能是一段HTML 代码、pdf 文件 、word文件等,统一化就是利用代码转换方法把这些数据转化成纯文本格式;②如果其中有 中文 词汇,则调用中文分词模块进行中文分词,并调用专业词库与其中的专业词汇相比较,统计 网站中出现专业词汇的频率,把结果写入知识库中,作为对网站与本专业相关度的评价,把 相关内容插入索引数据库,若没有中文词汇,则与专业词汇比较,并形成索引。
4 基于多种智能Agent的计算机科学专业检索系统的工作流程

多种智能Agent相互协作完成计算机科学检索任务的工作流程如下图:


本地知识库存储用户的注册信息,学习Agent由中介Agent获取用户的检索模式交给采集Agen 并通过采集Agent采集信息,采集Agent把采集的结果通过协作Agent、接收Agent交于分析Ag ent,分析Agent经过处理把理想化的结果储存到知识库中,完成检索任务。在整个过程中体 现的是智能化的主动的推送的服务,是智能采集Agen根据用户注册的个性化信息资料、并把 多次的检索习惯通过学习建立模块,自动采集网络,完成服务的。整个过程体现的是主动的 服务方式,是当今图书馆智能化的主动服务模式。
[参考文献]
[1] 蔡栋.第二代搜索引擎模式探析[J].情报理论与实践,2001,(3).
[2] 漆宏,等.谈谈个性化信息服务[J].情报资料工作 ,2002(4).
[3] 韩立新,等.一个面向 Internet的个性化信息检索系统模型[J].电子学报  ,2002(2).
[4] 刘颖.多智能 Agent系统的结构与功能[J].图书情报知识,2001,(4).

推荐访问:计算机科学 信息检索 个性化服务 探讨 智能

热门排行

党委党组落实全面从严治党主体责任规定指出本地区本单位发生重大违纪违法案件14篇

党委党组落实全面从严治党主体责任规定指出本地区本单位发生重大违纪违法案件14篇党委党组落实全面从严治党主体责任规定指出本地区本单位发生重大违纪违法案件篇1我

2022年五星支部创建实施方案5篇

2022年五星支部创建实施方案5篇2022年五星支部创建实施方案篇1为切实提高支部党建工作科学化水平、不断夯实党建基础,挖掘支部党建特色,创新支部党建工作做

七言绝句古诗精选【十首】

【 能力训练 导语】七言绝句是中国传统诗歌的一种体裁,简称七绝,属于近体诗范畴。此体全诗四句,每句七

2022年支部党员大会记录内容14篇

2022年支部党员大会记录内容14篇2022年支部党员大会记录内容篇120xx年度我校新党员发展工作已经开始。根据学校党委3月21日会议精神,今年新党员发展

统计工作如何为企业管理服务

作为企业管理重要组成部分的统计工作,在企业的经济运行中发挥着信息、咨询和监督三大作用,它为企业的经营

乡镇创建无毒社区工作方案

一、指导思想以“三个代表”重要思想为指导,认真贯彻落实上级精神,以禁吸戒毒为中心,全面落实禁毒工作责

四年级我家菜园日记500字

菜园子,就是种菜的地方。种菜的时候为了防止家禽进入菜地,于是农夫用篱笆或者栅栏将菜地围起来形成的一个

哈尔移动城堡电影观后有感范本

在观看完一部作品以后,相信你会有不少感想吧,这时我们很有必要写一篇观后感了。可能你现在毫无头绪吧,下

党支部2022年学习计划14篇

党支部2022年学习计划14篇党支部2022年学习计划篇1认真坚持“三会一课”制度,对于加强支部建设,提高党的战斗力、健全党的生活,严格党员管理,充分发挥党