查阅中心及展馆开放时间
(法定工作日)
上午:08:00 -12:00
下午:15:00 -18:00
查档及观展预约咨询: 0771-5852963
发布时间:2012-02-21 10:34:06来源(作者):
传统的档案查询方式,通常是以主题、时间、事件、人物及地点等为线索,采用关键词完全匹配的方式在档案目录数据库或全文中检索。这种方式基本可以满足熟悉档案业务的档案工作者的需要,但对于广大利用者来说,在大量的档案信息中查找所需档案信息却并非易事,这也是档案的利用率偏低,档案馆(室)存储的大量档案信息得不到充分利用的重要原因之一。
档案信息扩展查询需求分析
检索方式简单易用、检索结果准确全面以及检索速度快,是对档案信息查询功能的基本要求。目前,大多数档案管理系统都是针对档案工作者研发,着重于满足档案管理工作的需求。在档案信息查询功能方面,由于档案信息的著录标引必须遵循国家或行业的有关标准,档案工作者能根据规范进行检索,档案的查全率和查准率较高。随着经济社会建设发展,档案服务领域的不断扩展,越来越多的社会群众走进档案馆,成为数字档案管理系统的使用者,而专业的档案查询方式显然已不能满足普通利用者的查档需求。
针对检索需求不明确、检索词汇不准确等问题,当今国内外大多数搜索引擎,主要是通过相关词提示帮助用户优化查询方式,明确用户的信息检索需求。相关词提示是搜索引擎系统为用户提供关键词,帮助用户重新构造更加有效的查询方式,从而减少多余检索步骤的检索技术。如将该检索技术引进档案工作领域,针对档案信息来实现类似搜索引擎提供的相关词提示功能,将查询扩展的相关词服务应用到档案信息检索上,利用者可以根据扩展相关词的提示,进行二次搜索。由于扩展相关词相对于利用者一次输入的查询关键词更加准确、规范,指定范围也更加具体,二次检索的结果比直接查询结果更为理想。因此,应用查询扩展可以辅助利用者正确表达信息需求,使得利用者可以快速、准确、全面地获取自己需要的档案信息。
档案检索词库的构建
建立档案检索词库是扩展查询技术应用的基础。词库来源是多方面的,主要有档案主题词表、公文主题词表、档案目录中的关键词、各级档案馆(室)依据馆(室)藏档案特色建立的词汇库、地方性词表、档案文献集以及数字档案管理系统用户检索日志等。
不同的词汇来源从不同的侧面反映了词汇间的相互关系,基于各个来源提取的查询扩展结果也必然会有所不同,查询扩展词之间的重复率很低,使得各个结果间的互补性很强。因此,在获取了基于多种来源提取的查询扩展词结果后,需要对结果进行整合,最终得到相关词集成词库。
档案信息查询扩展应用
在构建好集成词库的基础上,将查询扩展的相关词服务应用在档案信息检索上,利用检索词的相关词对利用者的检索进行修正和扩展,帮助利用者重新构造更加有效的查询方式,从而减少检索的盲目性以及多余的检索步骤,在检索扩展中提高查全率的同时保证查准率。
档案查询扩展的目标是提高档案检索的查全率和查准率,但查全率与查准率却为互逆相关性。因此,查询扩展应用应按照使用目的进行设计,不配套的设计会使应用效果得不到很好的体现,甚至是适得其反。所以在结合查询扩展提供应用时,需要密切结合利用者的需求及最终目的进行合理设计,才能更好地为利用者服务。
此外,由于查询扩展比传统的查询方法要处理更多的事务,给计算机系统增加了额外负载,一定程度上会降低查询性能,因此应根据应用环境进行相应的调整,在有限的资源内结合多方面因素充分提高性能。
随着计算机软硬件以及网络环境的快速发展,档案利用者对档案信息查询服务水平的要求也不断提高,相信查询扩展技术将为数字档案管理和利用提供高质量、高效率的查询服务。