浅谈信息检索
作者:赵婷;郭楠;裴允;陈秉塬 来源:《价值工程》2010年第18期
摘要:信息检索(InformationRetrieval)又称为情报检索,起源于图书馆的参考咨询和文摘索引工作,20世纪50年代,成为一条专用术语。本文对信息检索的概念和研究内容进行了探讨,并指出了当前的研究热点,分析了信息检索的作用。
Abstract: Information Retrieval is also called Intelligence Retrieval,originating from reference work and literature search of library. It became a terminology in 1950s.The text researches into the notion and content of information retrieval,and points out the researching hot points and analyses the function of Information Retrieval.
关键词:信息检索;情报检索;检索理论
Key words: message retrieval;intelligence retrieval;retrieval theories 中图分类号:G25 文献标识码:A文章编号:1006-4311(2010)18-0140-01 0引言
信息检索(Information Retrieval)又称为情报检索,起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶开始发展,至20世纪40年代,索引和检索成已为图书馆独立的工具和用户服务项目。20世纪50年代,信息检索成为一条专用术语。 1信息检索的概念
穆尔斯在1948年提出信息检索的概念时,把它定义为一种“延时性通讯形式”。其特点是:发信者在某一时刻发出信息,而接收者可以在晚一些时刻才收到该信息;发信者必须发出一切可能的信息,而接受者必须有某种检索装置以便从大量发送的信息中筛选出适合自己需要的信息。 当前关于信息检索的概念,可谓百花齐放,百家争鸣。其中代表性的定义有四种:信息检索过程说、全息检索说、概念信息检索说和大量相关信息检索说。①信息检索过程说。《图书馆学百科全书》认为:信息检索是“知识的有序化识别和查找的过程,……广义的情报检索包括情报的检索与存储,而狭义的情报检索仅指后者”。②全息检索说。上海交通大学信息检索专家王永成教授认为:全息检索就是“可以从任意角度从存储的多种形式的信息中高速准确地查找,并可以任意要求的信息形式和组织方式输出,也可仅输出人们所需要的一切相关信息的电脑活动”。③概念信息检索说。Chank等专家认为,概念信息检索是基于自然语言处理中队只是在语义层次上的
龙源期刊网 http://www.qikan.com.cn
析取,并由此形成知识库,再根据对用户提问的理解来检索其中的相关信息。它用概念而不是关键词来组织信息。④大量相关信息检索说。叶继元等教授认为,信息检索是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。 2信息检索的研究
2.1 信息检索的研究内容信息检索的研究内容,首先在于检索理论的研究,还包括检索语言研究、数据库研究、著录法研究、标引和组织法研究等。
检索理论是检索活动中总结出来的系统化的知识,研究内容包括信息与信息资源定义、信息检索的定义、类型、特点、作用、研究对象、方法、内容、理论基础、术语规范、原理与原则、相关学科等的研究。当前较为重视信息检索知识体系化、整合化的研究。
检索语言研究原指从自然语言中精选出来,并以简练形式表示文献、信息的受控语言的集合。现指受控语言和自然语言(未规范的书面语言)。研究内容包括关键词、主题词、词表编制、分类表编制、概念分析、规范档、代码标识等。
数据库是多个互相关联的数据的集合,是信息检索系统必不可少的组成部分。研究内容包括数据库建设规划与协调共享、收录信息与文献的筛选、文档结构、维护与更新、版权、市场、效果评价、数据库跨库检索、Z39.50标准等的研究。当前的研究热点:加强异构数据库系统信息资源一体化整合和检索、知识库、数据仓库的研究。
著录法是对信息与文献形式特征和内容特征进行分析、选择和记录的方法。研究内容包括国内外著录标准与规则、格式、各种信息与文献著录方法、CN-MARC、UNI-MARC、US-MARC、Dublin Cor(都柏林核心)元数据、XML等的研究,目前较重视电子型文献及网络信息的著录研究。
标引是通过对信息资源的分析,选用确切的检索标识反映资源内容的过程。组织法即排检法,是指按一定次序将标引标识(如主题词、分类号)排列起来的反方法。
检索服务是根据用户需求,由专门人员帮助查找信息,并将结果提供给用户的工作,研究内容:服务手段、服务方式、用户培训、检索效果(查准率、查全率)等。目前应加强个性化信息服务研究。
2.2 信息检索的研究方法信息检索的研究从属于图书馆学与情报学。涉及到自然科学、社会科学、人文科学的许多学科和领域。通用的方法有:观察法、实验法、调查法、模拟法、归纳与演绎法、分析与比较法等;还使用文献计量学法、信息计量学法、目录学、分类学、主题法、著录法、排序法、咨询法等独特的研究方法。
2.3 信息检索的作用信息检索的作用是多方面的。首先,通过信息检索,能较全面地掌握有关的必要信息。信息检索可以有目的、较系统地获得某一主题的必要信息。其次,通过信息检索,
龙源期刊网 http://www.qikan.com.cn
能提高信息利用的效率,节省时间与费用。一般公信度高的,较准确的信息才会被收集、组织或存储在检索工具或数据库中,有目的地查检检索工具所获得的必要信息比直接泛阅信息要快数十倍。第三,通过信息检索的锻炼,能提高信息素质,加速成才。信息素质(InformationLliteracy)是指具有获取信息的强烈意识,掌握信息检索的技术和方法,拥有信息鉴别和利用的能力。信息素质的概念最早是由美国信息产业协会主席Paul Zurkowski 1974年在给美国政府的报告中提出来的。20世纪 90年代之前只有为数不多的国家在研究、开展信息素质教育,20世纪90年代之后,引起了各国的广泛关注。以美国为例,目前信息素质教育已成为美国学者特别是美国图书馆界学者研究的一大热点并取得了一定的成果,其中代表性的研究成果是:美国ACRL2001年初批准并在2004年初由全美大学图书馆协会正式通过《高等教育中信息素质能力标准》,并把它作为评估学生信息素质能力的一个指南。而中国的高等教育法则明确要求大学生要具备信息素质。 3结语
随着互联网的普及和电子商务的发展,企业和个人可获取、需处理的信息量呈爆发式增长,其中绝大部分都是非结构化和半结构化数据。内容管理的重要性日益凸现,而信息检索作为内容管理的核心支撑技术,已应用到各个领域,成为人们日常工作生活的密切伙伴。
因篇幅问题不能全部显示,请点此查看更多更全内容