您的当前位置:首页正文

为什么要进行信息资源整合

2020-09-14 来源:易榕旅网


为什么要进行信息资源整合

信息资源整合是指将某一范围内的,原本离散的、多元的、异构的、分布的信息资源通过逻辑的或物理的方式组织为一个整体,使之有利于管理、利用和服务。我们也可以这样来理解信息资源整合,就是把分散的资源集中起来,把无序的资源变为有序,使之方便用户查找信息、方便信息服务于用户。这也是广义的信息资源整合概念,它包含了信息采集、组织、加工以及服务等过程。

为什么要进行信息资源的整合? 整合究竟要解决什么问题? 这主要源于网络信息资源的激增,资源的种类越来越丰富,数据库和信息资源检索系统越来越多,检索方式、检索手段各式各样。造成了数据冗余、相互关联程度低,大量的信息孤岛出现,同时用户的检索负担也日益加重。因此,需要有一种手段把这些信息集中、整序、关联起来,把检索系统集成起来,使用户知道到哪里可以找到所需要的信息,怎样去查找这些信息,如何筛选检索结果,这就是信息资源整合的最终目的。

信息资源的整合方法、途径和手段多种多样,但一般来说包括三个层面:其一是数据层(又称资源层) ,即把有关信息资源集中为一体;第二是操作层(又称服务层或中间层) ,即通过软件或平台对有关信息资源进行统一利用;第三是系统层(又称应用层) ,即包含数据内容、软件系统以及基础设置的全面整合。信息服务部门需要根据自己的信息资源、应用系统状况以及硬件基础设施来确定整合层次和实施方案。

信息资源整合原则

信息资源整合是一个系统工程,如何在理论的指导和经验的驱使下,使信息资源的整合工程做到最优。还需要我们在数据整合工程的实施过程中遵循如下原则。

整体性原则

整体性又称完整性,就是在信息资源整合工程中要保持信息资源对象完整与全面。完整性主要体现在这样几个方面。

(1)根据服务的主要对象或服务目标,保证整合资源内容的和学科的完整性;

(2)确保信息资源是一个整体,并不一定要求在物理上是一个整体,但需要将分布资源有机关联,揭示数据对象间的内在关系,在逻辑上形成一个整体;

(3)用户界面的统一,即实现一站式检索;

(4)系统功能的全面性,即要求整合后的资源系统能够涵盖原子系统的所有功能。

科学性原则

科学性原则主要是指对整合工程进行全面规划,科学论证,切忌匆忙上马,不宜随意凑合,要保证整合的合理性、科学性和规范化。具体在实施过程中要注意。

(1)资源选择的科学性,根据自己的服务对象和财力合理的规划、购买和自建资源,不能盲目求多,浪费人力财力;

(2)整合资源组织的科学性,建立各类资源间的多重关联,科学地组织它们,将有限的资源产生出最大的知识和信息量;

(3)整合后的系统在交互接口上的科学性,这个交互包括数据处理过程的后台交互,也包

括用户和检索系统的交互,交互的科学性主要体现在处理接口的无缝连接,处理过程简洁快速,检索界面的方便有效。

层次性原则

层次性原则是指在建立信息资源整合系统和为用户服务的过程中,以满足用户服务为最终目标,在以下几个方面考察其层次性:一是整合数据的层次性,因为我们的用户可能具有不同的知识背景,不同层次的信息需求,所以我们要注意整合不同知识层次的信息;二是指信息资源整合的结构性,由于用户的查询需求可能是多方面的,目的可能很复杂,因此,为满足不同的用户需求,简单的一维、二维整合可能难以达到目的,需要能够实现数据的多维整合;三是检索操作的层次性,即提供简单检索、复合检索和专家检索这样多层次的检索界面来满足不同层

次用户的检索要求。

最优化原则

最优化原则的目标是使整合后的信息资源达到最佳的使用效果。也就是说如何将组合在一起的信息资源达到最优,即将原本并不是紧密关联的数据有机的联系在一起,并能够发现隐藏在其中的信息和知识;如何使检索系统达到最佳的运行效果,即是否拥有多种检索手段(例如简单检索、布尔逻辑检索、二次检索、同义词检索、排除词检索以及扩检和缩检手段) ,使其能够获得理想的查全率和查准率。

动态性原则

动态性原则是指整个整合系统能够适应数据动态变化和用户需求随机改变的状况。满足动态性的系统应该是个开放性的系统,应能够把各种类型的数据、不同格式的数据整合到系统中,能够及时增加动态变化的数据。在检索方面,应能够适应用户不断变化的检索要求,具有一定的学习功能,能够实现动态性的推荐服务。总之,整合系统满足动态性就是指其能够随着数据和外部各种环境的变化而不断变化。

针对性原则

针对性原则是指根据整合的目标,有针对性地选择信息资源、挑选恰当的整合工具和整合方法,切不可盲目实施。除此之外,针对性原则还表现在根据用户的特定需求来整合与组织信息资源,使整合后的资源既符合总目标,又满足用户的个性化服务需求。当然,这种个性化服务的实现还要求系统功能的扩充,如提供个性化的信息推送服务。另外,在针对性原则指导下的常见信息资源整合方式,还包括建设专题数据库或者特色数据库,如CAL IS项目、JAL IS项目等。

适度性原则

所谓适度性就是不要盲目的追求广、大、多,要根据现有的技术力量、资金能力对信息资源进行适度的整合。因此,要求我们在进行整合的过程中,资源选择时要根据自己的服务对象,依据自身对信息资源的整合能力选择待整合资源。例如,艺术类的院校应集中在与艺术有关资源的整合,文科类院校对理工类的信息资源就应当谨慎收录。当然,这样整合可能会使得用户获得的资源受到限制,因此,就要求多个资源整合机构能够建立联盟,就像图书馆间的馆际互借。

经济性原则

经济性原则主要从两个方面反映出来:一是通过遵循针对性和适度性原则,在自己经济力量有限的情况下,通过最优化理论与方法,进行较少的经济投入而实现功能倍增;二是指经过整合后的信息资源系统,要扩大服务范围,提升服务能力,以多样化的服务手段,产生最大的经济效益,做到服务、生存、发展。

信息资源整合前沿研究

下一代互联网发展趋势主要表现为: GGG ( GreatGlobal Grid)中的网格计算、语义网( Semantic Web)中的基于语义的信息表示等新的服务模式的出现。在GGG或语义网环境下的信息资源整合研究是当前比较热门的一个前沿研究。

针对日益增长的多媒体数据检索需求,研究TB级以上容量的海量多媒体的信息检索的有效机制,从多种类型的多媒体中建立起跨媒体的语义网络,实现跨媒体的数据整合、识别与综合检索,研究复杂媒体数据以及检索机制,建立智能高效的海量数据检索,对复杂媒体数据(如视频、3D模型、动画等)的智能处理技术及检索机制的研究,跨媒体信息整合、识别与检索技术,跨媒体知识的表达与推理的研究,跨媒体海量信息的综合检索系统实现。

信息资源整合前沿研究还包括知识整合(集成)研究,如何将隐性知识显性化、如何对各种知识进行有效集成,如何更有效为决策服务,这些都有待今后深入研究。

以上给出了信息资源整合研究的几个主要方面,实际上其研究还涉及其许多方面。如,对信息资源整合实施中涉及到的知识产权问题;整合的规范与标准问题;信息资源整合环境下的人才培养等,都是信息资源整合研究的内容。

信息资源整合关键技术

信息资源整合不仅仅是把信息资源聚集在一起,而是涉及到对信息描述、组织、处理、整序、检索、服务等方方面面,这些方面都需要有一定的技术来支撑。具体技术主要包括如下几个方面。

数据的组织、转换相关技术

数据的组织技术主要解决不同类型、不同结构的数据如何组织在一起;如信息资源涉及到的分类控制方法:行业分类表、地区分类表、中图法范畴分类体系、用户自定义分类体系等资源多分类组织技术。数据转换技术主要解决将不同格式、不同平台下的数据转换问题,MARC、DOC、PDF、TXT等不同格式的文件的格式分析,数据交换或转换技术,数据的查重去重技术等。此外还包括数据封装技术,如XML技术。

索引技术

索引技术的研究,主要解决整合后的索引如何构造的问题,这些索引要满足不同检索算法和检索需求,如,全文检索、同义词检索、排除检索、扩检和缩检、集成(整合、跨库、一站式)检索技术(涉及到关键词、主题词、分类导航、元搜索、TOP - K集成检索等整合检索) 、跨语言的信息检索技术、概念检索技术(利用同义词词典、概念词典)等进行基于概念(或基于语义、基于本体)的检索。

数据描述技术

信息源的语义内容描述、语义的识别能力及信息重复率,覆盖度等研究,也包括如何用元数据来表达整合后的数字信息,信息标引中所使用的元数据标准(如DC) ,元数据之间(如DC与MARC)的兼容互换、不同分类体系之间(如DDC号与中图分类号)的自动映射技术等。

信息自动化处理技术

信息的自动标引(包括智能分词、信息抽取、信息过滤、话题跟踪、关键词标引、主题标引、概念标引及其它元数据的自动标引) 、自动分类(分类也是一种整合) 、自动文摘、自动篇章分析、机器翻译(多语种的资源进行整合时)等。智能信息处理中所应用的方法,如数据挖掘、机器学习、自然语言处理技术、本体工程等。

多媒体技术

包括多媒体内容分析技术,视频、图像压缩技术、其它图像处理技术(如图像的灰度化、二值化、纠偏、去污处理等) 、对图像文件进行图像、文字的自动识别技术,多媒体信息的整合与检索,信息的可视化展示,如:数据多维层次显示技术、数据集成显示技术、图文关联技术、基于模块的数据显示方式选择。

个性化服务技术

个性化可以划分为界面风格的个性化(包括面向各个用户的个性化风格、提供资源服务的风格界面与其它Web应用系统的界面的一致性风格等) 、提供个性化的资源(就图书馆整体来说,提供特色资源,就用户个体来说,提供个人化的资源) 。后者涉及到的核心技术有用户检索行为的获取、分析与利用、用户反馈检索、用户检索历史的应用、个性化推荐服务、信息协同过滤等、定题信息提供( SD I)等。

其他关键技术

信息资源整合涉及到的其他的关键技术主要包括:信息资源整合的相关标准、协议,如元

数据标准,数据转换标准及检索协议,如Z39. 50 等;在新一代网络环境下的资源整合技术,如GGG或语义网环境下的信息资源整合技术;此外,还包括动态信息发布技术,分布式软件体系,网络安全控制技术等。

信息资源整合涉及到关键技术主要为计算机软件技术,这些技术的应用背景为:资源管理者在信息资源整合理论的指导下,依据信息资源整合原则,对信息资源进行有效规划整合。在实施信息资源整合项目时,需要图情专业人员、领域专家及计算机专业人员通力合作,协同配合,这样才能达到资源整合的最终目标。

信息资源整合引发的网络服务变革

资源整合后,信息服务部门的信息资源将成为一个整体,过去在不同资源中来回切换的访问变成了一站式服务,过去的等待服务转变成了主动服务,服务的深度加强了,服务的范围扩大了,人们已经意识到信息资源整合将为网络服务带来新的变革。

从信息服务到内容服务的转变

资源整合以后,信息资源管理单位拥有统一的用户交互接口,提高了资源的获取效率并方便了用户使用。更重要的是,整合后的资源其间关联更加紧密,许多隐藏在信息中的知识逐渐显现或能够被挖掘出来,人们对知识服务的需求已经可以得到满足。因此,从信息服务到内容服务、知识服务的转变,已成为一种必然。

由于信息爆炸引发的信息泛滥,人们在大量的信息中往往感觉到无所适从,现代社会的快节奏也使人们对信息的获取要求更直接更有针对性,希望能够得到解决问题的知识或具体的内容和数据。Web基于内容单元的超文本链接方式,以及信息资源整合后的相关内容

的连接,使内容服务成为可能。整合后的资源其全文检索、主题词检索、关键词检索都是直接针对信息内容的,检索结果的多文档摘要是提供内容服务的又一新的途径,数据挖掘可以为用户提供更深入的内容和解决问题的知识。总之,整合后的信息资源服务主要是基于内容和知识,将彻底实现从信息服务到内容服务的转变。

从等待服务到主动服务的转变

长期以来,信息服务部门大多以等待服务或被动服务为主的服务形式,这种服务最大的缺陷就是,由于用户对资源缺乏了解和对系统使用技能的掌握,使之不能得到及时和有效的服务。但是,在传统的信息服务系统下,要做到或者说要做好主动的信息提供是非常困难的。网络环境下的资源整合系统则可以使主动的信息提供很方便的做到和做好。

主动服务有两种方式:一种类似于过去的SD I服务,由用户在网上填写信息需求申请单,以后就根据用户的需求申请定期或一旦有了新信息,就把符合用户需求的信息自动发往用户的电子邮箱中;另一种是主动推送服务,即根据用户的使用情况,进行使用挖掘,发现用户一段时间关心的内容,系统主动把相关的信息提供给用户。主动服务实际上是一种个性化的推荐服务,这种服务使用户能够更为及时方便地得到自己所需要的信息。

基于知识共享的服务网络

传统的信息服务机构是以拥有大量丰富的信息资源,将信息资源集中在信息服务机构的物理空间为前提的。信息资源整合后,用户利用信息资源依赖信息服务机构物理实体的程度大大降低,信息服务机构原来的以“拥有资源”为中心的指导思想正在转变,工作的重点正在重新确立,并正转向以“整合”信息资源为中心提供信息服务。通过信息资源整合,知识达到充分共享的程度,知识价值得到充分体现。今后的信息服务机构的资源将会向整合化方

向发展,提供的服务由最初提供单一的物理实体服务,向多层次、多元化、数字化的知识共享服务方向发展。

上海国际航运信息中心定位于五大功能:航运信息有效集聚、航运信息专业分析、航运信息权威发布、航运信息辅助决策、航运信息增值服务。

上海航运交易所总裁张页告诉记者,上海国际航运信息中心主要就是对船、人、货提供更准确的各类数量和价格的信息,帮助航运相关企业和政府部门实现薪资资源共享,以提高资源利用效率。

航运信息网

航运信息网是由浙江船舶交易市场于1999年注册成立,网站本着服务航运、奉献航运的宗旨,一直致力于航运信息化建设,构建航运信息综合平台。把传统航运产业与信息产业有效的结合,打造航运服务第一航母。解决国内外航运产业链中各个环节因沟通不畅、信息滞后引起的工作效率、服务质量、业务领域的各种局限。主要服务架构为:

线上信息服务:

航运资讯、船舶买卖、货盘中心、租船中心、航运人才、会员公告、港口信息、政策法规

线下传统服务:

航运信息化、船舶设计、进出口代理、船舶拍卖、委托交易

移动商务服务:

短信公告、短信通知、商务推广

服务优势:

航运信息网可归纳为“3+1”的服务模式,为航运企业提供全方位的4维立体服务。

“3”:指三线:

第一线,指线上信息服务,为航运企业提供便捷的信息发布平台,自我宣传的渠道,科学的指导数据。

第二线,指线下传统服务,为航运企业解决从船舶建造、运营、管理、修理、买卖于一体的实际操作服务。

第三线,指无线数据服务,通过移动通信平台,泛化现代企业办公场所,真正做到随时随地好办公,随时随地好沟通,极大得扩展了航运商机,提高了交易的成功率。

“1”:指一种网上虚拟货币(航运币)。

“航运币”是航运信息网在同行业网站中最早提出的虚拟流通币概念,非常有利于会员在网站中进行自助服务,开启会员自助绿色通道。

因篇幅问题不能全部显示,请点此查看更多更全内容