基于XML的教育资源库元数据标准化研究
2022-08-19
来源:易榕旅网
第29卷第4期 吉林大学学报(信息科学版) Journal of Jilin University(Information Science Edition) Vo1.29 No.4 2011年7月 July 2011 文章编号:1671-5896(2011)04-0366-05 基于XML的教育资源库元数据标准化研究 季 莉 (南通纺织职业技术学院信息系,江苏南通226007) 摘要:为提高网络教育资源的利用率,共享不同结构的资源库的数据,针对我国各院校的教育资源库的建设 缺乏统一规划,存在重复建设、数量庞杂、形式不规范等,使网络远程教育系统中资源信息不能有效共享传 播的问题,提出了基于XML(eXtensible Markup Language)的教育资源库元数据标准化的方案,研究了基于 模板的XML数据转换方法。通过指令的执行,并应用教育资源元数据标准,将其他格式的数据通过模板转化 成XML文档,从而实现不同教育资源库之间数据的互换和共享。 关键词:元数据;可扩展标识语言;资源搜索 中图分类号:TP393 文献标识码:A Metadata Standardizati0n of Educational Resource Database Based on XML JI Li (College Information Department,Nantong Textile Vocational Technology College,Nantong 226007,China) Abstract t To improve the utilizing rate of network educational resource and share the data of different database with different structure,the constuctrion of our educational resource database is short of unifed planning,which results in some problems such as repeat construction and inconsistent forma1.Resource in the distance education system can not propagate efficiently.Put forward a scheme about metadata standardization technology of educa- tional resource database based on XML(eXtensible Markup Language)and study a method of date exchange based OFI formwork.This scheme can change other stuctrure data to XML by complying with metadata of eduea— tional resource and implementing directives which can achieve the sharing and exchange of data in different edu- cational resource database. Key words:metadata;extensible markup language(XML);resource search 0 引 言 随着互联网的迅速发展,信息以几何级数增长的同时也给互联网上的信息检索带来了困扰。Google 和百度这样的通用搜索引擎在一定程度上缓解了Web信息检索与海量信息之间的矛盾,但用户根据关 键字检索的结果可能会交叉多个领域,很难准确表达用户的真实检索要求,检索质量较低n'2]。目前, 全国各地建设了大量的教育资源库,类型复杂,形式多样,在数据规范上具有相对的不一致性。一方面 容易造成投资浪费、重复建设;另一方面各个资源库分散且孤立,大多数都缺乏对自身的描述,教育工 作者在检索资料时要查找众多资源库,耗费大量时间精力 j。如何将教育资源库给予标准的资源描述、 进行智能化的无缝聚合,帮助教育工作者快速准确地查找到所需的资源,是笔者讨论的重点。 1 教育资源元数据标准 元数据(Metadata)是关于数据的数据,用于描述数据的内容、覆盖范围、质量、管理方式、数据 收稿日期:2011-03—17 基金项目:江苏省现代教育技术研究课题基金资助项目(2010-R-17450) 作者简介:季莉(1978一),女,江苏南通人,南通纺织职业技术学院讲师,硕士,主要从事网络协议研究,(Te1)86—13773627800(E. mail)ntmiya@hotmail.eom。 第4期 季莉:基于XML的教育资源库元数据标准化研究 367 的所有者、数据的提供方式等信息,是数据和数据用户之间的桥梁 J。目前,各行各业都在开展根据 自己业务的需要制定相关的元数据标准,如地理信息系统元数据、数字图书馆元数据等标准。在教育领 域,中国教育信息化技术标准委员会提出一个较完整的中国网络教育技术标准体系结构,产生了11种 规范,其中与教育资源相关的标准规范有:《学习对象元数据》(CELTS一3)、《教育资源建设技术规范》 (CELTS-41)和《基础教育教学资源元数据规范》(CELTS-42)。 元数据最基本的功能是通过数据元素集定义资源对象的各类属性,这些属性的大量实例可以表达为 关系型数据库中的表,或以XML等形式进行标引,从而能利用数据库系统或各类应用软件进行管理 J。 “教育资源建设技术规范”的基本结构包括3大部分,分别为严格遵守的必须数据元素、作为参考并对 每类资源都适用的通用可选元素和针对资源特色属性的分类数据元素 J,涉及到的资源类型包括网络 课程、媒体素材、试卷试题、课件、案例、文献资料、资源目录索引和常见问题解答等。 2 XML技术 可扩展标识语言(XML:eXtensible Markup Language) 是Internet上最新的技术之一,它以结构 化、可扩展性及灵活性的特点引起了业界的普遍关注。XML的用途主要有两个;1)作为元标记语言, 定义各种实例标记语言标准;2)作为标准交换语言,担负起描述变换数据的作用。目前XML已成为互 联网上数据存储和交换的重要标准之一 ,元数据标准可以很自然地用XML表示和传输。文档类型 定义(DTD:Document Type Definition)是一套关于标记符号的语法规则,它定义了文件的整体结构和 语法,使用XML进行数据交换的行业或组织可以定义他们自己的DTD。XML通过其标准的DTD定义 方式,允许所有能解读XML语句的系统辨识用XML—DTD定义的元数据格式,从而解决对不同格式的 释读问题。用XML表示的元数据如图1所示。 图1 用XML表示元数据 Fig.1 Express metadata by XML 3 基于模板的XML文档标准化转换 常用的教育资源包括课件、试卷、问题解答和媒体素材等多种形式,采用的格式有HTML、Word、 PDF等,对这些不同格式的电子资源进行XML转换,以实现信息资源的流通和共享¨ 。XML文档属 于半结构化的数据,它对结构化的数据(如关系数据库数据)或非结构化的数据进行转换时,关键问 题是要建立不同结构层次之间的映射关系 ’H]。笔者提出一种基于模板的XML文档与其他格式数据结 构映射的方法,即在XML文档中嵌入可执行的指令,这些指令在转换过程中被系统识别和执行,执行 的结果被替换到指令所在的位置,从而生成目标XML文档。 举例 为了从教育资源数据库中获取某本书的信息,并将信息用XML文档表示,可以定义如下 一个模板: (?xml version=“1.0”?) (Booklnfo) (Intro)The following books have copies available:(/Intro) 368 吉林大学学报(信息科学版) 第29卷 (SelectStmt)SELECT Book PublishNum Author Date(/SelectStmt) (Conclude)Hope one of these meets your needs(/Conclude) (/Booklnfo) 生成XML文档时,系统扫描整个模板,当识别到(SelectStmt>指令时,系统识别出这是一个可执 行的指令,于是调用指令执行程序执行该指令。指令执行后的模板为: (?xml veEsion=“1.0”?) (BookInfo) (Intro)The following books have copies available:(/Intro) (BOOKS) (Info) (Book)Thingking in C++(/Book) (PublishNum)123456(/PublishNum) (Author)Bill Gates(/Author) (Date)Dec.2009(/Date) (/Info) (BOOKS) (Conclude)Hope one of these meets your needs(/Conclude) (/Booklnfo) 图2给出了基于模板转换方法的架构图。 图2基于模板的转换方法据 Fig.2 Transform method based On fonnwork 基于模板的转换方法可以将网络上其他类型的数据转换成XML文档,只要提供模板,就可以快速 生成相应的XML文档。对于数据库数据,可以用数据库管理系统方便生成指令执行程序;对文本数据 的转换则需要编写相应的指令执行程序,工作量较大。 4 元数据标准化在教育资源库共享中的应用 从我国目前教育资源建设的现状看,造成重复建设的一个重要原因是基于数据结构上的差异使各个 教育资源库系统之间的难以实现数据的共享。研究教育资源共享,是要充分利用现有的资源库,将不同 结构的数据统一为基于XML的数据,并在此基础上表述、传输、转换和查询n ,这是实现网络上众多 的教育资源元数据标准化方案之一。 图3是基于XML教育资源库元数据标准化的基本应用模式,不同区域不同结构的资源库数据通过 基于模板的XML标准化转换程序,统一为XML文档,达到教育资源大范围内的共享和互换。 第4期 季莉:基于XML的教育资源库元数据标准化研究 369 文本 图片、 用户信息记录璃 j \ 基于 视甄 音羝 动匦 ) X模板的 Mt ̄, 试卷 准化 试题 资源知识库 转换 课你 l对舞l 网案程络钒等课 霆 教育资源库A 文本 图帛 用户信息记录 \ 基于 模板的 视瓶 厂——]、 Ⅺ咀标 音频.动 !学科卜\ / 准化 试卷 试题 资源知识库 转换 耐岱I .jr i 课件 网案程络钒等课 霜 图3 基于XML的教育资源库元数据标准化应用模式 Fig.3 Scheme about metadata standardization of educational resource database based O13 XML 5 结 语 笔者提出了一种基于XML的网上教育资源库元数据标准化的方案,研究了基于模板的XML数据转 换方法,即在XML文档中嵌入可执行的指令,通过指令的执行,并应用《教育资源建设技术规范》的 元数据标准,将其他格式的数据插入到XML模板中,从而生成XML文档。该方案能有效帮助教育工作 者描述、检索和处理资源,对资源可以实现基于内容的定向搜索,大大提高了在因特网上的搜索效率。 参考文献: 『1]LIU Chuall—chang.Search Recommendation Model Based on User Search Behavior and Gradual Forgetting Collaborative Filte— ring Strategy『J],111e Journal of China Universities of Posts and Telecommunications,2010,17(3):l 10—1 17. f 2]FENSEL D.The Semantic Web and Its Languages[J].IEEE Intelligence Systems,2000,11(9):67—73. [3]轩景泉,王玮,安正峰.分布式教学资源的个性化搜索[J].吉林大学学报:信息科学版,2008,26(5):525-530 XUAN Jing.quan,WANG Wei,AN Zheng,feng.Personified Search in Distirbuted Teaching Resources[J].Journal of Jilin Univesrity:Information Science Edition,2008,26(5):525-530. [4]刘炜.关于元数据的十万个为什么[M].上海:上海市图书馆,2004. LIU Wei.One Hundred Thousand Way about Metadata[M].Shanghai:Shanghai Library,2004. [5]钟庆.基于元数据标准的外语教学资源库建设与应用[J].广西职业技术学院学报,2010,4(3):5_7. ZHONG Qing.Constrd'ction and Application of FL Teaching Resources Bank Based on Metadata Standards[J].Journal of Guangxi Vocational and Technical College,2010,4(3):5-7. 『6]CELTS-41.2002.教育部教育信息化技术标准委员会.教育资源建设技术规范:信息模型[s]. CELTS-41.2002.E—Learing Technology Standardization Committee.Technical Speciifcations on Construction for Educational Resource:Information Model[s]. [7]W3C.Extensible Markup Language(XML)[EB/OL].(20114)1-20).[2011-03—11].http://www-w3.org/xml・ [8]娄颖,李战怀,郭文琪.一种基于XML文档关键字检索的结构索引[J].计算机科学,2010,37(12):120一l24. LOU Ying,LI Zhan—huai,GUO Wen.qi.Sturcture Summary for Keyword Search over XML Documents[J].Computer Sci— 370 ence,2010,37(12):120—124. 吉林大学学报(信息科学版) 第29卷 [9]张亚斌.基于J2EE和XML的电子政务系统研究与实现[J].吉林大学学报:信息科学版,2010,28(6):643 646. ZHANG Ya—bin.Research and Implementation of E-Government System Based on J2EE and XML f J].Journal of Jilin Uni— versity:Information Science Edition,2010,28(6):643-646. [10]CHENG Wei—qing,GONG Jian,DING Wei,et a1.Application Type Identiifcation of Internet Flows Based Oil Medium Mathe— matics[J].The Journal of China Universities of Posts and Telecommunications,2010(6):72-79. [11]柳军,李彦武.高校数字化教学资源的校际间共建共享机制研究[J].中国教育信息化,2009(5):54.56. LIU Jun,LI Yan—WU.Research on Mechanism of College Di tal Resource Sharing and Construction[J].Chinese E—Leafing Technology,2009(5):54—56. [12]KRISNA ADIYARTA,NAOMIE SALIM.Metadata Management Model for Relational Database Publication on Grid:An On. tology Based Framework[J/OL].(2007-07-03).[201l-03—11].bttp://citeseerx.ist.psu.edu/viewdoc/download? doi=10.1.1.136.4609&rep=repl&type=pdf. [13]李思莉,李娟.XML文档到关系数据库的映射策略[J].计算机工程,2010,36(5):40-45. u Si—li,LI Juan.Strategy of Mapping XML Document to Relational Database[J].Computer Engineering,2010,36(5): 40_45. [14]张字,蒋东兴,刘启新.基于元数据的异构数据集整合方案[J].清华大学学报:自然科学版,2009,49(7): 1021—1024. ZHANG Yu,JIANG Dong—xing,LIU Qi—xin.Metadata—Based Integration Scheme for Heterogeneous Datasets[J].Journal of Tsinghua University:Science and Technology,2009,49(7):1021—1024. [15]BOLLEGALA D,MATSUO Y,ISHIZUKA M.Measuring Semantic Similitray between Words Using Web Search Engine[C] //www ̄07 Proceedings of the 16th International Conference on World wide Web.Canada:Banff Alberta,2007:757 ̄66. (责任编辑:刘东亮)