您的当前位置:首页正文

区域教育大数据中心平台建设探讨

2021-03-10 来源:易榕旅网
区域教育大数据中心平台建设探讨} 徐超超 陈世超 赵鑫硕 杨现民 (江苏师范大学智慧教育学院,江苏徐州221116) 摘要:智慧教育正在引领新一轮区域教育信息化发展与改革的浪潮,而教育大数据是实现区域教育系统“智慧 化”升级改造的基础。文章在定位区域教育大数据中心平台价值的基础上,重点对区域教育大数据中心平台的 架构进行了设计,并对平台建设与运营中存在的三大关键问题——教育数据的适度开放、教育数据的全面治理、 教育数据的创新应用进行了初步探讨,期望能够为各地区教育大数据中心平台建设提供一定的指导和参考。 关键词:智慧教育;教育大数据中心;区域教育信息化;平台建设 【中图分类号】G40-057【文献标识码】A【论文编号】1009-----8097(2016)l1—OO05__一08[DOI]10.3969/j.issn.1009.8097.2016.11.001 智慧教育是信息技术与教育发展高度融合而产生的新型教育模式,是国际教育信息化发展 的新方向…。2014年8月,国家发改委、财政部、住建部等八部委联合发布《关于促进智慧城 市健康发展的指导意见》,提出到2020年建成一批特色鲜明的智慧城市。智慧城市建设工程的 启动与大力推进,为区域智慧教育的发展提供了契机。目前,国内一些信息化先行城市(如北 京、上海、宁波、深圳等),已开始着力推进区域智慧教育发展规划与建设方案的制定及实施。 智慧教育正在引领新一轮区域教育信息化发展与改革的浪潮,从数字化教育走向智慧教育已成 为时代发展的必然要求L2J。教育大数据是实现区域教育系统“智慧化”升级改造的基础,教育数 据挖掘和学习分析技术是连接教育大数据与智慧教育的桥梁【3]。海量数据的汇聚与深度挖掘,将 赋予教育系统“大智慧”,促进教育决策科学化、教学环境宜人化、教学模式个性化、教育管理 智能化、教学活动智慧化。在大数据时代,教育数据有望成为推动教育系统创新与变革的重要 力量,教育发展与改革正在走向“数据驱动”模式。 当前,区域教育信息化的建设正在逐步走出“重建轻用”的泥潭,走向“应用驱动”的发 展模式。应用系统的按需建设及其与教育教学实践的深度融合,成为了区域教育信息化发展的 战略目标。国内已有学者分别对区域智慧教育云服务体系【4]、智慧教育云平台构建方法与技术[5】、 区域教育资源共建共享平台【6儿 、城市终身教育公共服务平台L8儿9J等进行了初步探讨。然而,随 一 一着大数据理念的传播和教育数据资产意识的增强,如何有效管理区域教育数据、如何构建区域 教育大数据中心平台、如何实现区域教育大数据的运营与创新应用等,这些现实问题在各地区 推进区域智慧教育发展的过程中仍有待解决。基于此,本研究将分析区域教育大数据中心平台 的价值定位,重点设计区域教育大数据中心平台的架构,并对平台建设与运营中的关键问题进 行初步探讨,期望能够为各地区教育大数据中心平台的建设提供一定的指导和参考。 区域教育大数据中心平台的价值定位 区域智慧教育的健康发展离不开信息化平台的支撑。当前,国内诸多地区己启动智慧教育 综合服务平台的新一轮规划与建设工作。区域智慧教育综合服务平台是在智慧教育理念的指导 下,全面支撑区域智慧教育业务开展,采用一体化架构、可灵活扩展的信息化系统,包含若干 支撑具体教育业务开展的应用系统 旧】。要实现各应用系统的有效集成和数据共享、为教育决策 5 or1.26 N0.n 20l6 Ⅺ: j 叠 的科学制定提供可靠数据支撑,就需要建立以教育数据管理和利用为核心业务的教育人数据中 心。区域教育大数据中心平台的价值定位主要体现在如下 L个方面: l教育大数据中心是智慧教育综合服务平台的“核心模块” 教育大数据中心是火规模数据存储和信息流通的中间节点,为全区提供教育数据共享服务。 其首要任务是从各个数据源集成数据并保持同步更新,保证 域教育数据采集与交换的及时性、 完整性和一致性,成为各个应用系统之间的共享数据通道,彳彳效解决区域教育信息化发展过程 中长期存存的“信息孤岛”【JlJ问题。 2教育大数据中心是区域教育事业快速发展的“战略资产” 在大数据时代,数据逐渐成为一种无形的资产I1 。以荚因、英国、法因等为代表的发达国 家率先将大数据作为新型战略资源,视其为“未来的石油”。而存教育领域,西方发达国家也己 ,尢行一 步,纷纷加速部署教育人数据战略,强化教育人数据战略资产意识。教育大数据中心通 过持续'7Ir=聚海量的教育数据,将成为区域教育发展与改革的强大动力和重要资本,并有助于催 生教育数据相关产业,带动区域经济的发展。 3教育大数据中心是破解教育发展与改革难题的“科学力量” 教育大数据是一座可无限开采的“金矿”,对其进行深度的挖掘与应用是实现数据“资产” 增值的重要途径。当前区域教育发展面临均衡发展、质量提升、减负、择校等诸多难题,教育 大数据中心可提供科学的数据分析与决策支持为其寻求有效解决之道。教育大数据中心不仅是 数据的汇聚中心,更是教育“智慧”的创生中心。基于教育数据提供各种智能化的教育应用(如 智能统计分析、教育发展评估与危机预警、教育决策支持等),足教育大数据中心的核心功能。 二区域教育大数据中心平台的架构设计 1体系架构 为了实现全区教育数据的规范管理,保证数据在不同的系统问能够根据需要快速、安全共 享,就需要将重点放在教育大数据中心的建设上。本着“数据一致,按需共享”的原lj14,本研 究设汁l『【 域教育大数据中心平台体系架构,如图1所示。 i。i{  } 。 。蟪 臁坑 愿 坑2 l 麟坑3 { 孵抗n l’ _ ‘ l” 新 坑’ 瑚景靴 触 坑 l ’ 癯最帅 图1 区域教育大数据中心平台体系架构 6 数据采集与存储是区域教育大数据中心平台的基本功能。教育大数据中心的数据源主要来 自众多子信息化应用系统,包括己有的系统和新建设的系统。为了保证数据的一致性,教育大 数据中心与应用系统数据源间的数据必须通过手动或自动实现数据更新一一原有系统由于在建 设之初没有严格按照相关教育信息化标准进行建设,采用的技术路线、架构模式多不相同,造 成了数据交换上的困难,因此进行数据更新时需要首先采集数据,然后对数据进行规范化格式 转化,生成符合信息化标准的数据格式,最后数据入库,实现异步数据更新。新建系统可以采 用Web Service技术开发,数据结构要严格按照教育信息化规范设计,并通过XML更新文件动 态觉察信息化应用系统的数据变化,实现同步更新。教育大数据中心所有的数据要严格按照教 育信息化标准(如教育资源建设标准、学习对象元数据标准、教育管理信息系统规范、教育信 息系统互操作规范等)进行建设,不符合规范的数据需要经过数据整理方可进入教育大数据存 储中心;同时,应用先进的云存储技术,构建海量异构数据资源存储体系,分类存放各种结构 化、半结构化和非结构化的过程数据、预测数据、汇总数据等。 系统结构的上端分别是区域教育大数据的管理中心和挖掘中心。其中,管理中心负责对采 集到的结构化、半结构化以及非结构化教育数据进行系统管理,核心功能包括元数据管理、主 题管理、数据采集、数据存储、数据同步、数据交换、安全管理、角色与权限管理、运营管理、 系统设置、教育数据挖掘、可视化分析与呈现等。通过前端的管理界面,可实现对教育数据的 简单、快捷、可视化管理,提高数据管理的透明度和数据管理的效率。挖掘中心则旨在根据教 育业务的发展需求,制定合适的挖掘策略,灵活采用各种数据挖掘工具与算法,对现有教育数 据进行深度挖掘与分析。挖掘中心是实现教育数据价值的关键,除了基础的报表统计分析,还 提供教育发展趋势预测、关联分析、资源智能归类、师生聚类分析等多种高阶数据处理应用, 分析的结果通过可视化方式直观呈现。 2主题库 教育大数据中心作为全区教育信息存储、流通、共享的关键系统,设计时应尽可能地涵盖 区域教育部门的所有关键信息。针对不同的业务需求,区域教育大数据中心应包含不同的主题 库,各主题库又可包括若干细分的子主题库;同时,主题库中应有若干个数据表,以存储来自 不同应用系统的数据,其主题库列表如表1所示。 3核心功能 (1)元数据管理 这里的元数据是指管理系统中各数据表及字段的真实涵义。元数据管理主要完成对教育大 数据中心数据库结构的管理维护工作,即对教育大数据中 tk,标准表的原数据进行登记,以方便 日后的数据管理,具体功能包括表的注册、字段注册、数据库结构更新等。另外,在元数据的 管理中还涉及元数据的分类,即根据信息子集的分类,将标准库分成业务人员熟悉的类型,以 方便业务人员查找。对于某些需要特别关心的数据可以进行CheckPoint记录,以便跟踪和统计 一一这主要针对的是一些敏感数据,需要知道其来龙去脉,如有哪些人在哪些时间进行了哪些 操作,记录下来以便日后查找。 (2)主题管理 主题管理包括主题库的建立和主题对象的管理。针对某一主题的相关信息一般并不是从唯 一的一个库里面获取的,故若想全面利用信息,就需要构建一个综合性的主题库。比如,对一 7 个教师来说可形成一个数据主题,即与该教师相关的信息集成一一人事管理系统中有基本信息、 档案信息、工资信息、异动信息等与该教师相关,就可将这些信息数据归入教师主题之中;以 此类推,科研管理系统和教务管理系统中该教师的相关信息数据也可集成过来,最终形成一个 用户自定义的完整的教师主题。主题对象管理的具体功能包括:主题对象生成、主题对象权限 管理、主题对象查看、主题对象展示等。 表I 区域教育大数据中心的主题库列表 主题库 学校信息库 统一主要数据来源 用户管理,校园门户网站群管理系统 备注 存储与学校相关的数据,包括学校基 本信息、相关资讯动态信息等 教职工基 人事管理系统,智能教务管理系统,绩效考核管理系统 存储国家规定的教职 :基本信息,与 础信息库 学籍库 学籍管理系统 国家教职工管理信息系统的数据同步 存储国家规定的学籍信息,与市学籍 管理系统的数据同步 互动教学系统,智能教务管理系统,网络备课系统,网 教师教学与 络课堂系统,网络教研系统,教师培训管理系统,教科 存储与教师相关的教学信息及其自我 成长信患库 研评比活动管理系统,教师成长档案系统,学困生辅导 成长信息,存储教师的学习行为与教 系统,学科教研博客群,家校互动系统 互动教学系统,研究性学习系统,网络课堂系统,智能 学行为数据 学生学习与 考试系统,智能教务管理系统,电子作业系统,学生成 存储与学生相关的学长档案系统,综合素质测评系统,综合素质教育系统, 成长信息库 学困生辅理系统,心理健康监测系统,心理咨询系统 习信息及其自我 导系统,健康体检数据管理系统,学生德育管 成长信息,存储学生的学习行为数据 存储各种课程资源、课程实施过程数 课程库 网络课堂系统,教学录播直播系统,智能教务管理系统 据、课程管理过程数据 存储试题、试卷信息,存储学生考试 试愿试卷库 智能考试系统 成绩库 智能教务管理系统 过程与结果数据 存储学生各科课程成绩信息 科研库 资源库 教材库 公文库 教育科研管理系统 网,存储科研成果和科研项目信息 教学资源管理系统,数字图书管理系统,学科教研资源 存储各种形态的教学资源和资源使用 教学录播直播系统,教育云网盘系统 过程数据 智能教务管理系统 办公自动化系统 存储教材信息 存储公文信息和各种公文审批、流转 的过程数据 设备资产库 设备资产管理系统 财务库 财务管理系统 存储设备、资产信息和使用过程数据 存储工资、报销等财务信息 (3)数据采集 数据采集是数据中心的核心业务,主要通过数据访问接口实现数据的共享传输。数据采集 是实现数据集成、数据交换的前提,系统管理员可以灵活选择数据的采集源一一可以是某个信 息化应用系统的数据采集,也可以是某类主题的数据采集;采集的时间、数据的生命周期等也 都可以灵活设置。采集到的数据应进行数据格式转换与数据清洗,检测数据中存在的错误和不 一致并剔除或者改正它们,从而提高数据质量,保证全区数据的规范性、一致性。 (4)数据存储 教育大数据中心部署云存储网络,除了应用DB2、MySQL、Oracle、SQL Server等常规关 系型数据库,还应充分利用CouchDB、MongoDB、Redis等非关系型数据库,以根据不同存储 业务对读写速度、存储效率、访问性能、扩展性、安全性等的具体需求灵活部署、优化组合。 (5)数据同步 共享数据中心与数据源的各个应用系统数据库应保持同步更新,提供多种灵活的同步策略, 如实时更新、定期更新、增量更新等。除了支持区域智慧教育综合服务平台内部各应用系统间 的数据同步,还应支持与省、市、区等其它部门相关业务系统(如市人事管理系统、资产设备 管理系统、学籍管理系统等)的数据同步。 (6)数据交换 教育大数据中心建设的重要价值在于数据共享,而数据交换正是实现数据共享所必不可少 的技术手段。教育大数据中心通过数据采集,将不同应用系统的数据进行标准化改造,转换成 符合特定教育信息化规范的数据。不同的应用系统通过到教育大数据中心提取数据,实现教育 信息的共享。此外,区域教育大数据中心还应按需为其上级教育管理机构提供数据,如向省、 国家教育管理信息系统提供所需的学籍信息、教职工信息等。 (7)安全管理 数据安全管理主要负责系统数据的安全保密,是系统配置与管理中的重要一环。教育大数 据中心对数据的备份策略、恢复机制、加密策略、数据清理等都有很高的要求,要求管理员: ①手工配置数据库备份的方式、频率,备份的位置,以及备份的技术如数据镜像复制技术、虚 拟存储技术、快照技术、SAN技术等;②在平台中手动恢复数据库;③选择数据加密的方式(如 MD5、RSA、IDEA、DES等),敏感数据通过密文的方式在网上传输;④加强用户密码安全管 理;⑤定期进行数据冗余检查,发现冗余数据即时清理,使已经过时的陈旧数据能通过系统自 动删除,以节省存储空间;⑥当系统运行出现问题时,通过查看系统自动记录的所有用户关键 操作信息的日志,了解系统问题的产生原因并及时解决,保证系统平稳、安全地运行。 (8)角色与权限管理 角色与权限管理是整个系统安全运行的基础,注册用户必须分配某种角色后才能享受特定 的服务。不同角色的权限分配直接影响用户享受服务的质量和水平,权限控制不当将会给系统 的安全带来潜在威胁。角色与权限管理的具体功能包括:角色管理、添加角色、删除角色、修 改角色、用户角色分配、角色权限关联、群组管理等。 (9)运营管理 教育数据是一笔公共资产,一方面我国应在保护隐私的情况下将其适度开放,同时借鉴美 国、英国、澳大利亚等政府开展的公共数据开放运动,将区域教育数据适度开放给对教育领域 q 数据应用感兴趣的决策人员、学者、程序员、企业和社会公民,以提高教育数据的利用率;另 一方面需要强化运营管理和监控功能,实现对各种数据应用情况的实时监控,并通过管理者动 (10)系统设置 态地调整数据的公开程度,建立相关的网络审批机制,以保证教育数据运营的合法性。 系统主要设置教育大数据中心与各应用系统间的更新时间、更新频率、更新方式以及数据 保存期限、数据备份策略、在线最大用户数、界面风格等。 (11)教育数据挖掘 教育大数据中心将有效集成数据挖掘领域常用的数据挖掘与分析方法(如关联分析法、聚 类分析法、分类分析法、异常分析法、特异群组分析法、演变分析法等),并将现有较为成熟的 挖掘算法与开源工具集成到教育大数据中心平台,一方面便于对各业务系统的数据进行常规的 数据挖掘,另一方面可以在此基础上构建多种更具针对性的分析模型(如课程学习成功预测模 型、区域教育均衡发展趋势预测模型、学生学习障碍诊断模型、教师教学行为诊断模型等)。 (12)可视化分析与呈现 为了让教育管理者、教师、学生、家长等能够更加直观地理解教育数据挖掘和各种教育统 计分析的结果,教育数据需要从“不可见”向“可视化”转变。因此,教育大数据中心平台需 内嵌多种可视化算法,以便将中小学学业成就评价、学习行为分析、体质健康评价、本科教学 质量评估、教育信息化与教育现代化发展评价等在内的各种教育评价与评估结果,根据需要以 统计图表、时间线、知识地图、网络图、层级结构图、数据流图等多种方式灵活展现。 三平台建设与运营的关键问题分析 在全球化公共数据开放运动的大背景下,开放教育数据是大势所趋。然而,区域教育大数 据中心平台的建设是一个系统化的工程,当前面临的最大挑战不是技术,而是平台的管理和运 营。比如,美国的教育大数据存储机构inBloom仅仅运行了15个月便关闭,主要原因便是教育 数据开放过程中导致的安全问题。基于此,区域教育大数据中心平台的可持续发展,迫切需要 解决三大关键问题: 1教育数据的适度开放 教育数据是一种公共数据,本身具有一定的社会公益性,应当向社会适度开放。教育大数 据的适度公开,将汇聚广大民众、企业、政府等多方智慧,使教育数据资产实现持续增值。但 由于面临隐私保护问题,因此必须配套相关的数据保护机制和措施,既保证数据的安全,又能 激发数据的活力,以实现教育数据价值的最大化。 此外,对于教育数据的开放程度、开放范围、开放对象等都应进行深入的论证,以确保教 育数据使用的合法性,并确保教育数据的使用有利于区域教育的创新发展,而非阻碍、破坏、 甚至危及社会的安全。为此,政府部门应对教育数据加强监管,参考通信领域颁发运营商牌照 的方式,制定教育数据运营商准入标准并颁发运营牌照。非官方机构想进行教育数据的研究与 使用时,需按规定满足相应的条件并取得许可资格,才能获得教育数据的使用权限。 2教育数据的全面治理 当前,我国区域教育信息化在发展过程中存在的数据问题主要包括:数据采集较为困难、 数据尚未有效整合、数据质量和可用性不高、数据利用率低、数据服务单一化等。基于此,高 10 l【= 水平的区域教育大数据治理需要各级教育机构、管理部门、相关企业以及社会民众的集体参与 和有效协同,以对教育数据进行更加精细的分类和分层管理。 区域教育大数据中心平台需要提供全流程教育数据治理的各项功能支持。一般而言,教育 大数据治理工作主要包括:教育数据的分类管理、教育数据的全流程管理、教育数据的质量管 理与提升、教育数据的安全管理。其中,教育数据的全流程管理需要以教育数据分类所形成的 数据集合为基础,构建教育数据从采集、处理、存储、分析到应用的一体化业务流程,为教育 数据的质量管理和安全管理工作提供能力支撑。围绕教育数据的全面治理,可以研发各类教育 大数据产品,构建一个完整的教育数据服务体系。区域教育机构通过大范围的教育产品应用和 交互式服务供给,能够加强教育数据的统筹治理能力,进而推进教育政策的科学制定,逐步提 升教育服务水平。 3教育数据的创新应用 随着教育数据开放程度的不断加深,非结构化的教育数据不断增加,教育数据挖掘的原材 料越来越丰富,数据的价值也越来越凸显。利用教育数据挖掘技术和学习分析技术构建教育领 域相关模型,探索教育变量之间的相关关系,为教育教学决策提供有效支持,将成为未来教育 的发展趋势【J引。教育数据的应用需遵循“价值最大化”的原则,充分利用数据挖掘、学习分析、 BI、机器学习、可视化等技术,对纷繁复杂的教育数据进行多角度、多路径的分析(如关联分 析、聚类分析、回归分析、决策树分析、神经网络分析),以充分挖掘教育数据隐藏的价值。 结合教育发展需求进行教育数据价值的深度挖掘,是区域教育大数据中心价值“落地生根”的 根本途径。针对当前区域教育发展与改革所面临的均衡发展、质量提升、减负、择校等难题, 广大教育研究者和实践者应转变问题的思考方式,培养数据思维,尝试应用教育大数据来予以 破解。教育大数据的创新应用价值主要体现在大数据驱动教学模式的改革、大数据驱动个性化 学习的真正实现、大数据驱动教育管理的科学化、大数据驱动教育评价体系重构、大数据驱动 科学研究范式转型、大数据驱动教育服务更具人性化等方面。当前,全国各地应加快各种数据 应用模式的积极探索,不断提炼总结若干典型、有推广价值的案例,明确教育大数据的应用思 路,从而引导全国各地的教育行政机构、学校、教育培训企业等合理应用教育大数据,有效发 挥教育大数据的创新应用价值。 参考文献 [1】陈琳,陈耀华,张虹,等.教育信息化走向智慧教育论[J].现代教育技术,2015,(12):12—18. 【2】杨现民,余胜泉.论我国数字化教育的转型升级 .教育研究,2014,(5):86-93. [3】柯清超.大数据与智慧教育[J】_中国教育信息化,2013,(24):8—10. [4】张进宝,黄荣怀,张连刚.智慧教育云服务:教育信息化服务新模式[J].开放教育研究,2012,(3):20—26. [5】葛虹.基于云计算理念的区域“智慧教育”构建探索[J].中国教育信息化(基础教育),2012,(10):72—74. [6]贺志强,韩政涛,贺龙祥,等.教育资源建设平台的发展与展望——从单机版资源库到校园网资源管理平台,再到 区域资源共建共享平台[J].现代教育技术,2009,(4):67—72. [7】陈琳,王矗,李凡,等.创建数字化学习资源公建众享模式研究[J].中国电化教育,2012,(1):73—77. 1 1 X 【8]莫淑坤,韩竞,尹飞,等.内蒙古数字化终身教育公共服务平台构建路径[J】.广播电视大学学报(哲学社会科学 版),2013,(3):95.101. 【9】陈琳,王矗,陈耀华,等.终身学习信息资源建设的战略意义与模式创新[J].现代远程教育研究,2012,(4):41—46. [10]杨现民.区域智慧教育综合服务平台建设与关键问题探讨[J].现代远程教育研究,2015,(1):72—81. [11]余胜泉,赵兴龙.基于信息生态观的区域教育信息化推进【J]_中国电化教育,2009,(8):33-40. [12]罗铮.浅析大数据时代的数据挖掘与数据资产运营[J].电子技术与软件工程,2013,(24):212.213. f13]徐鹏,王以宁,刘艳华,等.大数据视角分析学习变革——美国《通过教育数据挖掘和学习分析促进教与学》报告 解读及启示[J].远程教育杂志,2013,(6):11-17. The Construction of Big Data Center Platform for Regional Education XU Chao.chao CHEN Shi-chao ZHAoⅪn—shuo Y NG)(ian.rain (SchoolofSmartEducation,JiangsuNormalUniversity,Xuzhou,Jiangsu,China22111 Abstract:Smart education is leading a new round of development and reform wave for regional education informatization,while big data is the basis to realize the‘‘smart”upgrading of regional education system.Based on the value orientation of big data center platform in regional education,this paper focused on he archittecture design of big data center platform.In addition,this paper discussed three key issues existing in he consttruction and operation of this platform that included appropriate opening of education data,comprehensive management of education data and innovative application of education data,expecting to provide guidance and reference for the construction and development ofbig data center platform in various regions. Keywords:smart education;educational big data center;regional educational informatization;platform construction 基金项目:本文受国家级大学生创新训练计划项目“开放知识社区用户编辑行为分析与支持能力提升研究”(项 目编号:20151 0320059)、江苏高校优势学科建设工程资助项目“江苏师范大学教育学省优势学科建设”(项目 编号:苏政办发[2 014]37)资助。 作者简介:徐超超,研究方向为智慧教育、开放知识社区,邮箱为tiantiandexuanlu ̄qq.com。 收稿日期:2 016年8月30日 编辑:小米 12 

因篇幅问题不能全部显示,请点此查看更多更全内容