您的当前位置:首页正文

山东大学软件学院新工科大数据实验教学综合平台项目技术指

2020-12-01 来源:易榕旅网
山东大学软件学院新工科大数据实验教学综合平台项目

技术指标

采购人要求(用户填写)

配置序号配置名称详细技术参数要求一、功能要求管理节点作为所有用户访问平台的统一接口,负责其他设备监控和调度使用:1、支持用户单点登入身份验证,高并发场景下的用户控制;2、负责虚拟机的调度,支持过滤器和随机调度等方式3、SDN网络的控制器;4、作为镜像服务器,存储各种格式的镜像;5、桌面代理功能,负责流量转发;6、提供异步消息通讯功能;7、作为数据库服务器,存储数据。二、硬件要求1、标准2U机架式硬件;2、主机:采用INTELC620芯片组,最大支持两颗英特尔®至强®可扩展系列处理器;3、CPU:≥1颗,IntelXEONSilver41108C/16T2.1GHz11M85W;4、内存:≥64GB/DDR4/2400或2666MHz/ECC/REG;5、硬盘:≥2TBSSD;6、接口:≥2个千兆网口,为减少网络延迟,集成的双口千兆网卡必须支持I/OAT、负载均衡、链路汇聚、绑定冗余等特性。三、服务要求1、▲为保障内容与主流技术的同步性,厂商应具备提供云计算/大数据相关线上教学资源;提供的在线服务平台须通过ICP备案并具有增值电信业务经营许可证(提供备案证明文件及许可证证书复印件);2、使用方有权利要求中标公司在中标后3日内到校进行软件演示,证明中标公司的软件在以上每个指标是满足要求,如果有一项不满足则视为自动放弃中标资格。一、功能要求计算节点设备提供大数据实验实训的所有算力资源,是所有计算任务的承载体,虚拟机之间通过overlay的网络实现跨物理机的通讯;所搭载系统能够支持Qemu-KVM、Docker两种虚拟化技术的实验场景。1、支持服务虚拟机的稳定运行和虚拟机硬件设备的虚拟化实现;2、支持实时上报各自的虚拟机的运行状态,使用资源等信息;3、提供虚拟机的进度保存数据的持续化。数量1云平台控制设备12云平台计算引擎设备31二、硬件要求1、标准2U机架式硬件;2、主机:采用INTELC620芯片组,最大支持两颗英特尔®至强®可扩展系列处理器;3、CPU:≥2颗,IntelXEONSilver41108C/16T2.1GHz11M85W;4、内存:≥128GB/DDR4/2400或2666MHz/ECC/REG;5、硬盘:≥2TBSSD;6、接口:≥2个千兆网口;为减少网络延迟,集成的双口千兆网卡必须支持I/OAT、负载均衡、链路汇聚、绑定冗余等特性。1、云计算管理功能支持将所有计算、存储、网络、安全、大数据、物理机、应用模板、开发平台等都在云操作系统纳管下实现融合、联动。支持OpenStack+docker+kvm的混合云架构。通过标准OpenStack接口,云操作系统通过Nova接口对接主流虚拟机平台,通过Neutron对接网络/安全资源,通过Cinder/Swift对接存储资源,基于以上标准接口,并进行充分优化,支持分布式部署,横向弹性扩展;2、拥有高资源管理效率使跨系统的物理资源统一调配、集中运维,每个虚拟服务器的虚拟硬件设备都是标准化的,只需通过一个管理界面就支持完成对数据中心内所有服务器的安装配置、性能监控等管理任务。使得整个维护过程变得更专业化,流程化;3、强劲存储与挖掘能力平台支持融合负载、批量交互查询、数据挖掘和海量存储,多年历史数据即席查询等功能。支持完整的JDBC标准和ODBC标准,ODBC驱动兼容linux、windows(64位);4、虚拟化技术虚拟化融合了计算、网络、存储、安全资源的虚拟化,形成弹性的数据中心资源池,实现资源的自动化调度,更好地为上层应用服务。虚拟化后,虚拟机之间完全隔离,具有独立的CPU、内存、磁盘I/O、网络I/O,任何一个虚拟机发生故障,其他虚拟机不受影响,且不同虚拟机间操作系统支持异构;5、系统资源统计支持统计系统整体资源状态(包含CPU、内存、openstack硬盘、系统硬盘)、系统整体使用状态、主设备监控情况(最近一小时、最近一天、最近一周);6、▲系统告警支持当系统存在不正当的操作时,系统会进行告警,并记录相应信息,也可自定义查询系统告警,包含节点名称、警告类型(CPU、磁盘、内存)、警告状态(低风险、中风险、高风险),追溯系统告警(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);7、系统日志记录支持查看系统的使用情况,包括操作类型、操作行为、IP地址和操作3在线实验云平台12时间,提供≥20种操作类型的内容查询,对系统的使用情况进行追溯;8、系统磁盘清理支持设置单个节点磁盘使用量达到80%,自动清除系统中多长时间以前更新的操作视频,时间可选范围三个月、六个月、一年;9、学生管理支持学生账号管理,支持添加学生、批量删除、批量导入,也支持根据账号、姓名、院系来查找学生的信息;10、教师管理支持教师账号管理,支持添加教师、批量删除,也支持根据账号、姓名、院系来查询教师信息;11、班级管理支持对班级名称、学生人数进行管理及查询,支持批量删除;12、录制视频删除支持管理员随时清除学生录制的实验视频;13、教师内容信息管理支持管理教师内容信息,项目名称、所属技术方向、任务数、所属教师、更新时间等操作,支持批量删除项目,也支持通过项目名称、所属技术方向、所属教师来查询内容信息;14、共享内容信息管理支持管理共享内容信息,支持对项目名称、所属技术方向、课时数、所属教师、更新时间的管理;15、基础母本库管理支持管理基础母本库,母本名称、镜像分类、cpu、内存、磁盘、更新时间,支持通过母本名称、内存大小、CPU个数、磁盘大小来查询母本;16、公共论坛支持通过求助、分享、通知、公告四种途径查询帖子,同时支持输入帖子名称关键字查看发帖人、最后回复、查看/回复。1、教师课程信息管理支持管理教师课程信息,课程名称、任课教师、课程状态、时间、操作记录总大小、课程成果(查看账号、姓名、任务名称、项目名称),支持批量归档、批量删除、清除录像记录,也支持根据课程名称、任课教师、课程状态来查询课程信息;2、课程方向管理4虚拟实验系统门户支持专业和相关资源方向的添加、删除及查询;3、内置课程查看教师查看内置课程,可根据不同方向、职业、难度,筛选满足条件的课程;4、课程创建支持教师通过设置课程信息,上传相关资源新建课程,可自由选择实验体系组合,课程数量不受限制,能够随时编辑课程内容、修改上课信息等;315、课程归档支持教师对归档课程信息的管理和导出;6、课程详情支持教师查看课程详情,查看每门课程的详细指导、教学视频、任务环境、任务报告、任务习题,并支持对课程大纲及内容进行编辑,可添加自定义项目,可从所有课程项目库中选择课程项目、选择课程内容,并保存课程排序,课程大纲及内容可进行上移、下移、重命名、删除;7、课程资源上传支持教师上传xlsx,xls,doc,docx,rar,mp4,jpg,gif,png,pdf,ppt,pptx等类型文件;8、实验环境与视频同屏显示支持学生在做实验过程中进行实验视频的查看,实验视频与虚机同屏显示,支持实验视频全屏播放功能,实验视频播放过程中支持随时调整播放进度,支持实验视频的开始播放、暂停播放等功能;9、教师备课支持提前备课,支持针对课程安排提前熟悉实验环境,并支持详细指导与实验环境同屏显示;10、实验内容新建支持教师新建实验内容,并有向导式操作,包括实验项目信息和子任务的定义等内容的定义,项目信息需要包含所属技术方向、所属项目、任务类型、视频文件、课件、任务难度、任务卡内容、详细指导、任务环境、任务报告、任务习题等内容;11、实验内容共享支持教师自定义实验内容共享,只有教师保留删除该共享内容功能;12、自定义任务报告支持自定义任务报告,报告内容包括任务名称、学时安排、任务目标、任务目的、验收内容、干扰项等信息,验收内容支持添加多个填写验收条目及多行答案,支持对答案进行有序和无序的匹配方式;13、▲课程信息概况支持学生在我的课程和最近学习课程中查看课程信息概况,支持课程封面附近显示课程名称、已学进度(百分比)、用时量,显示学习至某实验任务、任课教师、课程状态、起止时间(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);14、环境引导支持实操环境常用功能操作、任务环境管理的引导;15、共享桌面支持共享桌面,学生在学习过程中支持通过共享桌面的功能,生成共享链接,让教师和其他同学支持通过链接进入该学生操作界面,并能够对桌面进行操作演示,协助完成实验任务;16、学生申请远程协助支持学生申请教师远程协助,进入远程指导页面后,也可查看请求信4息;17、任务延时支持任务延时功能,在既定的时间内没有做完任务安排,学生支持申请延时,每延时一次会增加10分钟任务时长;18、录像、发送内容支持学生对实操环境开始录制视频、停止录制视频、发送Ctrl+Alt+Del、发送选中的内容,其中发送选中内容支持将实验指导中内容发送至虚拟机终端中,提高实验效率;19、进度保存支持学生实时保存实验进度,再次进入该实验环境后自动显示上次的实验任务进度继续操作;20、Markdown实验笔记功能支持内置Markdown编辑器,直接通过Markdown环境编写实验笔记,可切换至全屏编辑状态并通过ESC还原;21、重修练习支持学生对教学实验内容进行重修和练习;22、学习进度统计支持学生学习进度统计,对项目进度进行监控;23、智能助手实验操作过程中,智能助手可缩小至操作界面右下角。要求智能助手智能感应鼠标,根据用户意愿智能打开任务习题入口,支持查看任务报告及智能索引随堂论坛;24、多种实验形式系统支持多种实验形式,包含VNC、WebSSH、Notebook、WebIDE等实验形式,其中VNC形式实验能够支持Linux或Windows系统;WebSSH形式的实验,实现高并发情况下快速级进入实验,支持直接在页面中输入命令进行实验操作;Notebook形式的交互编程实验,支持在线进行编程,一步一步地进行程序编写,并且支持直接运行出结果,方便调试代码,支持python3等流行编程语言,支持下载代码至本地;WebIDE形式实验,能够实现在线编程;25、虚机本地互传功能系统支持用户在本地通过SSH方式连接实验平台环境,支持本地数据、代码等资源上传到虚拟机,同时支持虚拟机中的文件下载至本地;26、编排模块支持教师自定义课程,教师通过新建课程,设置内容信息,需设置课程名称、课程方向、职业方向、时间等信息;设置课程资源,从本地上传实验所需要的文件;设置课程环境,点击创建环境,填写环境名称,选择硬件(包含CPU、内存、硬盘),选择软件(包含系统、服务和语言。系统可选Ubuntu,服务可选Hadoop、HDFS/MapReduce、MySQL、Hbase、Spark、Hive、Kafka、Flume,语言可选Python、Java、R语言),创建虚机过程中显示CPU、内存、硬盘信息和数据资源所在目录;保存环境后设置课程内容和排课信息,即可完成自定义课程组建;527、▲智能推荐支持学生学习过程中,系统自动为每个学生推荐各自薄弱的知识点(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);28、▲知识图谱系统提供知识图谱,用户对感兴趣知识点可一键查看相关实验(为保障产品功能真实性,必须提供功能截图并加盖投标人公章)。29、课堂互动系统支持教师在实验教学过程当中查看课程资源、发布随堂检测、学生做检测时教师可以随时获取结果、添加批注;30、不知道率支持系统检测学生学习行为数据,系统具备检测学生主观承认自己未掌握知识点的能力,会自动扣除相应步骤部分得分。31、镜像管理支持Windows、Linux两种系统分类,支持选择Docker、KVM两种系统类型;32、配置镜像支持自定义镜像配置名称、CPU核数、内存大小、硬盘大小等信息;33、自定开关任务描述支持自定义控制开启或关闭任务描述;关闭后学生端的任务指导不显示内容;34、实训课程信息概况支持学生查看最近实训完成进度及实训状态;35、任务制学习实训指导采用任务制形式进行学习,学习过程中学生支持提交阶段性实训成果,任务学习完成后支持进入下一个实训任务,直至任务全部完成;36、管理实验环境支持管理学生在使用的实验环境,重置学生异常的实训环境;37、实训成果查看支持查看学生实训用时、成果、报告及操作视频;38、实训内容查看支持查看实训内容,实训名称、课时数、任务数、实训时间、实训任务书、实训指导、实训课件、实训环境(母本名称、内存、CPU、硬盘、描述)。39、提供不少于4T的数据集。1、成绩管理支持实验任务得分、耗时、教师评价的统计与导出;5教学信息管理系统2、学生查看结束的课程支持学生查看课程信息及任务得分、班级排名和课程分数;13、教师审阅支持教师查看学生实验结果,并对学生的操作进行打分;4、▲分析整体课程6支持对课程整体的数据分析,可按照学生分析或班级分析,以饼状图和柱形图显示学生成绩比例分布、教师评价分布、学生自评分布、任务用时比例分布、任务报告比例分布、任务习题比例分布、任务步骤比例分布(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);5、成绩统计支持成绩按照A、B、C、D的维度进行统计,并搭配表格,说明各水平的学生人数;6、学生自评统计支持教师查看学生自评按照一星至五星的维度进行统计,并搭配表格,说明每个评价的学生人数;7、▲实验成绩统计学生端支持实验成绩统计功能,要求统计形式表格的形式展现,统计任务用时、任务步骤、课后习题、任务报告的得分情况,以柱形图、饼状图显示各阶段的分数占比、用时对比、正确率分布(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);8、课程评价查询系统支持查看每个学生得分和重修情况;9、自动评分系统支持根据学生实验操作行为,进行自动打分;10、学生自评支持学生在结束实验任务后,支持对自己的学习情况进行自评,评价成绩由一星到五星;11、查看操作详情支持学生在结束任务后查看自己的操作视频、报告情况,同时教师可随时查看学生答题情况;12、质量评价支持教师根据任务笔记、任务答题情况、任务报告内容和操作记录视频等情况,酌情对学生的任务完成质量进行评价,为防止评价误差,支持修改评价;13、项目考核支持教师在考核中查询学生完成情况,并进行打分,同时支持重置实验环境、成绩发布及导出。14、添加、编辑试题支持管理员添加新试题与查看编辑初始试题,试题类型包括单选题、多选题、判断题、填空题、简答题等5种题型,初始题目提供缺省分数及难易程度分类;其中,单选题、多选题、判断题、填空题可直接配置答案,系统将自动依据配置的答案及分值进行评分,系统支持对简答题答案自动判断,给出相应分数;15、创建试卷支持教师对考试时间、公共、题目、参考人及分数比例的设置来创建试卷,同时支持考试时间自动开启或无上限考试;16、考试成绩管理7支持教师试卷预览,支持系统自动评判考试成绩,并且教师能够修改学生考试成绩;17、查看公告及结果支持学生查看考试公告,支持作答单选题、多选题、判断题、填空题、简答题等考试题型,考试结束后,教师发布考试成绩,学生支持查看考试结果。18、▲系统态势展现支持系统态势展现,包括学生人数、教师人数、已发布课程数、已发布实训数、学生学习总时长,热门课程的排行的课程名称、学习总时长、人均总时长,滚动播放成绩发布动态,内容包含课程名称、专业、姓名、学号、任务得分、对应岗位,以饼图的形式展示出学习进度分布的人数与完成度,教师的星级评价以雷达图的形式展现人数,学习任务成绩分布以柱状图的形式展现不同等级的人数,最易出错的实验排名前五将课程名称与平均扣分(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);19、▲学生人物画像支持学生查看课程薄弱点、推荐任务、进度排名、发展方向和成绩(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);20、▲教师数据分析系统支持教师查看教学中的课程、在线人数及知识点错误率,并支持查看进步榜及错误来源(为保障产品功能真实性,必须提供功能截图并加盖投标人公章)。21、算法辅助学习平台(1)要求平台基于C/S架构设计;(2)需提供一键开机功能;(3)需包含Hopfield神经网络、BP神经网络、RBF、卷积神经网络、堆栈式自编码器、受限玻尔兹曼机、自适应学习率、RMSProp、Adam等深度学习算法内容;(4)▲需包含朴素贝叶斯、Logistic、Adaboost、GBDT、Bagging、RF算法、Xgboost、GMM、PCA、LDA、K-SVD、SVD、低维嵌入、APRIORI、FP-growth、KNN、决策树、支持向量机、随机森林、岭回归、多项式回归、K均值聚类、Ariori算法、AP聚类、均值漂移、层次聚类、DBSCAN等机器学习算法内容(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);(5)▲需包含梯度下降、牛顿法、共轭梯度法、鲍威尔法、变尺度法、单纯形法、蒙特卡洛法、随机搜索、遗传算法、模拟退火算法、粒子群优化算法、蚁群算法、罚函数法、复合刑法等优化算法内容(为保障产品功能真实性,必须提供功能截图并加盖投标人公章);(6)支持打开多页面后,通过右键单击操作进行刷新、关闭、关闭其他和关闭全部页面的功能,同时关闭全部页面时不会关闭首页;(7)需包含Compilers、ComputationalGeometry、Computer8Architecture、ComputerScienceEngineering|Technology、java、OperatingSystems、ParallelComputing等内容;需要提供代码编辑及运行环境;(8)需支持手动点击Run按钮运行代码,运行时需要实现算法列表、实现代码、流程图、运行结果同屏显示,能够实时同步运行进度条、代码流程图和每步代码运行结果。代码流程图可随着鼠标滚轮滚动来放大缩小;(9)需支持通过修改Interval的参数控制算法运行速度;(10)需提供Divide&ConquerAlgorithms、DynamicProgramming和BinarySearchTree算法,内容需包含Analysis;(11)需支持输入关键字搜索算法功能;(12)需要提供knight's_tour、NQueensProblem等Backtracking算法及实现代码;(13)需提供AffineCipher、caesar_cipher等Cryptography。并发访问授权许可单用户授权,可以自动识别教师、学生、管理员用户,无需在登录时选择用户角色,教师用户可以实现对教学课程、教学实验、教学环境的管理,学生用户可以实现对教师安排的实验课程的学习,管理员用户可以实现对系统本身的管理以及资源使用情况的监控。1、24个10/100/1000Base-T,4个复用SFP千兆端口(Combo);2、支持4K个VLAN;3、支持基于MAC/协议/IP子网/策略/端口的VLAN;4、支持基于源IPv6地址、目的IPv6地址、四层端口、协议类型等ACL;5、支持对端口入方向、出方向进行速率限制;6、支持用户分级管理和口令保护;7、支持防止DOS、ARP攻击功能、ICMP防攻击;8、LNP链路类型协商协议(和DTP相似功能);9、VCMPVLAN集中管理协议(和VTP相似功能)。1、尺寸:宽度600mm,深度1000mm,高度42U;2、前门:网门材质,带锁,可拆卸;3、后门:全金属材质,散热网孔设计,带锁,可拆卸;4、侧板:速装卸侧板,全金属材质。5、KVM切换器:VGA、键盘鼠标USB接口、IP远程16口机架式宽屏≥17吋液晶。模块提供基于Hbase技术的相关实验内容,实验总个数不少于20个,包含但不限于以下章节内容:(1)Hbase环境搭建;(2)HbaseShell操作;(3)HbaseAPI;(4)Hbase优化。每个实验须包含具体的实验目的,实验原理,实验环境,实验步骤等详细介绍说明;须包含实验所需要的任务环境,任务环境内须已完成基础环境的部署以及必备实验工具的安装。96507千兆网络交换机18机柜19海量数据库Hbase开发基础课程模块110hive数据仓库开发基础课程模块模块提供基于hive数据仓库技术的相关实验内容,实验总个数不少于30个,包含但不限于以下章节内容:(1)Hive环境搭建;(2)Hiveshell命令mysql;(3)Hiveshell命令-内置;(4)数据模型-mysql数据库;(5)数据模型-内置数据库;(6)Hivehwi操作;(7)hive自定义函数;(8)hive行业综合案例。每个实验须包含具体的实验目的,实验原理,实验环境,实验步骤等详细介绍说明;须包含实验所需要的任务环境,任务环境内须已完成基础环境的部署以及必备实验工具的安装。模块提供基于数据统计与分析技术的相关实验内容,能够涵盖EXCEL、SAS、SPSS等常用数据处理分析工具实验及实践内容,实验总个数不少于40个,包含但不限于以下章节内容:(1)图形处理;(2)Excel数据处理;(3)数据高级处理;(4)数据基础处理;(5)数据集的合与分;(6)Excel数据分析;(7)VB编辑器;(8)数据处理(包含但不限于数据有效性实现身份证验证);(9)SAS程序调试;(10)统计图表量的使用;(11)连续变量的统计;(12)相关分析和回归分析;每个实验须包含具体的实验目的,实验原理,实验环境,实验步骤等详细介绍说明;须包含实验所需要的任务环境,任务环境内须已完成基础环境的部署以及必备实验工具的安装。模块提供基于大数据平台搭建与运维、数据挖掘与机器学习、数据安全等方面的实验内容。1、大数据搭建运维相关实验总个数不少于190个,包含但不限于以下章节内容:(1)HDFSshell命令;(2)HDFS原理;(3)HDFSAPI操作;(4)zookeeper环境搭建;(5)zookeepershell命令;(6)zookeeperAPI操作;(7)zookeeper开源客户端curator框架;(8)sqoop环境搭建;(9)数据迁移-导入导出操作;10111数据统计与分析基础112大数据平台搭建与运维课程模块1(10)Sqoop其他操作;(11)MySQL数据库管理;(12)MySQL语法操作;(13)MySQL进阶;(14)MongoDB环境搭建;(15)MongoDB基础用法;(16)MongoDB高级用法;(17)Hadoop环境搭建与运维;(18)Kafka环境搭建与使用基础;(19)数据工具应用基础;(20)Linux基本操作;(21)Linux用户及文件权限管理;(22)Linux目录管理;(23)Linux文件管理;(24)linux任务管理器;(25)qemu-kvm介绍;(26)Libvirt介绍;(27)Virt-manager介绍;(28)网络虚拟化;(29)传统存储技术;(30)分布式存储介绍;(31)docker;(32)自然语言处理。2、数据挖掘与机器学习相关实验总个数不少于60个,包含但不限于以下章节内容:(1)R语言的环境搭建;(2)R语言基本操作;(3)R语言基本数据对象;(4)数据挖掘算法之统计模型;(5)数据挖掘算法之机器学习;(6)R语言挖掘QQ群聊天记录;(7)上海二手房分析案例;(8)线性回归;(9)逻辑回归;(10)聚类分析;(11)决策树分类算法(包含但不限于决策树鸢尾花分类、决策树-预测隐形眼镜类型);(12)K-近邻分类算法;(13)支持向量机;(14)遗传算法;(15)粒子群算法;(16)模拟退火算法;(17)朴素贝叶斯;3、数据安全相关实验总个数不少于30个,包含但不限于以下章11节内容:(1)信息隐藏技术(包含但不限于调色板图像隐写、DCT域图像水印、完全脆弱图像水印);(2)数据隐藏(包含但不限于在PDF文件中隐藏信息、在HTML文件中隐藏数据、Windows中的交换数据流隐蔽、VMware镜像中隐藏数据);(3)数据取证;每个实验须包含具体的实验目的,实验原理,实验环境,实验步骤等详细介绍说明;须包含实验所需要的任务环境,任务环境内须已完成基础环境的部署以及必备实验工具的安装。模块提供基于分布式计算MapReduce技术的相关实验内容,实验总个数不少于20个,包含但不限于以下章节内容:(1)MR2Yarn数据流;(2)MR2YarnShuffle;(3)MR2Yarn调优。每个实验须包含具体的实验目的,实验原理,实验环境,实验步骤等详细介绍说明;须包含实验所需要的任务环境,任务环境内须已完成基础环境的部署以及必备实验工具的安装。模块提供基于spark实时计算技术的相关实验内容,包含基础环境的构建、平台的二次开发,以及Spark开发语言的相关实验课程,实验总个数不少于80个,包含但不限于以下章节内容:(1)GraphX快速入门;(2)GraphX基础;(3)GraphX图计算;(4)内置图算法;(5)缺失的算法;(6)性能和控制;(7)spark环境搭建;(8)SparkRDD;(9)IDE开发环境搭建;(10)Spark行业案例(包含但不限于豆瓣用户电影推荐系统、基于决策树预测广告点击概率、模拟网站访问并统计访问量);(11)Scala环境搭建;(12)Scala基础语法(13)Scala数组;(14)类和构造器;每个实验须包含具体的实验目的,实验原理,实验环境,实验步骤等详细介绍说明;须包含实验所需要的任务环境,任务环境内须已完成基础环境的部署以及必备实验工具的安装。模块提供基于Hadoop大数据开发技术的相关实验内容,每章内容必须包含PPT、视频、备课材料、教学指导。实验总个数不少于200个,包含但不限于以下章节内容:(1)Hadoop平台搭建(2)Hadoop分布式文件系统1213分布式计算MapReduce开发基础课程模块114spark实时计算开发技术课程模块115Hadoop大数据开发技术基础课程模块1(3)并行计算框架MapReduce(4)数据传输工具Sqoop(5)数据采集Flume(6)分布式消息平台Kafka(7)深入理解KafkaProducer(8)深入理解KafkaConsumer(9)综合案例(包含但不限于IP欺诈检测)(10)HBase应用案例(包含但不限于电信语音详单数据表设计)(11)HQL高级分析函数(12)Sqoop数据迁移(13)Flink核心概念和开发环境配置(14)复杂事件处理(CEP)(15)FlinkonYARN(16)SparkCore核心编程(17)Spark架构原理与集群搭建(18)SparkStreaming实时计算(19)SparkSql数据探索与挖掘技术(20)SparkSQL结构化数据处理基础(21)SparkML机器学习实战(22)开发和部署Spark应用程序(23)sparkStructuredStreaming结构化流(24)SparkML机器学习基础(25)PySparkCore核心编程(26)PySpark架构原理与集群搭建(27)PySparkStreaming实时计算(28)PySparkSql数据探索与挖掘技术(29)PySparkSQL结构化数据处理基(30)PySparkML机器学习实战(31)开发和部署PySpark应用程序(32)PySpark结构化处理高级(33)PysparkStructuredStreaming结构化流(34)PySparkML机器学习基础(35)ElasticSearch基础(36)深入理解ElasticSearch(37)深入ElasticSearch(38)ElasticSearchJavaAPI使用(39)使用ik分词器模块提供基于数据可视化与BI技术的相关实验内容,实验总个数不少于60个,包含但不限于以下章节内容:(1)地域空间可视化;(2)概念可视化;(3)面积可视化;(4)图形可视化;(5)Echarts的可视化应用;1316数据可视化与BI课程模块1(6)Echarts复杂数据类型可视化;(7)Highcharts图表使用;(8)graphpad制图;(9)MATLAB编程及可视化;(10)可视化工具与设计;(11)D3.js基础;(12)D3.js可视化实现;(13)Tableau安装和基础;(14)Tableau可视化数据分析。每个实验须包含具体的实验目的,实验原理,实验环境,实验步骤等详细介绍说明;须包含实验所需要的任务环境,任务环境内须已完成基础环境的部署以及必备实验工具的安装。模块提供基于数据采集与预处理技术、大数据行业综合应用案例、数据科学竞赛案例相关的相关实验内容:1、数据采集与与预处理实验总个数不少于50个,包含但不限于以下章节内容:(1)数据采集与预处理概述;(2)网络数据采集;(3)日志数据采集;(4)数据的预处理;(5)数据采集与预处理综合应用;(6)数据库数据的采集和预处理;(7)数据采集、数据预处理与大数据;(8)storm编程基础;(9)Storm高级编程;(10)Trident框架实例;(11)flume环境搭建;(12)flumesink配置操作;(13)flumesource配置操作。每个实验须包含具体的实验目的,实验原理,实验环境,实验步骤等详细介绍说明;须包含实验所需要的任务环境,任务环境内须已完成基础环境的部署以及必备实验工具的安装。2、大数据行业综合应用案例需提供不少于15个综合应用案例。案例包含详细的项目背景介绍,项目实验指导,关键步骤源码以及源码注释、同时案例实训环境通过多台云主机形式为学生提供,学生在进行项目实训过程中能够具有独立的环境。需包含但不限于基于以下案例:(1)搜狗新闻实现朴素贝叶斯分类算法;(2)爬取并统计分析网站发表热门文章;(3)电影评分数据统计分析;(4)OTA离线数据分析平台;(5)电信离线日志数据分析;(6)电信运营商离线数据分析平台;(7)京东用户行为统计分析;1417数据采集与预处理课程模块1(8)商城用户行为分析(综合应用);(9)基于淘宝数据预测回头客群体;(10)京东商城数据分析平台(11)Hadoop离线数据分析实训;(12)ETL工具离线日志采集与清洗实训;(13)Python大数据分析挖掘与智能推荐综合实训;(14)多场景数据可视化综合实训;(15)Hadoop大数据系统搭建与运维实训。3、数据科学竞赛案例提供不少于12个案例资源。案例包含详细的项目背景介绍,项目实验指导,关键步骤源码以及源码注释、同时案例实训环境通过Notebook形式为学生提供,学生在进行项目实训过程中能够具有独立的操作环境。需包含但不限于以下案例:(1)抓黑产用户;(2)广告点击率预测;(3)国能日新光伏预测;(4)汽车目的地智能预测;(5)玩家付费预测;(6)微博热度预测;(7)自然语言处理之文章关键词提取;(8)自然语言处理之长文本分类;(9)量化投资建模;(10)用户贷款风险预测;(11)微额贷款人品预测;(12)轴承故障预测。15

因篇幅问题不能全部显示,请点此查看更多更全内容