教育大数据总体解决方案(1)

党的十九大明确提出建设教育强国是中华民族伟大复兴的基础工程,必须把教育事业放在优先位置,深化教育改革,加快教育现代化,办好人民满意的教育。到2020年教育现代化取得重要进展,2035年总体实现教育现代化、迈入教育强国行列的总体目标。教育优质化、普及化、公平化、终身化和创新服务能力反映了教育现代化的主要内涵,教师队伍专业化、治理现代化、信息化、国际化是教育现代化的重要支撑。

教育现代化以国家现代化建设的总体战略目标为依据,涵盖了体系结构、普及水平、教育质量、人才培养结构、服务贡献能力等教育现代化的目标要求,是教育高水平的发展状态,是对传统教育的超越,是教育发展理念、发展方式、体系制度等全方位的转变。围绕加快教育现代化,提高教育质量,促进教育公平,优化教育结构是推进教育现代化的重要着力点。加快信息化时代教育变革,推动教育组织形式和管理模式的变革创新,以信息化推进教育现代化。

    1. 教育信息化是教育现代化重要内容和标志

人工智能、大数据、区块链等技术迅猛发展,将深刻改变人才需求和教育形态。智能环境不仅改变了教与学的方式,而且已经开始深入影响到教育的理念、文化和生态。教育信息化具有突破时空限制、快速复制传播、呈现手段丰富的独特优势,必将成为促进教育公平、提高教育质量的有效手段,必将成为构建泛在学习环境、实现全民终身学习的有力支撑,必将带来教育科学决策和综合治理能力的大幅提高。以教育信息化支撑引领教育现代化,是新时代我国教育改革发展的战略选择,对于构建教育强国和人力资源强国具有重要意义。没有信息化就没有现代化,教育信息化是教育现代化的基本内涵和显著特征,是“教育现代化2035”的重点内容和重要标志。

    1. 大数据驱动教育信息化发展

教育在大数据技术与理念的冲击下正在发生一场“静悄悄的革命”,教学范式的转型成为这场革命的先导和核心。伴随着教育数据的持续累积与深度挖掘,大数据在构建新型教学生态、助力教学结构变革、再造教学流程方面的作用日益凸显。

在数据驱动教学范式下,教学结构从四要素(教师、学生、媒介、内容)转变为五要素(教师、学生、媒介、内容、数据),数据作为一种新的生态要素出现在教学系统中,并为整个系统的运转提供智慧能量。通过教学大数据的深度挖掘和多元分析,能够将数据背后反映的教学意义与价值清晰地呈现出来,进而帮助教师在课前进行精心的教学设计,课中进行精细的授导、精炼的研习与精准的评估,课后进行精益的辅导。

各地中小学校的信息化环境大大改善,为教学过程与结果数据的多维度、全程化采集创造了良好的条件。贯通课前、课中与课后的教学数据流正在生成,数据驱动的教学设计、教学组织与管理、学业辅导等教学业务开始走向精准化、精细化和精益化,大数据具有重构课堂教学流程与教学生态的潜能。

教育数据的价值不会自然产生,而是靠机器的分析与挖掘来获得的。学习分析技术可以从大量的数据中提取未知的、具有潜在价值的教与学的信息,进而辅助教师进行更科学、更高效、更精准的教学决策,帮助学生认识更真实的自己(学科优势、知识缺陷、学习偏好等)。数据驱动教学的成功实践离不开学习分析技术的强力支持。

    1. 政策指导大数据推动教育变革

为推进教育改革发展,实现更高质量、更加公平、更有效率、更可持续的发展,各级政府对教育信息化提出了具体要求。

《国家教育事业发展“十三五”规划》中提出“鼓励学校利用大数据技术开展对教育教学活动和学生行为数据的收集、分析和反馈,为推动个性化学习和针对性教学提供支持。支持各级各类学校建设智慧校园,综合利用互联网、大数据、人工智能和虚拟现实技术探索未来教育教学新模式。”

《中国教育现代化2035》中提出“建设智能化校园,统筹建设一体化智能化教学、管理与服务平台。利用现代技术加快推动人才培养模式改革,实现规模化教育与个性化培养的有机结合。创新教育服务业态,建立数字教育资源共建共享机制,完善利益分配机制、知识产权保护制度和新型教育服务监管制度。推进教育治理方式变革,加快形成现代化的教育管理与监测体系,推进管理精准化和决策科学化。”

《四川省中长期教育改革和发展规划纲要(2010—2020年)》中要求“以省级教育管理信息系统建设为抓手,加强学校管理基础资料、数据收集整理,促进学校管理标准化、规范化、信息化,推进政府教育管理信息化。加强中小学校园网建设,逐步建成数字化校园。加快省、市、县三级教育资源公共服务平台建设,逐步扩大网络教育资源服务覆盖率。”

《成都市教育事业发展“十三五”规划》中要求“鼓励各级各类学校建立支持学校发展和管理决策的数据系统,推动管理信息化与教育教学创新的深度融合,促进学校决策支持科学化、管理过程精准化和教学分析即时化。实施学生成长、教师教学行为数据归集计划,推行基于大数据分析技术的评价方式,实现动态、可持续、形成性和诊断性的绩效评估。建立和完善教育网络服务平台,畅通多方参与治理的渠道,实现政府部门、学校、家长和社会信息快速互通。”

《教育信息化2.0行动计划》中要求“利用大数据技术采集、汇聚互联网上丰富的教学、科研、文化、资源,为各级各类学校和全体学习者提供海量、适切的学习资源服务。优化教育业务管理信息系统,深化教育大数据应用,全面提升教育管理信息化支撑教育业务管理、政务服务、教学管理等工作的能力。建立“覆盖全国、统一标准、上下联动、资源共享”的教育政务信息资源大数据,打破数据壁垒,实现一数一源和伴随式数据采集。”

    1. 教育大数据应用生态服务教育现代化

党的十九大报告明确指出要“加快教育现代化”“办好网络教育”。加快教育现代化,推进新时代教育信息化发展,培育创新驱动发展引擎,教育信息化作为教育系统性变革的内生变量,支撑引领教育现代化发展,推动教育理念更新、模式变革、体系重构。教育信息化是加快实现教育现代化的有效途径,教育信息化是教育现代化的基本内涵和显著特征,是“教育现代化2035”的重点内容和重要标志。

围绕教育现代化的目标追求,落实教育政策,践行教育信息化2.0,促进教育教学应用取得实效。以教学的管理、教师的教学、学生的学习与发展为中心,利用大数据的思维和技术,采用大数据标准引领教育现代化发展,充分发挥学校、教师推进教育现代化的积极性和主动性,共同建设教育大数据平台及应用。通过梳理、建立并统一教育元数据目录及标准,消除数据烟囱,以结构和非结构化数据为基础,向“数据”要“效益”为目标,利用大数据分析和人工智能等手段,构建教育系统已建及待建应用系统的底层数据采集、清洗、共享以及机器学习、AI智能分析、融合呈现的教育大数据服务中心,支持国家、省、市、区(县)、校五级数据共享交换,让区域可公开教育数据上云,无缝对接电子政务云平台。依托区域大数据中心,构建数据惠民应用体系,通过丰富底层基础数据,利用个性化智能服务,进一步发挥教育数据在教学、资源、测评等方面的支持作用,打造惠及全地区的学校办学水平评估测评体系、互联网应用体系和大数据智慧课堂应用体系,实现跨业务、跨系统的多维数据分析与决策,持续推动教育大数据良性发展,深化和充实智慧教育内涵,助力区域教育质量的精准提升和跨越式发展。

  • 建设需求
    1. 地区教育系统亟待进行信息共享、系统融合

当前我国教育信息化发展进入2.0时代,区域教育信息化也进入新的发展阶段,需要借助创新技术持续推动教育信息化的进步。在众多区域,教育信息化发展取得了巨大成功:教学环境越来越好、教育资源越来越丰富、信息化教学越来越普及、公共教育平台的服务水平越来越高且覆盖面越来越广。但由于区域教育信息化具有应用场景多样、业务逻辑繁复、需求差异显著等特点,促使区域不得不持续建设越来越多的应用系统进行应对;在众多区域都积累了大量的建设于不同时期、针对不同目标、交由不同厂商、采用不同技术路线实现的教育信息化系统,这些系统在解决问题的同时也给用户带来了巨大的困扰与挑战。

  1. 地区教育局日常使用的信息化系统数量过多(总量达数十个),熟悉、管理和使用全部的系统较为困难;
  2. 经常需要在多个系统之间导入、导出和转化数据;
  3. 重要数据需要在多个系统中录入;

  1. 同一个指标在不同系统中数据统计结果不一致,需承受大量的人工分析与处理工作等。

大数据为地区教育信息化提供了系统性解决问题的手段。教育大数据实现了数据的统一采集,使所有的应用系统都成为数据采集端,弥补了特定数据只能由专门的信息化系统采集的不足,解决了系统重复冗余的问题;实现了数据的统一交换,使数据能够在系统与中心之间非实时交换,极大地降低了数据交换技术的复杂度,解决了数据高效流转的问题;实现了离线数据的统一加工,使数据能够被全面清洗、集中规整并以统一的口径进行统计,规避了相同指标在不同系统中含义不一致的现象,解决了数据冲突问题;实现了离线数据与在线数据的统一利用,使数据可以跨场景、多角度、全方位地呈现和发掘规律,扩大了数据应用场景,极大地提升了数据的内在价值。

以大数据技术为基础开展知识挖掘、数据分析、学习效果评价等服务,为实现差异化教学、精细化管理和智能化服务提供了可能。智慧校园的深度应用为提升中小学校管理效率、促进优化治理、实现真正以人为本的个性化服务奠定了良好基础,有助于推动教育管理从经验型、粗放型、封闭型向精细化、智能化、可视化转变。因此,区域发展教育大数据是教育信息化进一步深化发展的必然结果。

    1. 新型教学环境需要创新的教学内容方法

全面引入智能技术的智慧校园必将广泛普及,绿色节能管控、精细化治理、个性化服务将全面实现,从而引发学校治理水平的大幅度提升。新型教育技术的引入将彻底改变多媒体教室的定义,传统具有多媒体内容呈现和有限互动能力的教室必将升级为更加智能、更具个性化、更支持智能交互和差异化教学的智能教室。

今后课堂的边界逐渐模糊,物理学习空间和网络虚拟学习空间将全面衔接,教学方法将更加多样化,以信息技术为支撑的探究式、讨论式、参与式教学和混合式学习等新型教与学方法将逐步普及。大数据成为实现大规模个性化学习的重要支撑,大数据革新了学生的学习、教师的教学,为实现大规模的个性化自适应学习提供了重要途径。

    1. 教育元素的改变需要教育评价模式的更新

新型教育形态的变化,教育评价体系必然发生根本性变化,知识传授型教育将向能力培养型教育转变,被动识记型学习将向主动探究型学习转变;强调主体性、个性化,注重以人为本、开放多元、全面发展的教育理念将进一步得到彰显。以大数据和人工智能为支撑的精准化评价和智能诊断将全面普及,教学评价的手段更加智能,面向学习全过程,基于智能评价的学习干预将取得更好效果。教育管理与督导评估也将因为大数据、人工智能技术的引入而变得更加科学、即时、精细化。

    1. 新型社会形态促使人才培养模式急需转变

信息化社会,知识生产和流动速度加快、知识更新更加频繁,对人才的知识、能力、素质的要求更高,而且智能技术的发展改变了很多行业的基本业态,让很多工作都可以由智能机器代替人来完成,导致社会对人才的需求与以往产生很大不同。智能社会更需要的是具备批判性思维能力、协作沟通能力、创新能力的个性化人才。信息时代的学习者是数字原生代,他们在智能手机、平板电脑等各种智能设备的环绕中成长,在数字化科技的熏陶下生活,他们十分依赖通过互联网获取信息和开展人际交流。在学习方面,他们的知识获取渠道极为丰富,阅读习惯呈现出非线性特点,学习方式高度个性化,对课程质量要求很高,使用数字化学习设备和资源对他们来说几乎是与生俱来的本领。

大数据应用技术是

实现教育多样性、个性化的有效手段,使我们能够精细刻画每一个学习者的个体特征,从而在提供大规模教育的同时,针对每个学习者的特定需求实现差异化的教育供给,以此解决长期困扰教育界的规模化与个性化相矛盾的问题,实现高质量的教育均衡和高水平的终身教育。

  • 设计思路

教育大数据技术为教学、学习及管理决策等教育活动提供了全新的科学工具,并有力地推动了教育的变革。

    1. 聚焦数据价值

教育数据采集与深度分析技术全覆盖教育业务各应用系统中,涵盖教学、管理、科研、培训等,既注重相关关系的识别,又强调因果关系的确定,通过数据分析技术发现教育中实际存在的问题,辅助用户解读和理解数据分析结果,更准确评价当前现状,预测未来趋势。将数据分析的结果融入学校的日常管理与服务之中,为师生提供精细化与智能化服务。

    1. 坚持融合创新

发挥技术优势,变革传统模式,推进新技术与教育教学的深度融合,真正实现从融合应用阶段迈入创新发展阶段。全面收集、准确分析、合理利用教育大数据,从“基于有限个案”向“基于全面数据”转变,推动教育决策从经验型、粗放型向精细化、智能化转变。

    1. 提升师生素养

整合多元应用,提供丰富、多样、个性化专业服务,提升师生信息素养,推动从技术应用向能力素质拓展,不再仅仅注重学生的学习成绩,而更加关注身心健康、学业进步、个性技能、成长体验等方面。建立师生良好信息思维,培养应用信息技术解决教学、学习、生活中问题的能力。

    1. 转化思维模式

课堂作为推动学校内涵发展的主阵地,通过大数据应用对教师进行课堂观察、数据采集和分析,得出测评结果,然后制定相应的提升措施,不断促进教师教学水平的提升。推动大数据技术与教师教育产生深度融合,促进教师专业发展、教师教育教学全方位变革与创新发展。

  • 建设目标
    1. 打造教育大数据平台,统领教育应用

教育大数据以“数据集中、信息共享、业务共通、应用统领”为支撑,建立教育数据应用平台;所有应用统一于大数据平台,实现数据从各应用平台采集,汇聚到数据中心统一存储,应用层统一调用,分场景进行加工处理的模式。

教育大数据平台,为教育管理者、教师、家长、学生等不同对象提供多层次、全方位的综合应用服务,综合构建“教、学、管、评、测、练”与“教育管理机构、学校、老师、家长、学生”相结合的多维教育大数据信息化体系。全面打通用户的基础数据,融合学业数据、教育管理综合信息、教师信息等大数据,进行全面多维的各类分析、数据透视。教育管理者、教师、学生、家长都能通过教育大数据平台,根据角色、权限及应用场景的不同,享用平台中各类教育应用。

    1. 提供个性化教学服务

通过对学生历年学业成绩、课程选修、活动参与等数据分析,除了追踪学生学业进步情况外,还可以从中分析不同学生的学习需求和风格,进而提供适应学生特点的个性化教学。一是通过数据分析对学习困难学生进行干预,教师通过学生数据系统监控学生学业表现进行干预性指导。二是获得学生学习结果的即时智能反馈。通过课堂行为记录与分析工具,教师可以及时获得学生学习情况并调整教学活动。三是在学生选择辅修课程或课外项目时,大数据技术可以提供适合学生的个性化建议。四是基于大数据分析改进日常教学工作。教师可以通过分析学生社交行为数据,更有效地开展团队和小组学习,优化学习计划和日程安排。

    1. 变革教与学发展模式提升师生数据素养

对教师教学日志数据、教学资源数据、教学互动数据、教学评价数据、教学效果数据、教师继续教育数据、教学工具使用数据等日常教学过程、行为、结果数据的深入分析与挖掘建立教师数据素养,帮助教师更好地获得学生反馈,发现每位学生的兴趣点和薄弱点,以优化教学模式,改进教学策略,实现个性化教学;有助于教师有效预测学生考试成绩及发展趋势,及时干预并指导学生的学习与发展;有助于教师对学生做出全面客观的评价,推动教育评价方式从“经验主义”走向“数据主义”;有助于教师的教育决策更加科学准确,提高工作效率与学生的学习成绩;有助于教师发现自身专业技能的不足和问题,提升专业能力和研究水平,适应数据驱动教学时代的新要求。

对学生日志数据、成绩预警数据、师生评价数据、在线话语数据、伦理隐私数据、多模态数据等六类数据的进行深入的挖掘分析,建立学生数据素养。培养学生在数据感知和采集、组织和管理、处理与分析、共享与协同创新等方面的能力,以及在数据的生产、管理和发布过程中的道德与行为规范。帮助学生更好地获取学习反馈,发现自身学习的优劣势,优化学习方式方法,实现精细化学习;帮助学生更好的预估学习发展趋势,指导学生做好学业生涯规划;帮助学生更精确的进行学习过程跟踪与学习过程评价,为学生综合素质评价提供数据支撑;帮助学生发现和学习高效学习方式方法,提升自适应学习能力,培养终身学习习惯。

    1. 促进学校教育信息化发展,破解发展难题

为了推进大数据应用服务驱动地区教学的快速发展,教育行政部门、教育大数据服务

企业、中小学校应当协同发力,重点从五个方面推进实施,包括:开展数据素养专题培训,提高教师数据意识与数据处理能力;打造基于大数据的智慧学习平台,支撑教师开展数据驱动的精准教学;开展数据驱动教学示范项目,探索数据驱动教学新模式;构建数据驱动教学实践共同体,传播数据驱动教学文化;开展数据驱动教学专题研究,引领数据驱动教学持续深入发展。

    1. 挖掘大数据推动教育研究转型

现代教育运用实证数据研究教育具体问题,再基于研究结果指导政策与实践。大数据技术为大规模教育实证研究提供便利,推动教育研究转型为“数据密集型科研”。一是利用纵向数据开展长期性追踪研究。维格多以北卡罗莱州1500名教师为对象,跟踪分析1997—1998学年至2007—2008学年学生学业测评结果对教师工资薪酬的影响,提出基于绩效考核的教师酬金改革建议。二是开展大规模横向比较研究。美国“全国学生中心”(NSC)开展的大学阶段学业成就与高中阶段学业间关系研究,依托各州和联邦教育数据库,以全美92%的在校大学生为对象,通过了解不同学校入学情况、学生人口特征与大学入学的关系、高中阶段学业成绩相似学生在大学后的学业表现等内容,分析高中阶段学习对大学学业的影响。这种跨年度的追踪研究和大规模的横向比较研究,没有大数据的支撑是难以实现的。

    1. 基于大数据推动教育科学决策

全面的地区基础教育质量监测不仅让决策者了解教育的整体状况和变化趋势,还通过分析家庭背景、教育项目和学校教学与学生学业成绩间的关系,进而影响地区教育资源分配与资助性项目的实施。一是

运用教育大数据规划学校布局与资源分配,地区和学校通过分析学生人口学数据,得出本地区学龄人口变动趋势,从而科学规划本地区学校布局与资源分配。二是改进学校绩效评估办法。基于学校整体与学生个体学业数据,评价学校的办学质量或项目实施质量,分析学校的优势与弱势领域。三是推动家校合作。通过使用智慧课堂反馈工具,教师可以实时上传本节课学生课堂表现和任务完成情况,学校和家长借此可以及时了解并与校方交流学生情况。四是提高学校管理效率。在学生出勤、用餐及校车运营等活动中使用学生管理软件,自动记录并通过数据分析提出改进方案。五是改革教师评聘方式。通过分析教师任教学生的学业成绩以及教师的职业信仰、专业发展、社会服务等指标,科学评估教师专业水平与发展潜能。

    1. 开展教育大数据服务,惠及全体教育参与者

通过涵盖K12范围内的小学、初中、高中全线贯通的区域教育生态监控大数据平台,全面跟进诊断班级、学校、区域教育的教与学现状;为全区各级各类教育主管部门实时分析全区域、各校教学质量,并智能提供教育优化方案,智慧化跟进全区基础教育质量;为全区所有教师提供精准教学和改进依据、为全区学生和家长提供了解自己学习现状的途径及改进渠道、资源和方法;提供基于移动互联网环境下的教与学内容探讨、交流互动的互动平台,形成教师、学生、家长三个群体之间的兴趣聚合和广泛讨论。

  • 顶层设计
    1. 设计原则
      1. 标准化和规范化原则

严格遵循国家有关法律法规和技术规范的要求,从业务、技术、运行管理等方面对教育大数据建设和实施进行设计,充分体现标准化和规范化。

      1. 开放性和可扩展性原则

系统采用开放性、标准化的平台设计以尽可能地利用已有的设备、软件及信息资源,系统对于未来可能增添的新的功能、新的用户都要留有接口和二次开发API,并符合相关技术标准,系统可以随形势的发展而不断成长扩大。

      1. 易用性原则

设计方案中所涉及的相关系统,均应提供清晰、简洁、友好的中文人机交互界面,操控简便、灵活,易学易用,便于管理和维护。

    1. 总体框架

以满足大数据平台、应用、服务建设要求为基础,整合现有软硬件资源,构建数据机房计算、存储、网络、容灾、安全等软硬件基础设施环境;建设涵盖核心基础数据库、数据采集、数据共享、数据挖掘、数据控制、数据服务的数据处理中心大数据管控平台以及数据标准、数据安全等管理体系;聚合已建设应用管理系统,打造新型大数据应用服务系统,构建教学服务体系。全地区、全学校、全学段、全过程采集教育各环节数据单元,整合教育元数据内容形成教育数据集,打通教育各应用系统及管理口之间数据壁垒,形成教育数据链条。分析、挖掘、预警教育决策信息,聚类、提取、发现教、学、管各类行为习惯数据,全面数据化指导教育业务管理;精准、智能化提升教育质量水平;智慧、个性化培养教与学行为习惯。

 顶层设计架构图

      1. 基础环境

基础环境为教育大数据的核心平台及各应用系统提供所需的基础网络环境、硬件平台环境、虚拟化环境、基础安全环境等。主要包括云平台、网络设施、安全设施、专业运维团队等软、硬件基础设施以及为保障基础环境稳定、高效、可靠运转所建立的数据中心安全体系。

      1. 大数据管控中心

大数据管控中心位于基础环境层之上,负责存储、管理教育相关核心大数据内容,以“一人一号”、“一校一码”建立标准数据源,管控数据源,同时为数据应用服务提供各类信息资源及数据服务。

基础数据库构建以组织机构、教籍、学籍、学校等教育基本元数据组成的核心库以及教情、学情、考试、资源等教育过程数据组成的主题库构成。

数据控制包含数据标准管理、数据代码集管理、数据过程和数据质量管理等,严格追溯数据从采集、清洗、采用、更新全过程的每一个数据变迁痕迹,保证系统数据质量高效、稳定、可用。

数据采集、共享、挖掘分别代表了数据三个核心流转过程,采集数据遵从“一数一源”,共享数据提取“一源多用”,挖掘数据分析“一数多链”。在每个环节严格控制数据流入及数据间的关联关系。让数据内容透明化、数据关系明确化、数据表现决策化。

数据安全及数据标准体系的建立是保障大数据管控中心所有工作正常开展、监管、考核的具体措施。

      1. 教育大数据应用服务

应用服务既是教育数据的采集输入层,也是教育数据的服务输出层。承载了教育大数据中心的各级各类信息化应用系统,作为具体业务的执行单元,教育大数据应用服务层是实现教育管理、教学服务、教育惠民等业务流程数字化的重要载体。

大数据应用服务采用集中部署,多级应用的云端架构。集中建设减轻系统维护工作量,数据互通避免系统建设数据孤岛、多端多源数据采集、集中统一应用权限管控、方便快捷统一认证管理、多样丰富应用统一提供。

教育局、学校等管理单元依托各级云平台统一构建各类业务应用系统,平台与平台之间进行数据互通管理,系统与系统之间依托平台开展业务工作,构建区域教育画像、学校发展评估、教学质量监测等教育管理及决策类应用及数据服务。老师、学生、家长作为应用单元根据教学、学习、跟踪需要选取相应服务系统,系统自动采集各角色日常使用数据,

分析挖掘有用数据形成教师画像、学生画像、教学预警、家校联合情况等教育教学类信息服务。

    1. 技术路线
      1. 大数据技术

教育管理业务系统的各类应用将产生大量的业务数据。数据来源非常丰富且数据类型多样,存储和分析挖掘的数据量庞大,对数据展现的要求较高,并且很看重数据处理的高效性和可用性。大数据技术根植于云计算,着眼于“数据”,关注实际业务,提供海量数据采集、分析、挖掘、展现等方面的支持,看重的是海量数据存储管理能力。对结构化和非结构化混合的大数据采用MPP 并行数据库集群与Hadoop集群的混合来实现对百PB 量级、EB量级数据的存储和管理。用MPP 来管理计算高质量的结构化数据,提供强大的SQL和OLTP型服务,Hadoop实现对半结构化和非结构化数据的处理,以支持诸如内容检索、深度挖掘与综合分析等新型应用。

      1. 数据融合技术

数据融合技术是指利用计算机对按时序获得的若干观测信息,在一定准则下加以自动分析、综合,以完成所需的决策和评估任务而进行的信息处理技术。为共享数据中心、主数据库、数据集市、数据仓库,提供统一的数据标准规范和数据接口,进行统一的数据集成与接入,实现从数据标准到元数据管理、主数据管理、数据仓库的自动同步,对各种信息源给出的有用信息的采集、传输、综合、过滤、相关及合成,以便辅助人们进行态势/环境判定、规划、探测、验证、诊断,并为可视化数据分析提供数据支撑。

      1. 大数据分析与可视化

大规模数据的可视化主要是基于并行算法设计的技术,合理利用有限的计算资源,高效地处理和分析特定数据集的特性。通常情况下,大规模数据可视化的技术会结合多分辨率表示等方法,以获得足够的互动性能。数据分析和可视化基于计算处理层。分析包括简单的查询分析、流分析以及更复杂的分析(如机器学习、图计算等)。查询分析多基于表结构和关系函数,流分析基于数据、事件流以及简单的统计分析,而复杂分析则基于更复杂的数据结构与方法,如图、矩阵、迭代计算和线性代数。一般意义的可视化是对分析结果的展示。但是通过交互式可视化,还可以探索性地提问,使分析获得新的线索,形成迭代的分析和可视化。

      1. 微服务架构

微服务架构是一项在云中部署应用和服务的新技术,一个应用是由多个小的、相互独立的、微服务组成,这些服务运行在自己的进程中,开发和发布都没有依赖。不同服务通过一些轻量级交互机制来通信,例如 RPC、HTTP 等,服务可独立扩展伸缩,每个服务定义了明确的边界,不同的服务甚至可以采用不同的编程语言来实现,由独立的团队来维护。

  • 建设内容
    1. 标准体系建设

教育大数据的的信息资源标准规范,将为信息资源建立统一的编码标准、数据格式,从而为教育管理信息交换、资源共享提供基础条件。标准规范有效保证了基础信息数据在采集、处理、交换、传输等过程中有统一、科学、规范的分类和描述,能够使信息更加有序流通、最大限度地实现信息资源共享,实现教育信息系统的协同发展,进一步发挥信息资源的综合效益。

      1. 术语和定义

序号

名称

英文

说明

1

信息

Information

以适合于通信、存储或处理的形式表示的关于事物状态及其运行规律的知识。

2

数据

Data

信息的可再解释的形式化表示。它能够被计算机识别、存储和加工处理。

3

数据元素

Data element

元素 通过定义、标识、表示以及允许值等一系列属性描述的数据单元,在特定的语义环境中是不可再分的最小数据单元。

4

元数据

Metadata

描述具体的信息资源对象的数据,并能对该对象进行识别和管理,实现信息资源的有效发现与获取。

5

数据项

Data item

具有独立含义的最小标识单位。

6

数据类

Data catalog

描述同一对象(业务环节)的相关数据元素的集合。

7

数据子类

Data subcatalog

数据类所描述的业务环节如可以再分解成若干相对独立的对象,则相对独立对象的相关数据元素的集合称为数据子类。

8

数据集

Data set

本标准描述的所有数据元素的集合。

9

数据子集

Data subset

按教育管理职能域(主要管理业务)划分的数据元素的集合。

10

代码

Code

描述单一对象取值的符号,该符号应具有一定规律性,易于计算机和人识别与处理。

      1. 数据元素结构

(1)数据项组成

元数据结构包括以下7个部分:

1)编号:数据项的唯一标识,采用全局统一的5段10位编码;

2)数据项名:通常由中文简称的汉语拼音首字母(大写)组成,与中文简称一一对应,宜在实际数据结构中采用;

3)中文简称:所用的数据元素的名称,具有语义,面向用户;

4)类型:数据项容纳的数据类型,本标准在数据项中简称其为类型(一种属性);

5)长度:数据项能容纳的最大字符数(一种属性);

6)约束:数据项约束状态的描述,即必备数据项或可选数据项(一种属性);

7)值空间:数据项取值的范围与规范(一种属性)。

以上7项组合成为各业务数据子集的元数据结构。数据层次与元数据结构如下图所示:

(2)数据类型

1)字符型:字符型为C(-Character),在信息系统中取用时,可以是可变长度,如VARCHAR2(Oracle)或NVARCHAR(SQL Server);

2)数值型:数值型为N(-Number),可参与运算;

3)币值型:币值型为M(-Money),定义了金额属性的结构对象,此结构包括3个域:“币种”、“单位”和“金额”。默认定义币种为:人民币,单位:元(需要时也可定义为:万元),总长度:不定长,小数后长度:4位,取值范围:数字。需要时,M可依照GB/T 12406 定义为其他币种;

4)二进制类型:二进制类型为B(-Binary),宜在照片或超长文本采用;

5)文本型:文本型为T(-Text),宜用于数量较多的文字描述。本标准约定长度大于200字符时采用文本型T。

(3)约束

可选数据元素O(Optional data element):在数据类/子类中定义,但不是必须在数据结构的实例中出现的数据元素。必备数据元素M(Madatory data element):在数据类/子类中定义,应在数据结构的实例中出现的数据元素。

符合以下四条原则之一的数据项为必备数据元素(M):

1)在该管理数据类或子类中不可或缺的数据项(元素);

2)在标准针对的教育管理范围内,跨管理业务域的应用系统之间需要交换、共享的数据项;

3)需要满足上级部门统计要求或交换的数据项;

4)值空间数据元素取值的格式、范围与规范。凡是可以代码化的,应采用代码。

      1. 标准规范

基于国家标准、教育部标准、行业标准,兼顾各类标准之间的兼容性、一致性以及标准的可扩展性,建设形成一套教育大数据的数据标准规范。标准规范建设主要包括以下两方面内容:

(1)数据集建设:依据教育部2012年颁布的《教育管理信息化标准(JY/T1001-2012)》等七个教育信息化行业标准建设数据集,包括教育管理基础信息数据集、教育统计信息数据集和教育基础装备分类与代码等内容。

(2)代码标准建设:为了保证数据录入的规范性,便于查找和统计,每个管理子集都有相对应的标准代码,以及代码的定义与说明。

        1. 教育管理基础信息数据集

教育管理基础信息数据集包括学生数据子集、教师(职工)数据子集、学校数据子集、办学条件数据子集和资源数据子集5个部分

(1)学生数据子集

包括学生基本数据类、学籍数据类和毕业数据类3个数据类。

1)学生基本数据类

包括学生基本数据子类、政治面貌数据子类、家庭通讯方式数据子类、家庭成员数据子类、联系人数据子类、家庭经济情况数据子类、学生来源数据子类、个人通讯子类、学生急救信息9个数据子类。

2)学籍数据类

包含了学籍基本数据子类、学籍异动数据子类、成绩数据子类、奖励数据子类、惩处数据子类、学生入学成绩数据子类、学生注册数据子类和学生因病学籍变动8个数据子类。

3)毕业数据类

包括毕业数据子类1个子类。

4)德育数据类

德育数据类包括学生操行评价子类、学生职务信息子类、学生缺勤信息子类、学生体能与水平测试信息子类、学生体育锻炼数据子类、学生体育达标数据子类、学生体育竞赛数据子类、学生军训数据子类、学生初中入学数据子类和学生高中入学数据子类10个子类。

(2)教师(职工)数据子集

包括职工基本数据类,资质、任教数据类,社会团体兼职数据类,培养数据类,考核数据类,聘用数据类、离职数据类7个数据类。

1)教职工基本数据类

包括教职工基本数据子类、学习简历数据子类、工作简历数据子类、政治面貌数据子类、学历学位数据子类、家庭通讯方式数据子类、家庭成员数据子类、联系人数据子类、联系人数据子类、家庭经济情况数据子类、奖励数据子类和惩处数据子类12个数据子类。

2)资质、任教数据类

包括语言能力数据子类、专业技术职务数据子类、岗位证书数据子类、工人技术等级及职务数据子类、党政职务数据子类、教职工人才申报数据子类、教职工支教数据子类和教职工获取专利数据子类8个数据子类。

3)社会团体兼职数据类

包括社会兼职职务数据子类、学术团体兼职数据子类2个数据子类。

4)培养数据类

包括国内进修学习数据子类、出国(境)进修学习工作数据子类2个数据子类。

5)考核数据类

包括组织考察数据子类、教职工考核数据子类、工人考技考工数据子类、教职工管理工作数据子类、教职工教学工作量数据子类和教职工任课数据子类6个数据子类。

6)聘用数据类

包含来源数据子类、部门调动数据子类、离岗数据子类、病休数据子类4个数据子类。

7)离职数据类

包含离职数据子类、离退休数据子类和返聘数据子类3个数据子类。

8)教职工工资数据类

包含教职工工资结构数据子类、教职工工资变动数据子类、教职工保险福利数据子类和教职工住房公积金数据子类4个数据子类。

9)专家数据类

包含教国内专家数据子类,专著和重要论文数据子类,主要科研成果数据子类,大会交流、讲学数据子类,承担项目、课题数据子类和来华定居工作专家学者数据子类6个数据子类。

(3)学校数据子集

学校数据子集包括学校基本数据类和班级数据类2个数据类。

1)学校基本数据类

包括学校基本数据子类和校区基本数据子类2个数据子类。

2)班级数据类

包括班级数据一个数据类。

(4)办学条件数据子集

包括办学经费数据类,房地产与设施数据类,仪器设备、软件资源与实验室数据类和图书期刊类4个数据类。

1)办学经费数据类

包括补助性收入数据子类、经营性收入数据子类、其他收入数据子类、工资福利支出数据子类、对个人和家庭的补助性支出数据子类、商品和服务支出数据子类、债务利息支出数据子类、其他资本性支出数据子类、债务资金来源数据子类、债务资金用途数据子类10个数据子类。

2)房地产与设施数据类

包括学校用地数据子类、学校建筑物基本数据子类、建筑物房间子类、建筑物修缮子类和学校设施数据子类5个数据子类。

3)仪器设备、软件资源与实验室数据类

包括仪器设备基本数据子类,仪器设备附件数据子类,仪器设备管理数据子类,仪器设备报损、报废数据子类,软件资源数据子类,软件资源使用管理数据子类,实验室基本数据子类和实验项目数据子类8个数据子类。

4)图书期刊类

包括图书基本数据子类和期刊基本数据子类2个子类。

(5)资源数据子集

资源数据子集包括教学资源数据类1个数据类。

1)教学资源数据类

包括文本资源数据子类,图片资源数据子类,视频资源数据子类,音频资源数据子类,专题资源数据子类5个子类。

        1. 教育统计信息数据集

教育统计信息数据集包括统计报表管理数据子集、学校机构管理数据子集、学生统计信息数据子集、教职工统计信息数据子集、办学条件统计信息数据子集5个部分,

(1)统计报表管理数据子集

包括统计报表制度管理数据类、统计报表填报管理数据类和统计报表数据计算指标数据类3个数据类。

(2)学校机构管理数据子集

包括学校(机构)机构属性数据类、学校(机构)管理数据类和学校(机构)基本状况数据类3个数据类。

1)学校(机构)机构属性数据类

包括学校(机构)设置属性数据子类、学校(机构)地域属性数据子类和学校(机构)管理机构数据子类3个数据子类。

2)学校(机构)管理数据类

包括学校(机构)负责人数据子类、学校(机构)通讯数据子类和学校(机构)历史沿革数据子类3个数据子类。

3)学校(机构)基本状况数据类

包括基础教育学校(机构)基本状况数据子类、中等职业教育学校(机构)基本状况数据子类2个数据子类。

(3)学生统计信息数据子集

包括学生统计事实指标数据类和学生统计维度指标数据类2个数据类。

1)学生统计事实指标数据类

包括学生统计数据计算事实指标数据子类和学生统计事实指标数据子类2个数据子类。

2)学生统计维度指标数据类

包括学生班级维度指标数据子类、学生政治面貌维度指标数据子类、学生培训维度指标数据子类、学生外国籍维度指标数据子类和学生属性维度指标数据子类5个数据子类。

(4)教职工统计信息数据子集

包括教职工统计事实指标数据类和教职工统计维度指标数据类2个数据类。

1)教职工统计事实指标数据类

包括教职工统计数据计算事实指标数据子类和教职工统计事实指标数据子类2个数据子类。

2)教职工统计维度指标数据类

包括教职工政治面貌维度指标数据子类、教职工课程维度指标数据子类、教职工属性维度指标数据子类3个数据子类。

(5)办学条件统计信息数据子集

包括办学条件统计事实指标数据类和办学条件统计维度指标数据类2个数据类。

1)办学条件统计事实指标数据类

包括办学条件统计数据计算事实指标数据子类、办学条件统计校舍建筑面积事实指标数据子类、办学条件统计土地面积事实指标数据子类、办学条件统计资产事实指标数据子类、办学条件统计信息化建设事实指标数据子类5个数据子类。

2)办学条件统计维度指标数据类

包括办学条件统计新增与产权维度指标数据子类、办学条件统计校舍维度指标数据子类2个数据子类。

        1. 基础教育装备分类与代码

基础教育装备分类与代码是关于基础教育学校教育教学及教学辅助装备、行政办公和生活服务装备的分类与代码。

    1. 数据库建设

建设覆盖各类中小学的学生、教师(职工)、学校基础信息数据库,为每一名学生、教师(职工)和每一所学校及其资产建立全国唯一电子档案,实现学生和教师(职工)“一人一号”、学校“一校一码”。

      1. 学生元数据目录

学生元数据目录包括学生基本数据类、学籍数据类、毕业数据类和德育数据类4个部分,元数据目录如下表所示:

序号

数据类

数据子类

包含的数据项

1

学生基本数据类

学生基本数据子类

学号、姓名、英文姓名、姓名拼音、曾用名、性别码、出生日期、出生地码、籍贯、民族码、国籍/地区、身份证件类型码、身份证件号、婚姻状况码、港澳台侨外码、政治面貌码、健康状况码、信仰宗教码、血型码、照片、身份证有效期、是否独生子女。

2

政治面貌数据子类

政治面貌码、参加日期、参加所在单位、介绍人、转正日期、异常类别码、异常原因、异常日期、转入日期、转入前单位、转出日期、转出单位。

3

家庭通讯方式数据子类

家庭住址、家庭邮政编码、家庭电话、家庭电子信箱。

4

家庭成员数据子类

关系码、成员姓名、出生年月、民族码、国籍/地区码、健康状况码、成员工作单位、从业码、专业技术职务码、职务级别码、电子信箱、文化程度、政治面貌。

5

联系人数据子类

关系码、联系人姓名、邮政编码、通信地址、电话、移动电话、传真电话、电子信箱、网络地址、即时通讯号。

6

家庭经济情况数据子类

家庭人口、赡养人口、劳动力人口、家庭人均月收入、家庭主要收入来源、家庭类别码、困难原因码、是否低保、入学前户口类别码、就学地低保线。

7

学生来源数据子类

原学校名称、原学号、入学方式、来源地区码、学生来源码、就读方式码、入学日期。

8

个人通讯子类

邮政编码、通讯地址、电话、移动电话、传真电话、电子邮箱、网络地址、即时通讯号。

9

学生救急子类

血型码、过敏史、既往病史、紧急联络电话、联系人姓名。

10

学籍数据类

学籍基本数据子类

入学年月、学生类别码、学制、专业码、所在班号、所在年级、学生当前状态码。

11

学籍异动数据子类

异动类别码、异动日期、异动原因码、审批日期、审批文号、异动来源学校码、异动说明、原院系所号、原专业码、原班号、原年级、原学制、现院系所号、现专业码、现班号、现年级、现学制。

12

成绩数据子类

学年(度)、学期码、考试日期、课程号、平时成绩、考试方式码、考试性质码、考试形式码、分数类考试成绩、课程成绩、课程等级成绩码、任课教师工号、成绩录入人号、成绩录入日期、成绩录入时间。

13

奖励数据子类

奖励名称、奖励级别码、奖励等级码、获奖类别码、奖励原因、奖励金额、奖励文号、奖励学年度、颁奖单位、奖励类型码、奖励方式码。

14

惩处数据子类

违纪日期、违纪简况、违纪类别码、处分名称码、处分原因、处分日期、处分文号、处分撤销日期、处分撤销文号。

15

学生入学成绩数据子类

学科名称、成绩评分方法码、考试方式码、考试类别码、成绩类别码、正常成绩、补考成绩、等级类考试成绩、等级成绩补考成绩。

16

学生注册数据子类

注册入学方式、注册方式、注册日期、注册状态、未按时注册原因、补注册日期。

17

毕业数据类

结束学业年月、结束学业码、结束学业原因说明、毕业证书号、学位证书号、结业证书号、获毕业证书日期、获学位证书日期、获结业证书日期。

18

德育数据类

学生操行评价子类

学期标识号、操行等级、操行评语、操行评价备注。

19

学期标识号、职务、职务备注。

学生职务数据子类

20

学生缺勤数据子类

缺勤开始日期、事由、缺勤次数、备注。

21

学生体能与水平测试数据子类

测试项目、测试日期、测试成绩、测试结论、测试单位。

22

学生体育锻炼数据子类

体育考核日期、考核学年、锻炼出勤率、体育考核评语、所任体育工作。

23

学生体育达标数据子类

达标项目、达标日期、授予单位。

24

学生体育竞赛数据子类

竞赛项目、名次、比赛日期、项目类别、竞赛级别、竞赛颁奖单位。

25

学生军训数据子类

开始日期、结束日期、分数。

26

学生初中入学数据子类

学号、小学毕业学校、初中入学方式、入学学校、是否注册、小学班级id、初中入学id、导入日期。

27

学生高中入学数据子类

学校名称、学校代码、县代码、学生姓名、中考号、学生号、证件类型、证件号、性别id、总成绩、初中毕业学校、初中班级id、高中入学id、有无注册、高中入学方式、导入时间。

      1. 教师(职工)元数据目录

教师(职工)元数据目录包括教职工基本数据类,资质、任教数据类,社会团体兼职数据类,培养数据类,考核数据类,聘用数据类,离职数据类,教职工工资数据类,专家数据类9个部分,元数据目录如下表所示:

序号

数据类

数据子类

包含的数据项

1

教职工基本数据类

教职工基本数据子类

工号、姓名、英文姓名、姓名拼音、曾用名、性别码、出生日期、出生地码、籍贯、民族码、国籍/地区码、身份证件类型码、身份证件号、婚姻状况码、港澳台侨外码、政治面貌码、健康状况码、信仰宗教码、血型码、照片、身份证件有效期限。

2

学习简历数据子类

学习起始日期、学习终止日期、学习单位、学习内容、所学专业名称、所获学位码、学习证明人、学习简历备注。

3

工作简历数据子类

工作起始日期、工作终止日期、工作单位、工作内容、曾任党政职务、曾任专业技术职务码、工作证明人、工作简历备注。

4

政治面貌数据子类

政治面貌码、参加日期、参加所在单位、介绍人、转正日期、异常类别码、异常原因、异常日期、转入日期、转入前单位、转出日期、转出单位。

5

学历学位数据子类

入学年月、学制、学习方式码、学习形式码、学历码、所学专业码、结束学业年月、毕肄业学校或单位、学历证书号、获得学位码、授学位单位名称、授学位国家/地区码,获学位专业码、获学位日期、学位证书号。

6

家庭通讯方式数据子类

家庭住址、家庭邮政编码、家庭电话、家庭电子信箱。

7

家庭成员数据子类

关系码、成员姓名、出生年月、民族码、国籍/地区码、健康状况码、成员工作单位、从业码、专业技术职务码、职务级别码、电子信箱、文化程度、政治面貌代码。

8

联系人数据子类

关系码、联系人姓名、邮政编码、通信地址、电话、移动电话、传真电话、电子信箱、网络地址、即时通讯号。

9

家庭经济情况数据子类

家庭人口、赡养人口、劳动力人口、家庭人均月收入、家庭主要收入来源、家庭类别码、困难原因码、是否低保、入学前户口类别码、就学地低保线。

10

奖励数据子类

获奖项目、奖励级别码、奖励等级码、获奖类别码、获奖方式码、奖励名称、奖励名称码、获奖原因、奖励内容、颁奖单位、获奖日期、荣誉称号码、获奖角色码。

11

惩处数据子类

惩处名称、纪律处分码、惩处原因、惩处内容、惩处单位、惩处文号、惩处日期、惩处撤销日期、惩处撤销文号、惩处撤销原因。

12

资质、任教数据类

语言能力数据子类

外国语种码、外国语种熟练程度码、中国语种码、中国语种熟练程度码、普通话水平等级码

13

专业技术职务数据子类

任职资格名称码、取得资格途径码、评审单位、评定日期、聘任职务码、聘任单位、聘任起始日期、聘任终止日期、聘任情况码、解聘日期、解聘原因。

14

岗位证书数据子类

岗位证书名称、岗位证书编号、颁发单位、颁发日期。

15

工人技术等级及职务数据子类

工人技术等级码、工人技术职务码、工人工种码、等级发证机关、等级评定日期。

16

党政职务数据子类

职务名称、职务名称码、职务类别码、职位分类码、职务级别码、任职日期、任职部门、任职方式码、任职原因、任职文号、任职批准单位、职务变动类别码、当前任职状况、职务排序、主管或从事的工作、免职日期、免职方式码、免职原因码、免职文号、免职批准单位。

17

教职工人才申报数据子类

学校、联系人、申报联系电话、邮箱、岗位、学段、职称、人数、有效期、人员。

18

教职工支教数据子类

人员标识、支教类型。

19

教职工获取专利数据子类

获取专利日期、专利名称、专利号、专利批准国别、专利类别、专利批准机构、专利所有人、专利当前状态。

20

社会团体兼职数据类

社会兼职职务数据子类

社会兼职码、社会兼职起始日期、社会兼职终止日期、社会兼职辞职原因码。

21

学术团体兼职数据子类

学术团体名称、学术团体级别码、学术团体隶属或主管单位、学术兼职职务、学术兼职起始日期、学术兼职终止日期、学术兼职辞职原因码。

22

培养数据类

国内进修学习数据子类

进修性质码、学习方式码、学习起始年月、总学时、学习内容、进修班名称、主办单位、主办单位性质码、在学单位、在学单位类别码、进修结果码。

23

出国(境)进修学习工作数据子类

出国(境)日期、出国(境)目的码、出国(境)国别码、所去单位英文名称、派出单位、团组名称、出国(境)经费来源码、审批单位、审批日期、审批文号、批准期限、学习工作内容、学习工作成绩、应回国日期、实回国日期、护照号/通行证号、证件有效期。

24

考核数据类

组织考察数据子类

考察(考核)类别码、考察(考核)日期、考察(考核)意见、考察(考核)结果码、考察(考核)组织及考察人。

25

教职工考核数据子类

考核类别码、考核日期、考核内容、考核结果码、考核负责人工号、考核评语、考核部门。

26

工人考技考工数据子类

考工年月、考核工种码、考工部门、技术级别、考工证书号、考工评语、考工成绩。

27

教职工管理工作数据子类

管理工作名称、管理部门、管理起始年月、管理终止年月、管理工作量。

28

教职工教学工作质量数据子类

教学类型、教学内容、教学工作量、教学评语、教学起始年月、教学终止年月、教学时间、任班主任时间、委派码、子序号、最后工作码、最后工作地区。

29

教职工任课数据子类

任课课程号、任课起始年月、任课终止年月、任课学段、任课角色、授课班级、授课人数、教学年月、原因、任课备注。

30

聘用数据类

来源数据子类

来单位日期、来源码、来源地区码、来单位原因、原单位名称、原党政职务码、原技术服务码、原从事学科码、原工资总额、原教护龄津贴。

31

部门调动数据子类

部门调动日期、部门调动原因、组织内调出部门号、组织内调入部门号、工资转移日期、文书档案号。

32

离岗数据子类

离岗日期、离岗原因码、返岗日期、工资转移日期、文书档案号。

33

病休数据子类

病休起始日期、病休诊断医院、病休诊断证明、恢复工作日期、康复诊断医院、康复诊断证明、工资转移日期、文书档案号。

34

离职数据子类

离职日期、离职原因码、离职去向。

35

离退休数据子类

离退类别码、离退起始日期、离退后享受级别码、离退休费支付单位、离退后管理单位、异地安置地点。

36

返聘数据子类

返聘起始日期、返聘终止日期、返聘单位号、返聘岗位、返聘酬金、返聘金来源、返聘工作量。

37

离职数据类

离职数据子类

离职日期、离职原因码、离职去向。

38

离退休数据子类

离退类别码、离退起始日期、离退休费支付单位、离退后管理单位、异地安置地点。

39

返聘数据子类

返聘起始日期、返聘终止日期、返聘单位号、返聘岗位、返聘酬金、返聘金来源、返聘工作量。

40

教职工工资数据类

教职工工资结构数据子类

工资总额、基职工资额、工龄工资额、教护龄津贴、浮动工资额、浮动起始日期、岗位津贴额、岗贴起始日期、特殊津贴额、特贴起始日期、业绩津贴额、业贴起始日期、生活津贴额、生贴起始日期、其他津贴额、奖金金额、奖金起始日期。

41

教职工工资变动数据子类

工资类别、工资变动批准日期、工资变动原因、工资变动依据文件、增减级数、变动金额、变动后工资级别、变动后标准工资额、调资起薪日期、批准文件号。

42

保险福利细目、细目保险福利费。

教职工保险福利数据子类

43

教职工住房公积金数据子类

建立年月、住房公积金账号、开户银行、月存款额、缴存比例。

44

专家数据类

国内专家数据子类

专家类别码、批准单位、批准单位级别、批准年月、享受待遇。

45

专著和重要论文数据子类

论著(重要论文)名称、论著学科领域、论著语种、角色、坐着顺序、出版(发表)年份、出版(发表)机构。

46

主要科研成果数据子类

项目名称、项目编号、学科领域、项目密级、完成时间、担任角色、担任角色的排序、成果名称、成果编号、成果类别、成果水平、成果下达单位、主持人、多记录序号。

47

大会交流、讲学数据子类

时间、地点、题目、级别、听讲人数。

48

承担项目、课题数据子类

项目(课题)名称、项目(课题)编号、下达单位、项目(课题)起始日期、项目(课题)截止日期、排序、ID。

49

来华定居工作专家学者数据子类

来华定居日期、来自国家、来自境外单位英文名称、来自境外单位中文名称、境外专业技术职务、境外学位。

      1. 学校元数据目录

学校元数据目录包括学校基本数据类,班级数据类,办学经费数据类,房地产与设施数据类,仪器设备、软件资源与实验室数据类,图书期刊类6个部分,元数据目录如下所示:

序号

数据类

数据子类

包含的数据项

1

学校基本数据类

学校基本数据子类

学校代码、学校名称、学校英文名称、学校地址、学校邮政编码、行政区划码、建校年月、校庆日、学校办学类码、学校举办者码、学校主管部门码、法定代表人号、法人证书号、校长工号、校长姓名、党委负责人号、组织机构码、联系电话、传真电话、电子信箱、主页地址、历史沿革。

2

校区基本数据子类

校区号、校区名称、校区地址、校区邮政编码、校区联系电话、校区传真电话、社区负责人号。

3

班级数据类

班号、班级名称、建班年月、所属年级、班主任工号、班长学号。

4

办学经费数据类

补助性收入数据子类

教育事业费拨款、其他拨款、教育费附加、地方教育费附加、地方基金、基本建设拨款。

5

学杂费收入、经营收入、附属单位上缴收入。

经营性收入数据子类

6

其他收入数据子类

港澳台及海外捐款收入、其他捐款收入、资产处置收入、联合办学(班)收入、其他培训拨款收入。

7

工资福利支出数据子类

基本工资、津贴补贴、奖金及绩效工资、社会保障缴费、其他工资福利性支出。

8

对个人和家庭的补助性支出数据子类

离退休费、医疗费、助学金、其他补助性支出。

9

商品和服务支出数据子类

办公费、水费、电费、邮电费、取暖费、差旅费、维修(护)费、培训费、专用材料费、劳务费、福利费、其他商品和服务性费用。

10

债务利息支出数据子类

向国家银行借款付息、其他国内借款付息、向国外政府借款付息、向国际组织借款付息、其他国外借款付息。

11

其他资本性支出数据子类

办公设备购置费、专用设备购置费、交通工具购置费、信息网络购建费、房屋建筑物购建费、大型修缮费、基本建设支出费。

12

债务资金来源数据子类

国外金融机构贷款、国内金融机构贷款、欠施工单位工程款、借(欠)个人款、借(欠)其他单位款、欠其他来源款。

13

债务资金用途数据子类

房屋建筑物购建和大型修缮债务、土地征用费债务、设备购置债务、其他用途债务。

14

房地产与设施数据类

学校用地数据子类

用地编号、土地产权码、土地使用状况码、校区号、占地用途码、占地面积、用地地址、用地备注、土地证号。

15

学校建筑物基本数据子类

建筑物号、建筑物名称、房屋产权码、使用状况码、校区号、建筑物分类、建筑物结构码、建筑物层数、建成年月、建筑物投资总额、经费来源码、总建筑面积、总使用面积、抗震设防标准码、建筑物地址、建筑物状况码、建筑物图片、建筑物平面图、权属证号、建筑物占地面积、设计使用年限。

16

建筑物房间子类

房间号、房间名称、房间用途码、房间楼层、房间建筑面积、房间使用面积。

17

建筑物修缮子类

建筑物号、房间号、修缮开始日期、修缮结束日期、修缮内容、修缮经费、修缮单位、经费来源码、经办人号、修缮说明。

18

学校设施数据子类

设施号、设施产权码、设施使用状况码、所属学校单位层次码、设施名称、建设年月、建设费用、修缮年月、修缮费用、使用是否正常。

19

仪器设备、软件资源与实验室数据类

仪器设备基本数据子类

仪器号、仪器名称、仪器英文名称、学校单位层次码、产权码、使用状况码、分类码、仪器型号、出厂日期、生产国别/地区码、经费科目码、购置日期、生产厂家、出厂号、单据号、图片、仪器地点、设备负责人号、技术指标、仪器配置、价格币种、仪器价格、仪器说明、账务帐号、供货商、保修截止日期、设备来源、是否精密贵重仪器。

20

仪器设备附件数据子类

附件编号、附件数量、附件名称、附件型号规格、附件价格、附件英文名称、人民币总价、出厂日期、生产国别/地区码、购置日期、生产厂家,出厂号、供货商。

21

仪器设备管理数据子类

现状码、使用方向码、使用单位号、经手人号、领用单位、领用人号、维护人数、使用人时数、开设实验个数、开设实验时数、教学时数、科研时数、社会项目时数、保管人号。

22

仪器设备报损、报废数据子类

报损报废日期、报损报废原因、处理结果、经办人号、报废说明。

23

软件资源数据子类

软件编号软件名称、软件分类码、版本号、介质类型、介质数量、授权范围、生产国别/地区码、经费科目码、购置日期、生产厂家、出厂号、单据号、单价、安装调试费、培训及技术支持费。

24

软件资源使用管理数据子类

现状码、使用方向码、使用单位号、经手人号、领用单位、领用人号、维护人数、使用人时数、开设实验个数、开设实验时数、教学时数、科研时数、社会项目时数、保管人号。

25

实验室基本数据子类

实验室号、实验室名称、建立日期、建筑面积、使用面积、实验室位置、负责人号、实验室类别码、实验室电话、实验室介绍。

26

实验项目数据子类

实验序号、实验名称、隶属课程号、实验类别码、专业分类码、实验要求码、实验者类别码、实验者人数、每组人数、实验时数、获奖级别码、常课教师号、实验地点。

27

图书期刊类

图书基本数据子类

图书编号、图书条形码、正标题、并列标题、副标题、检索关键字、图书出版号、第一作者、其他作者、价格、文献类型码、装订码、分类号、中国语种码、语种码、开本、页数、版次、图书附件名称、丛书名称、丛书编著、出版社、出版社级别码、出版地、出版日期、发行单位、备注、图书状态码。

28

期刊基本数据子类

期刊编号、期刊条形码、期刊中文名称、期刊英文名称、期刊出版号、编辑部、主编、每期单价、创刊单价、年号、卷号、期号、总期号、分类号、中国语种码、语种码、期刊类别码、期刊状态码。

      1. 资源元数据目录

资源元数据目录包括教学资源数据类1个数据类。元数据目录如下表所示:

序号

数据类

数据子类

包含的数据项

1

教学资源数据类

文本资源数据子类

编码、字体、参考值、存储格式、文字量、其他、位置路径。

2

图片资源数据子类

扫描分辨率、颜色、尺寸、格式、源文件格式、图片量、位置路径。

3

视频资源数据子类

分辨率、编码、比特率、帧速率、色彩、格式、源文件格式、字幕、错别字、标题、音频、数量、时长、位置路径。

4

音频资源数据子类

采样率、码流、量化位数、声道、格式、语音、时长、其他、位置。

5

专题资源数据子类

传说时代、神话的国度、文明的产生、文字的演变、中华思想、传统美德、礼仪之邦、蒙学故事、启蒙之路、博览群书、巾帼英雄、古代科技、传统民间工艺、中国制造、对外交往、格言名句、中国人、中国符号、中华烹饪、传统服饰、传统民居、传统节日、民风民俗、中华医药、传统体育、中华武术、图腾文化、思想争锋、中华典籍、中华诗词、中国绘画、中国书法、中国小说、中国散文、中国戏曲、中国民乐、中国舞蹈、古代宗教、古代的政治生、中华古都、物质遗产、非物质遗产。

    1. 地区级建设(市/区/县
      1. 区域大数据决策支持服务平台

区域大数据决策支持服务平台能够实现区域内教育数据资源的集中采集汇聚,共享管理及联动分析,一致的数据应用服务。实现与各类应用系统的数据交换,对积累的数据资产进行有效的管理,并提供数据访问控制的手段,为多个系统的无缝衔接、业务融通和各系统之间的数据共享提供平台,保证数据的及时性、完整性和一致性。实现对区、校两级教育基础数据的实时互通,为深层次数据挖掘、数据分析提供重要基础。

        1. 数据中心

数据中心为整个大数据平台提供基础环境的配置管理、服务调度以及系统底层运行监控和告警处理。通过对计算、存储、数据服务的管理,保障各项服务正常、有序、稳定运行。

          1. 基础平台

平台以开源Hadoop作为底层分布式系统基础架构,以分布式文件系统HDFS和MapReduce算法为核心,为用户提供了分布式的存储能力和分布式的计算能力。同时,整合了Hadoop生态体系内的大数据组件,包含:Tez、Hive、Hbase、Pig、Sqoop、OOzie、Zookeeper、Infra solr、Kafka、Ranger、Spark、Superset等,通过各组件协同,能够轻松实现PB级数据的处理,助力区域用户实现大数据应用价值。

  • 平台概况
  1. 基础环境指标监控

通过对全平台的磁盘、内存、网络、CPU、集群等等基础环境的指标监控,以可视化图标形式全面呈现平台整体运行状态。

可根据时间范围的选择,查看指定时间范围内的平台运行状态。

  1. 指标阀值设置

平台监控指标可自定义预警阀值,根据监控阀值设置,系统进行智能预警处理。

  1. 历史配置管理

基础平台的每次配置变更,都会以历史配置的形式进行保存和记录,方便管理员进行配置追溯。

  • 服务管理

对大数据基础平台所有配置的基础服务组件(Tez、Hive、Hbase、Pig、Sqoop、OOzie、Zookeeper、Infra solr、Kafka、Ranger、Spark、Superset等)进行配置管理、启动、关闭、重启、状态检查、指标查看等,保障服务组件健康运行。

  1. 组件状态

对当前服务组件的运行状态进行查看,包括服务的起停状态、运行时间、内存使用率、节点状态等。

  1. 组件热力图

根据组件内相关指标的设置,以热力图形式查看每个指标的状态。

  1. 组件配置

对组件中的项目配置项进行管理,包括节点内容、磁盘空间等等。每一次的配置都以一个配置版本的形式进行保存,用户可选择对应版本的查看对应的配置信息。

  1. 测度

对组件内的相关服务指标以图标形式进行状态呈现。可选择相应时间段,查看对应的指标信息。

  1. 组件管理

对组件的运行状态进行变更,包括开启、停止、重启、运行检查、卸载服务等。

  • 主机管理

对运行大数据基础服务组件的硬件主机环境进行监控,查看主机所承载的组件信息以及主机的负载信息。

  1. 主机整体概况

对当前大数据环境所使用的所有主机信息,以主机列表的形式进行概览信息查看。概览信息包括:主机名称、IP地址、机架名称、CPU核心数、内存、磁盘使用情况、负载均值、版本、承载组件数量。

  1. 集群概要
  1. 对当前集群主机进行统一管理,包括开启所有组件、停止所有组件、重启所有组件、

设置机架、删除主机、检查主机、下载配置、恢复主机等。

  1. 对当前主机集群所承载的组件列表、主机状态指标(包括:CPU使用率、磁盘使用率、负载、内存使用率、网络使用率、进程、运行时间等)、主机基本信息(包括:主机名、IP地址、机架、操作系统、CPU核数、磁盘、内存、负载均值、心跳等)信息进行查看与管理。

  1. 配置

对当前主机所承载的所有服务组件进行配置管理。

  1. 告警

对当前主机所有产生的预警信息进行查看。

  1. 版本

对当前主机的配置版本信息进行查看,每一次的配置变更,都以一个版本的形式进行留存。

  • 告警管理

平台对大数据基础组件服务的所有告警信息进行集中统一的管理。

  1. 告警配置

为平台组件服务配置相应的告警组,以及相应的通知信息内容、方式和人员。

  1. 告警组

为每一个服务管理告警组。查看各个服务的告警组列表以及定义的配置信息。也可以添加或者移除告警定义,为告警组挑选通知。

  1. 告警通知

设置告警通知的方式及人员信息。

  1. 告警查阅

以列表形式查看平台所有的告警信息,包括状态、告警定义名称、服务、上次状态改变、当前状态。

获取完整版文档请添加关注并私信沟通!

猜你喜欢

转载自blog.csdn.net/2301_76549664/article/details/130058812