1、1从游数智化研究中心从游数智化研究中心AI U COURSE DIGITAL INTELLIGENCE RESEARCH CENTERAI 赋能高校课程质量评价白皮书(2024)2目录目录前言前言.3 3一、一、20242024 年度课程质量评价活动概况年度课程质量评价活动概况.4 41、核心数据全览.42、区域覆盖情况.53、院校类型分布.64、评审模式统计.7二、二、AIAI 评审的实际效益分析评审的实际效益分析.8 81、效率提升量化分析.82、成本效益优化分析.9三、三、AIAI 评审系统(评审系统(Llama-UKPLlama-UKP)的可靠性与一致性多维验证)的可靠性与一致性多维验
2、证.11111、算法有效性实证:AI-专家双盲对照研究.112、AI 与专家评审结果显著性和一致性对比.123、高校接受度与认同度调查.13四、经典案例四、经典案例.14141、教育部第二批人工智能案例公布,从游科技携手郑州大学联合申报.152、“U 课评”助力郑州大学智慧课程评价创新实践获新华网报道.153、“U 课评”携手昆明理工大学,获云南官方媒体和学习强国报道.15五、结论五、结论.16163前言前言在高等教育高质量发展进程中,课程质量评价既是人才培养的“指挥棒”,也是教学改革的“诊断仪”。然而,传统评价模式长期面临三大结构性矛盾:人工评审效率滞后、定性分析缺乏量化支撑以及静态结果难以
3、驱动动态优化。深化新时代教育评价改革总体方案(中发202019 号)明确提出“构建政府、学校、社会等多元参与的评价体系,创新评价工具”,这一要求与从游科技 U 课评 AI 课程质量评价平台(Llama-UKP)的技术路径深度耦合。平台通过多模态数据融合、百万专家智库和生成式报告引擎,实现了“数据采集-智能诊断-精准干预”的全链条评价升级。截至 2024 年 12 月统计数据显示,平台已通过国家版权局权威认证,获得多项计算机软件著作权登记证书,部署范围已覆盖 40 余所高等院校,累计完成课程评审逾 2 万门次。实证数据显示:在效率维度,单课程评审耗时从传统模式的 40 分钟压缩至 3 分钟;在成
4、本维度,综合运营费用降低 80%;在质量维度,AI 评审结果与专家人工评审结果高度一致,标志着人工智能正在将“以评促建、以评促改”的教育理念转化为可验证的数字化解决方案。基于上述实践成果,本白皮书将聚焦四大核心维度,系统阐释 AI 如何驱动教育评价革新:(1 1)U U 课评课评 AIAI 课程质量评价平台的规模化落地能力课程质量评价平台的规模化落地能力;(2 2)全流程效率与成本的双重变革全流程效率与成本的双重变革;(3 3)技术可靠性与教育价值的协同验证技术可靠性与教育价值的协同验证;(4 4)AIAI 赋能的教育评价生态重构实践赋能的教育评价生态重构实践。通过系统性分析,平台期望为高校管
5、理者、教育技术研究者提供可复用的AI 评价实施框架,推动教育评价从“经验判断”迈向“数据+智能驱动”的新阶段。4一、一、20242024 年年度度课程质量评价活动概况课程质量评价活动概况1 1、核心数据全览、核心数据全览2024 年度,从游科技“U 课评”平台已服务 4343 所所高校高校开展课程质量评价活动,累计完成了 2.152.15 万万门次门次课程评审,平台覆盖综合类、医科类、理工科类、师范类、财经类、艺术类、警官类等多类型学校,构建了“数据采集数据采集-智能分析智能分析-决策支持决策支持”的闭环评价生态,为高校提供专家评审、AI 评审及混合评审等多元化选择方案。基于一站式全流程管理机
6、制,实现课程质量评价的自动化和数据驱动。52 2、区域覆盖情况区域覆盖情况据 2024 年度的平台数据显示,已有 43 所高校使用 U 课评开展课程质量评价活动。其中,西南地区共 21 所高校使用,占比 48.84%。华中地区以 12 所高校(27.91%)次之,华南等多个地区合计 10 所高校(23.26%)。表 1 区域覆盖数量情况区域学校数量(所)西南地区21华中地区12华南地区7其他地区131其他地区指服务高校数量未达到独立统计阈值(单区域3 所)的区域。根据教育统计数据处理规范,为保障数据呈现的清晰性与可比性,将此类小样本数据合并为“其他地区”类别。63 3、院校类型分布院校类型分布