1、重构教育图景:教育专用大模型研究报告(简版)(简版)中国教育科学研究院数字教育研究所之江实验室智能教育研究中心2023 年 12 月1当前,新一代人工智能技术迅猛发展,在全球引起了广泛关注。2023 年 11 月,OpenAI 召开首个开发者大会,发布了 GPTs 及最新开发技术,让每个人都可以通过自然语言人机对话的方式创建自定义大模型。同时,百度、阿里巴巴、华为、科大讯飞等国内科技企业相继发布了多款人工智能大模型,提供中国解决方案。未来,人工智能大模型将深度融入各领域各环节,赋能千行百业智能升级,助力社会生产力跃升。从通用大模型到教育专用大模型,是人工智能大模型技术深化发展的重要趋势。这不只
2、是在通用大模型基础上进行微调和优化,而是一种基于教育场景、开放模型架构的重大创新。教育专用大模型是指以通用大模型为基础的多层次开放技术架构,以多样的教育数字化应用为驱动,通过统一交互对话界面向师生和社会学习者提供专业能力。它具备丰富多样的教育专业知识,并在应用中持续升级。在这个背景下,中国教育科学研究院数字教育研究所和之江实验室智能教育研究中心组建研究团队,聚焦教育专用大模型,从技术基础、应用现状、潜在挑战、创新构思、落地场景等方面开展研究,形成了重构教育图景:教育专用大模型研究报告。2第一章 教育专用大模型的技术基础“大模型”(large models)是指具有数十亿到数百亿甚至更多可训练参
3、数的人工智能模型,它是深度学习、GPU 硬件、大规模数据集等多种技术共同发展的产物。大模型所展现的强大能力实质上是深度学习中“量变引起质变”的结果。当模型参数量达到一定规模时,模型准确率会经历质的飞跃,这一过程被称之为“涌现能力”,即从原始训练数据中自动学习并发现新的、更高层次的特征和模式的能力。这些能力突出表现为通用的用户意图理解能力、强大的大范围上下文连续对话能力、智能的交互修正能力、内容的润色分类和总结能力、新内容的生成能力、多模态能力。作为重点研发领域之一,教育专用大模型是大模型技术、知识库技术以及各类智能教育技术的集成应用,将在教育过程中训练形成教育新场景,实现人类学习和机器学习的双
4、向建构。当前,教育专用大模型主要采取两种技术路线:一是直接调用通用大模型,通过微调或提示学习的方式使之具备一定专业能力;二是利用教育领域专业数据,专门训练用于解决教育任务的大模型。这两种技术路线都取得了一定进展,但实现效果仍有待提升。由于缺乏足够的专业数据训练,教育深度知识不够,智能性不强,难以灵活处理复杂多变的教育任务。3如何研发教育专用大模型,破解之道在于两条技术路线整合起来。这并非简单相加,而是通过建立一种全新的开放技术架构,系统整合通用问题解决能力和教育专用问题解决能力,实现技术突破。具体来说,要要结合通用大模型与教育结合通用大模型与教育领域专业数据领域专业数据,打破数据孤岛,通过开放
5、数据接口源源不断地获得来自常态化教育应用中的数据;要以专家知识库作为要以专家知识库作为大模型的补充大模型的补充,将学科知识和教育教学中的各种规则有意识地“教”给大模型;要整合应用各类智能教育技术要整合应用各类智能教育技术,将已经发展起来的各类智能教育技术集成于教育专用大模型之中。第二章 教育专用大模型的案例分析大模型在口语练习、数学学习、情感分析和个性化推荐等方面为教育带来巨大潜力和可能性。我们梳理了五种典型的教育专业大模型应用案例,对其发展背景、应用场景、设计特色等进行了深度分析。表 1 教育专用大模型典型应用案例序号序号典型应用产品典型应用产品研发单位研发单位采用的大模型采用的大模型学科类
6、型学科类型1星火语伴科大讯飞星火认知大模型语言学习2EmoGPT华东师大自研大模型心理疏导3MathGPT好未来自研大模型数学学习4智海-三乐阿里云通义千问AI 知识学习5Khanmigo可汗学院ChatGPT-4多学科学习4从应用场景看从应用场景看,星火语伴主要用于语言学习,支持多语言文本、语音和图片的实时翻译,并能纠正语法错误,提供口语陪练等。EmoGPT 用于提供心理健康服务,能识别和响应用户情绪,提供持续的心理支持。MathGPT 面向全球数学爱好者和科研机构,提供解题和讲题算法,支持用户进行数学解题和练习。智海-三乐用于 AI 专业教育,提供搜索引擎、计算引擎和本地知识库等功能,支持