生成式人工智能教学创新评价平台

Project Workbench

项目工作台

从整体进展、课例任务、模型状态和风险提醒出发，为领导和项目负责人提供统一的进入界面。

把教学案例、课堂行为、AI 介入与生成式成果统一沉淀为可管理、可评估、可研究的数据资产。

该工作台用于统览项目建设情况，左侧是模块入口，右侧是实际业务视图。领导可从这里看到课例规模、样本质量、模型成熟度和近期产出，不需要先理解底层技术，也能快速判断平台的建设状态。

接入课例 126 本周新增 18 节

已结构化样本 98 完成率 77%

模型版本 2.4 昨晚完成调参

待复核任务 12 教师反馈待处理

78% 项目进度

数据采集实施 按计划推进

模型定制开发 待二轮复核

交互系统 界面完成

分析报告 持续生成

课例任务台账

课例名称	学科	来源学校	数据状态	分析状态	操作
数学探究：多路径解题	数学	江汉大学附属实验学校	结构化完成	报告已生成	查看详情
科学实验：变量控制	科学	市直属示范校	转录完成	待教师复核	进入复核
阅读表达：观点改写	语文	光谷实验中学	结构化完成	模式入库	查看报告
英语口语：主题协作表达	英语	开发区外国语学校	标注进行中	待分析	补充数据
综合实践：校园空间设计	综合实践	江岸区联合教研组	接入完成	队列中	查看队列

近期活动记录

18:36

模型版本 v2.4 发布 新增“生成式成果适切性”判定逻辑，回归测试通过。

17:58

新增课例 6 节 来自数学、英语和科学三类教学创新场景，已进入清洗队列。

16:42

教师反馈回流 收到 3 条误判修正意见，已同步给模型定制中心。

15:15

研究报告导出 完成《高效任务驱动 + AI 辅助》专题简报生成。

当前重点观察

重点模式评分 9.1

AI 辅助任务驱动

在数学探究和综合实践课中表现稳定，关键特征是教师先设任务，再用 AI 生成对照材料辅助学生比较。

重点风险评分 7.8

先看 AI 再回答

部分课堂出现学生先读取 AI 结果后直接复述的问题，造成原生思考时间不足，属于重点风险模式。

本周趋势 +23%

生成式成果纳入评价

本周新增多个将 AI 生成内容纳入教学评价的课例，系统已支持按成果质量、适切性和目标匹配度进行评分。

数据采集实施总览

课堂实录 84 音视频资料

教学案例 126 教案课件任务单

生成式成果 342 文本图像结构化内容

数据质检通过率 93% 持续治理中

数据接入队列

数据包	类型	来源	状态	结构化率
数学探究课第 21 组	课堂音视频 + 任务单	附属实验学校	已入库	96%
英语主题表达批次 B	学生录音 + AI 对话稿	外国语学校	清洗中	74%
科学实验变量控制	实验视频 + 记录单	市直属示范校	已标注	92%
阅读表达改写练习	原稿 + AI 改写稿	光谷实验中学	待归档	88%
综合实践空间设计	图像 + 文本成果	联合教研组	分类中	67%

数据治理流程

统一接入 将课堂实录、案例资料与生成式成果纳入统一课例编号体系。

清洗转录 完成音视频去噪、文本规范化、多模态信息切片与场景对齐。

标注分类 对教学行为、AI 介入方式、学生参与和成果质量进行标签管理。

结构化沉淀 进入研究样本库，可检索、可统计、可用于训练与报告。

标签体系

结构化字段映射

教师行为字段 目标导入、任务布置、提问方式、反馈频率、AI 调用策略、节奏控制。

学生过程字段 参与轮次、表达长度、协作状态、问题提出、任务完成度、迁移表现。

AI 介入字段 介入环节、介入时点、介入强度、工具类型、与学习目标适配度。

生成式成果字段 文本质量、可解释性、原创性、教学适切性、与课堂目标对齐程度。

模型配置概览

基础模型 Qwen 系列中文底座，支持长文本课堂材料理解和结构化输出。

运行环境 推理服务、任务队列、提示模板库、版本管理与回滚机制统一配置。

评价目标 同时覆盖教学行为、学生参与、AI 介入过程与生成式成果质量。

环境配置完成度

提示工程成熟度

评价参数稳定性

成果逻辑训练度

训练任务与版本记录

v2.4 教学行为 + 生成式成果联合训练 新增 18 节带人工修正标签的课例，重点优化“AI 介入适切性”和“成果适切性”两类判断。

已完成

v2.3 课堂过程评价参数调试 调整目标达成、任务设计和参与度权重，修正对讨论型课堂的高估问题。

已上线

v2.5 生成式成果真实性校验子模块 计划引入成果原创性与风险提示规则，适配更复杂的生成式教学实践。

排队中

提示工程模板

模板 A · 探究型课堂

当前启用

根据课堂任务链、学生参与轮次和 AI 介入位置，评估任务组织质量、学生思维展开情况，以及 AI 是否真正促进了比较、推理和表达。

模板 B · 生成式成果评价

稳定

围绕成果适切性、目标对齐、原创性和教学增益进行判断，不只评价内容表面质量，也关注其在课堂中的使用逻辑。

模板 C · 协作表达场景

优化中

重点识别小组协作中的跟随式发言、浅层复述与真实协同建构之间的差异。

评价逻辑维度

课堂过程层 目标达成、任务组织、互动效率、学生参与、节奏控制。

AI 介入层 介入时点、介入强度、辅助价值、替代风险、适配程度。

成果评价层 生成式成果质量、可解释性、可迁移性、与教学目标一致性。

综合输出层 高效模式识别、风险提示、趋势信号与管理侧结论摘要。

当前策略

模型不直接给出笼统“好/不好”结论，而是先判断课堂过程，再判断 AI 使用，再判断成果质量，最后汇总为适合管理者阅读的结构化结果。

评价应用中心

教学评价交互界面 数学探究课 / 学生平板端上传与分析工作流

System Ready

资料上传

分析结果

生成式成果

上传教学资料 课堂音视频、任务单、学习过程数据与 AI 生成内容统一入库。

课堂录屏与录音 已解析 42 分钟

任务单与投屏记录 结构抽取完成

学生过程成果 已关联课例

总评 88

参与度 79%

AI 有效度 91%

分析状态完成

学生使用 AI 生成三种解题路径后，教师没有直接给答案，而是要求小组比较“哪一种路径更适合讲给同学听”。

系统判断：AI 被用于放大学生比较、表达与反思，而非替代推理过程。

目标达成 86

任务设计 84

成果质量 89

迁移表现 81

数学探究：多路径解题 七年级 / 张老师 / 学生平板端

已完成

上传于 04-21 15:02 总评 88

科学实验：变量控制 八年级 / 李老师 / 实验课场景

复核中

上传于 04-21 14:20 总评 85

阅读表达：观点改写 九年级 / 王老师 / 阅读表达课

已归档

上传于 04-20 18:08 总评 90

英语表达：主题协作展示 八年级 / 周老师 / 口语任务课

分析中

上传于 04-21 16:30 总评 81

88 综合评分

课堂结论

课堂摘要任务驱动清晰，学生比较表达较充分
系统建议增加个体独立思考时长，避免小组内跟随式回答
样本归属已纳入“高效任务驱动 + AI 辅助”模式库

处理流程

资料上传音视频、任务单与成果内容已汇集到同一课例
自动分析已完成转录、标注、分类和维度计算
人工复核当前课例无需补录，可直接进入报告中心

教学行为与 AI 介入关联趋势

AI 介入课堂的创新成效曲线常规课堂创新成效曲线

报告中心

《阶段性教学创新成效分析》 覆盖 4 所学校、126 节课例，供管理层阅读。

已生成

《高效与低效教学模式画像》 聚焦 AI 介入方式与成果适切性的典型差异。

可导出

《生成式成果专项风险提示》 识别替代思考、成果失真和目标错位等风险。

待复核

高效与低效模式对比

学生主动参与

高效模式 84%

低效模式 58%

生成式成果质量

高效模式 79%

低效模式 51%

目标对齐程度

高效模式 82%

低效模式 56%

模式库与趋势预判

模式评分 9.2 / 10

AI 辅助任务驱动

先设任务，再用 AI 作为对照材料，能有效提升参与度与表达质量。

模式评分 8.7 / 10

生成式成果复盘

把 AI 结果作为复盘对象，适合训练学生辨析和反思能力。

风险评分 7.8 / 10

先看结果再回答

容易造成原生思考时间不足，是低效模式的高频触发点。

+23% 预计“任务驱动 + AI 对照”类课堂仍将保持最高增长。

3 建议持续跟踪的关键因子：介入时点、任务结构、教师反馈策略。

2 重点风险提醒：成果替代思考、生成内容与教学目标脱节。