大模型能力认证
青少年组
青少年组
首页 > 动态
CCF中小学大模型教育提纲

2026-06-05

访问量:

10个部分,建议每个部分2-4课时

 

一、人工智能导论

1.1 人工智能简介

1.1.1 人工智能的基本含义

1.1.2 人工智能能完成哪些任务

1.1.3 案例:一天中的人工智能应用

 

1.2 人工智能通常怎样实现

1.2.1 规则驱动方法

1.2.2 数据驱动方法:机器学习

1.2.3 机器学习的典型任务:回归与分类

1.2.4 机器学习的学习方式:监督学习、无监督学习与自监督学习

1.2.5 神经网络基础

1.2.6 案例:从规则提醒到数据预测

 

1.3 机器学习的基本过程

1.3.1 数据准备:采集、预处理与标注

1.3.2 特征提取

1.3.3 模型训练

1.3.4 基于批次数据的训练方法

1.3.5 案例:一个植物识别模型是怎样训练的

 

1.4 模型评测

1.4.1 验证与测试

1.4.2 为什么不能只看一次结果

1.4.3 交叉验证

1.4.4 精确率、召回率(基础指标: 准不准/全不全)

1.4.5 AUCROC 曲线下面积(综合指标, 整体区分能力)

1.4.6 案例:植物识别模型的表现怎么看

 

1.5 人工智能应用

1.5.1 自然语言处理

1.5.2 计算机视觉

1.5.3 语音技术

1.5.4 案例:文字、图像与语音如何协同工作

 

二、大模型基础概念

2.1 自然语言的基础认知

2.1.1 什么是自然语言

2.1.2 计算机如何理解自然语言

2.1.3 案例:从逐词翻译到理解语境

 

2.2 语言模型的基本定义

2.2.1 语言模型的工作原理

2.2.2 从小模型到大模型

2.2.3 案例:手机输入法中的语言模型

 

2.3 大语言模型的发展历程

2.3.1 早期探索阶段(统计语言模型时代)

2.3.2 神经网络时代的突破

2.3.3 预训练模型的兴起

2.3.4 大模型时代的到来

2.3.5 案例:从GPT-1ChatGPT的能力演变

 

2.4 大语言模型的现状

2.4.1 国际主流大模型介绍

2.4.2 国内大模型发展概况

2.4.3 大模型的应用领域

2.4.4 大模型技术的未来趋势

2.4.5 如何正确使用大模型

2.4.6 案例:用大模型辅助学习:一个具体的场景

  

三、模型架构

3.1 主流架构

3.1.1 编码器-解码器架构

3.1.2 因果解码器架构

3.1.3 案例:三种架构的适用场景对比

3.1.4 案例:以Qwen2-7B为例解读因果解码器架构

 

3.2 注意力机制

3.2.1 基本概念

3.2.2 自注意力机制

3.2.3 交叉注意力机制

3.2.4 注意力权重分配

3.2.5 掩码机制

3.2.6 案例:注意力机制如何理解一道推理题

 

3.3 Transformer模型

3.3.1 输入编码

3.3.2 多头自注意力机制

3.3.3 前馈网络层

3.3.4 案例:Transformer处理"给我写一首关于春天的诗"的全过程

 

四、 预训练技术

4.1 预训练总体介绍

4.1.1 预训练的基本思想

4.1.2 预训练的目的

4.1.3 预训练、微调与对齐的区别

 

4.2 预训练数据准备

4.2.1 数据收集

4.2.2 数据预处理

4.2.3 词元化

4.2.4 数据配比与数据课程

4.2.5 案例:从网页文本到预训练样本

 

4.3 预训练过程

4.3.1 从数据样本到模型更新

4.3.2 算力资源与训练成本

4.3.3 训练监控、检查点与稳定性

4.3.4 案例:一次大模型预训练任务是如何完成的

  

五、后训练技术

5.1 后训练概述

5.1.1 为什么需要后训练

5.1.2 后训练的基本流程

5.1.3 案例:预训练模型与微调后模型的对比

 

5.2 指令微调

5.2.1 指令微调的概念

5.2.2 指令数据集的构建

5.2.3 指令微调的常见方法

5.2.4 案例:针对特定任务的指令模版设计

 

5.3 人类对齐

5.3.1 人类对齐的概念

5.3.2 对齐标准:有用性、诚实性、无害性

5.3.3 人类对齐的常见方法:强化学习和RLHF

5.3.4 案例:模型安全性评估与偏见过滤

 

5.4 复杂推理

5.4.1 复杂推理的相关概念:认知推理、长思维链模型

5.4.2 长思维链模型的数据集构建

5.4.3 长思维链模型的训练方式: RLVR

5.4.4 案例:长思维链模型与普通模型的解题过程对比

 

六、解码与部署

6.1 解码的目的

 

6.2 常见解码方法

6.2.1 解码方法概览

6.2.2 贪心搜索

6.2.3 束搜索

6.2.4 案例:一句诗的解码

 

6.3 部署与实践

6.3.1 实践挑战:贪心搜索

6.3.2 实践挑战:束搜索

6.3.3 案例:一款翻译软件的解码切换

 

七、提示工程

7.1提示工程的重要意义

7.1.1 提示是什么

7.1.2 提示为什么会影响模型输出

7.1.3 提示撰写中的常见问题

7.1.4 案例:从一句简单提示到可用回答

 

7.2 提示的基础设计原则

7.2.1 明确任务目标

7.2.2 补充背景信息

7.2.3 写清限制条件

7.2.4 规定输出格式

7.2.5 案例:一条完整提示是怎样写成的

 

7.3 提示的进阶方法

7.3.1 任务拆分与步骤化提示

7.3.2 示例引导

7.3.3 角色设定与受众设定

7.3.4 结构化提示

7.3.5 反问澄清与条件补充

7.3.6 多轮修改与结果优化 

7.3.7 案例:失物招领公告的进阶提示设计

 

八、智能体

8.1 智能体基础与核心概念

8.1.1 智能体的定义

8.1.2 智能体的核心组成要素

8.1.3 智能体与大语言模型的区别

8.1.4 案例:校园阅读节智能助手

 

8.2 智能体的结构与工作流程

8.2.1 角色配置:Profile 与边界规则

8.2.2 规划模块与目标分解

8.2.3 工具模块与记忆模块

8.2.4 智能体的标准工作流程

8.2.5 案例:任务分解与边界控制

 

8.3 工具调用与部署

8.3.1 推理阶段的关键控制项

8.3.2 工具调用的基本机制

8.3.3 部署为服务的基本方法

8.3.4 案例:用智能体制作科普漫画

 

九、多模态模型

9.1 多模态模型基础与核心概念

9.1.1 多模态信息提取与理解

9.1.2 多模态模型的使用场景

9.1.3 多模态技术的发展脉络

9.1.4 案例:多模态信息如何协同工作

 

9.2 代表性多模态大模型

9.2.1 多模态融合的核心思想

9.2.2 多模态模型的典型结构

9.2.3 CLIP:图文匹配模型

9.2.4 视觉语言大模型

9.2.5 案例:一道图文结合题是怎样被理解的

 

9.3 多模态模型的典型应用

9.3.1 图文理解:从看图到回答问题

9.3.2 跨模态转换:语音、文字与图像互通

9.3.3 局限、风险与使用边界

9.3.4 案例:从"找对应""做解释"

 

十、大语言模型评测

10.1 大语言模型评测基础

10.1.1 大语言模型评测的重要意义

10.1.2 大语言模型评测范式

10.1.3 大语言模型评测流程

10.1.4 案例:知名评测基准介绍

 

10.2 核心性能的评测

10.2.1 客观评测(PerplexityBLEUROUGEpass@k、假设检验)

10.2.2 主观评测(人工评测、LLM-as-a-judge、一致性度量(Cohen's Kappa))

10.2.3 案例:针对翻译任务的BLEU指标计算实例

 

10.3 伦理安全的评测

10.3.1 模型偏见相关概念

10.3.2 安全性评测与治理

10.3.3 案例:典型模型偏见案例分析及优化前后对比

版权所有:中国计算机学会 京ICP备13000930号-4 京公网安备 11010802032778号
Powered by Huaweicloud