大模型能力认证

青少年组

返回LMCC首页

青少年组

首页 > 动态

CCF中小学大模型教育提纲

2026-06-05

访问量：

一、人工智能导论

1.1 人工智能简介

1.1.1 人工智能的基本含义

1.1.2 人工智能能完成哪些任务

1.1.3 案例：一天中的人工智能应用

1.2 人工智能通常怎样实现

1.2.1 规则驱动方法

1.2.2 数据驱动方法：机器学习

1.2.3 机器学习的典型任务：回归与分类

1.2.4 机器学习的学习方式：监督学习、无监督学习与自监督学习

1.2.5 神经网络基础

1.2.6 案例：从规则提醒到数据预测

1.3 机器学习的基本过程

1.3.1 数据准备：采集、预处理与标注

1.3.2 特征提取

1.3.3 模型训练

1.3.4 基于批次数据的训练方法

1.3.5 案例：一个植物识别模型是怎样训练的

1.4 模型评测

1.4.1 验证与测试

1.4.2 为什么不能只看一次结果

1.4.3 交叉验证

1.4.4 精确率、召回率(基础指标: 准不准/全不全)

1.4.5 AUC：ROC 曲线下面积(综合指标, 整体区分能力)

1.4.6 案例：植物识别模型的表现怎么看

1.5 人工智能应用

1.5.1 自然语言处理

1.5.2 计算机视觉

1.5.3 语音技术

1.5.4 案例：文字、图像与语音如何协同工作

二、大模型基础概念

2.1 自然语言的基础认知

2.1.1 什么是自然语言

2.1.2 计算机如何理解自然语言

2.1.3 案例：从逐词翻译到理解语境

2.2 语言模型的基本定义

2.2.1 语言模型的工作原理

2.2.2 从小模型到大模型

2.2.3 案例：手机输入法中的语言模型

2.3 大语言模型的发展历程

2.3.1 早期探索阶段（统计语言模型时代）

2.3.2 神经网络时代的突破

2.3.3 预训练模型的兴起

2.3.4 大模型时代的到来

2.3.5 案例：从GPT-1到ChatGPT的能力演变

2.4 大语言模型的现状

2.4.1 国际主流大模型介绍

2.4.2 国内大模型发展概况

2.4.3 大模型的应用领域

2.4.4 大模型技术的未来趋势

2.4.5 如何正确使用大模型

2.4.6 案例：用大模型辅助学习：一个具体的场景

三、模型架构

3.1 主流架构

3.1.1 编码器-解码器架构

3.1.2 因果解码器架构

3.1.3 案例：三种架构的适用场景对比

3.1.4 案例：以Qwen2-7B为例解读因果解码器架构

3.2 注意力机制

3.2.1 基本概念

3.2.2 自注意力机制

3.2.3 交叉注意力机制

3.2.4 注意力权重分配

3.2.5 掩码机制

3.2.6 案例：注意力机制如何理解一道推理题

3.3 Transformer模型

3.3.1 输入编码

3.3.2 多头自注意力机制

3.3.3 前馈网络层

3.3.4 案例：Transformer处理"给我写一首关于春天的诗"的全过程

四、预训练技术

4.1 预训练总体介绍

4.1.1 预训练的基本思想

4.1.2 预训练的目的

4.1.3 预训练、微调与对齐的区别

4.2 预训练数据准备

4.2.1 数据收集

4.2.2 数据预处理

4.2.3 词元化

4.2.4 数据配比与数据课程

4.2.5 案例：从网页文本到预训练样本

4.3 预训练过程

4.3.1 从数据样本到模型更新

4.3.2 算力资源与训练成本

4.3.3 训练监控、检查点与稳定性

4.3.4 案例：一次大模型预训练任务是如何完成的

五、后训练技术

5.1 后训练概述

5.1.1 为什么需要后训练

5.1.2 后训练的基本流程

5.1.3 案例：预训练模型与微调后模型的对比

5.2 指令微调

5.2.1 指令微调的概念

5.2.2 指令数据集的构建

5.2.3 指令微调的常见方法

5.2.4 案例：针对特定任务的指令模版设计

5.3 人类对齐

5.3.1 人类对齐的概念

5.3.2 对齐标准：有用性、诚实性、无害性

5.3.3 人类对齐的常见方法：强化学习和RLHF

5.3.4 案例：模型安全性评估与偏见过滤

5.4 复杂推理

5.4.1 复杂推理的相关概念：认知推理、长思维链模型

5.4.2 长思维链模型的数据集构建

5.4.3 长思维链模型的训练方式： RLVR

5.4.4 案例：长思维链模型与普通模型的解题过程对比

六、解码与部署

6.1 解码的目的

6.2 常见解码方法

6.2.1 解码方法概览

6.2.2 贪心搜索

6.2.3 束搜索

6.2.4 案例：一句诗的解码

6.3 部署与实践

6.3.1 实践挑战：贪心搜索

6.3.2 实践挑战：束搜索

6.3.3 案例：一款翻译软件的解码切换

七、提示工程

7.1提示工程的重要意义

7.1.1 提示是什么

7.1.2 提示为什么会影响模型输出

7.1.3 提示撰写中的常见问题

7.1.4 案例：从一句简单提示到可用回答

7.2 提示的基础设计原则

7.2.1 明确任务目标

7.2.2 补充背景信息

7.2.3 写清限制条件

7.2.4 规定输出格式

7.2.5 案例：一条完整提示是怎样写成的

7.3 提示的进阶方法

7.3.1 任务拆分与步骤化提示

7.3.2 示例引导

7.3.3 角色设定与受众设定

7.3.4 结构化提示

7.3.5 反问澄清与条件补充

7.3.6 多轮修改与结果优化

7.3.7 案例：失物招领公告的进阶提示设计

八、智能体

8.1 智能体基础与核心概念

8.1.1 智能体的定义

8.1.2 智能体的核心组成要素

8.1.3 智能体与大语言模型的区别

8.1.4 案例：校园阅读节智能助手

8.2 智能体的结构与工作流程

8.2.1 角色配置：Profile 与边界规则

8.2.2 规划模块与目标分解

8.2.3 工具模块与记忆模块

8.2.4 智能体的标准工作流程

8.2.5 案例：任务分解与边界控制

8.3 工具调用与部署

8.3.1 推理阶段的关键控制项

8.3.2 工具调用的基本机制

8.3.3 部署为服务的基本方法

8.3.4 案例：用智能体制作科普漫画

九、多模态模型

9.1 多模态模型基础与核心概念

9.1.1 多模态信息提取与理解

9.1.2 多模态模型的使用场景

9.1.3 多模态技术的发展脉络

9.1.4 案例：多模态信息如何协同工作

9.2 代表性多模态大模型

9.2.1 多模态融合的核心思想

9.2.2 多模态模型的典型结构

9.2.3 CLIP：图文匹配模型

9.2.4 视觉语言大模型

9.2.5 案例：一道图文结合题是怎样被理解的

9.3 多模态模型的典型应用

9.3.1 图文理解：从看图到回答问题

9.3.2 跨模态转换：语音、文字与图像互通

9.3.3 局限、风险与使用边界

9.3.4 案例：从"找对应"到"做解释"

十、大语言模型评测

10.1 大语言模型评测基础

10.1.1 大语言模型评测的重要意义

10.1.2 大语言模型评测范式

10.1.3 大语言模型评测流程

10.1.4 案例：知名评测基准介绍

10.2 核心性能的评测

10.2.1 客观评测（Perplexity、BLEU、ROUGE、pass@k、假设检验）

10.2.2 主观评测（人工评测、LLM-as-a-judge、一致性度量（Cohen's Kappa））

10.2.3 案例：针对翻译任务的BLEU指标计算实例

10.3 伦理安全的评测

10.3.1 模型偏见相关概念

10.3.2 安全性评测与治理

10.3.3 案例：典型模型偏见案例分析及优化前后对比

共10个部分，建议每个部分2-4课时