京公网安备 11010802032778号
大模型能力认证
2026-06-05
访问量:
2.1 自然语言的基础认知
2.1.1 什么是自然语言
2.1.2 计算机如何理解自然语言
2.1.3 案例:从逐词翻译到理解语境
2.2 语言模型的基本定义
2.2.1 语言模型的工作原理
2.2.2 从小模型到大模型
2.2.3 案例:手机输入法中的语言模型
2.3 大语言模型的发展历程
2.3.1 早期探索阶段(统计语言模型时代)
2.3.2 神经网络时代的突破
2.3.3 预训练模型的兴起
2.3.4 大模型时代的到来
2.3.5 案例:从GPT-1到ChatGPT的能力演变
2.4 大语言模型的现状
2.4.1 国际主流大模型介绍
2.4.2 国内大模型发展概况
2.4.3 大模型的应用领域
2.4.4 大模型技术的未来趋势
2.4.5 如何正确使用大模型
2.4.6 案例:用大模型辅助学习:一个具体的场景
3.1 主流架构
3.1.1 编码器-解码器架构
3.1.2 因果解码器架构
3.1.3 案例:三种架构的适用场景对比
3.1.4 案例:以Qwen2-7B为例解读因果解码器架构
3.2 注意力机制
3.2.1 基本概念
3.2.2 自注意力机制
3.2.3 交叉注意力机制
3.2.4 注意力权重分配
3.2.5 掩码机制
3.2.6 案例:注意力机制如何理解一道推理题
3.3 Transformer模型
3.3.1 输入编码
3.3.2 多头自注意力机制
3.3.3 前馈网络层
3.3.4 案例:Transformer处理"给我写一首关于春天的诗"的全过程
4.1 预训练总体介绍
4.1.1 预训练的基本思想
4.1.2 预训练的目的
4.1.3 预训练、微调与对齐的区别
4.2 预训练数据准备
4.2.1 数据收集
4.2.2 数据预处理
4.2.3 词元化
4.2.4 数据配比与数据课程
4.2.5 案例:从网页文本到预训练样本
4.3 预训练过程
4.3.1 从数据样本到模型更新
4.3.2 算力资源与训练成本
4.3.3 训练监控、检查点与稳定性
4.3.4 案例:一次大模型预训练任务是如何完成的
5.1 后训练概述
5.1.1 为什么需要后训练
5.1.2 后训练的基本流程
5.1.3 案例:预训练模型与微调后模型的对比
5.2 指令微调
5.2.1 指令微调的概念
5.2.2 指令数据集的构建
5.2.3 指令微调的常见方法
5.2.4 案例:针对特定任务的指令模版设计
5.3 人类对齐
5.3.1 人类对齐的概念
5.3.2 对齐标准:有用性、诚实性、无害性
5.3.3 人类对齐的常见方法:强化学习和RLHF
5.3.4 案例:模型安全性评估与偏见过滤
5.4 复杂推理
5.4.1 复杂推理的相关概念:认知推理、长思维链模型
5.4.2 长思维链模型的数据集构建
5.4.3 长思维链模型的训练方式: RLVR
5.4.4 案例:长思维链模型与普通模型的解题过程对比
6.1 解码的目的
6.2 常见解码方法
6.2.1 解码方法概览
6.2.2 贪心搜索
6.2.3 束搜索
6.2.4 案例:一句诗的解码
6.3 部署与实践
6.3.1 实践挑战:贪心搜索
6.3.2 实践挑战:束搜索
6.3.3 案例:一款翻译软件的解码切换
8.1 智能体基础与核心概念
8.1.1 智能体的定义
8.1.2 智能体的核心组成要素
8.1.3 智能体与大语言模型的区别
8.1.4 案例:校园阅读节智能助手
8.2 智能体的结构与工作流程
8.2.1 角色配置:Profile 与边界规则
8.2.2 规划模块与目标分解
8.2.3 工具模块与记忆模块
8.2.4 智能体的标准工作流程
8.2.5 案例:任务分解与边界控制
8.3 工具调用与部署
8.3.1 推理阶段的关键控制项
8.3.2 工具调用的基本机制
8.3.3 部署为服务的基本方法
8.3.4 案例:用智能体制作科普漫画
9.1 多模态模型基础与核心概念
9.1.1 多模态信息提取与理解
9.1.2 多模态模型的使用场景
9.1.3 多模态技术的发展脉络
9.1.4 案例:多模态信息如何协同工作
9.2 代表性多模态大模型
9.2.1 多模态融合的核心思想
9.2.2 多模态模型的典型结构
9.2.3 CLIP:图文匹配模型
9.2.4 视觉语言大模型
9.2.5 案例:一道图文结合题是怎样被理解的
9.3 多模态模型的典型应用
9.3.1 图文理解:从看图到回答问题
9.3.2 跨模态转换:语音、文字与图像互通
9.3.3 局限、风险与使用边界
9.3.4 案例:从"找对应"到"做解释"
10.1.1 大语言模型评测的重要意义
10.1.2 大语言模型评测范式
10.1.3 大语言模型评测流程
10.1.4 案例:知名评测基准介绍
10.2 核心性能的评测
10.2.1 客观评测(Perplexity、BLEU、ROUGE、pass@k、假设检验)
10.2.2 主观评测(人工评测、LLM-as-a-judge、一致性度量(Cohen's Kappa))
10.2.3 案例:针对翻译任务的BLEU指标计算实例
10.3 伦理安全的评测
10.3.1 模型偏见相关概念
10.3.2 安全性评测与治理
10.3.3 案例:典型模型偏见案例分析及优化前后对比
京公网安备 11010802032778号