kaiyun体育全站入口中国人民大学《大语言模型》书籍中文版开放下载!还配套代码

  新闻资讯     |      2024-08-09 10:02

  kaiyun体育全站入口中国人民大学《大语言模型》书籍中文版开放下载!还配套代码工具库大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦!而且是中文版——《大语言模型》!这本书整理呈现了大模型技术框架和路线图,是一本非常好的入门书籍。 此外kaiyun体育官方网站,官方不仅发布了电子版 PDF 下载链接kaiyun体育官方网站,还提供了配套资源kaiyun体育官方网站。点赞

  第一部分 背景与基础知识 第一章 引言 - 1.1 语言模型的发展历程 - 1.2 大语言模型的能力特点 - 1.3 大语言模型关键技术概览 - 1.4 大语言模型对科技发展的影响 - 1.5 本书的内容组织 第二章 基础介绍 - 2.1 大语言模型的构建过程 - 2.2 扩展法则 - 2.3 涌现能力 - 2.4 GPT 系列模型的技术演变 第三章 大语言模型资源 - 3.1 公开可用的模型检查点或 API - 3.2 常用的预训练数据集 - 3.3 常用微调数据集 - 3.4 代码库资源 第二部分 预训练 第四章 数据准备 - 4.1 数据来源 - 4.2 数据预处理 - 4.3 词元化 (分词) - 4.4 数据调度 第五章 模型架构 - 5.1 Transformer 模型 - 5.2 详细配置 - 5.3 主流架构 - 5.4 长上下文模型 - 5.5 新型模型架构 第六章 模型预训练 - 6.1 预训练任务 - 6.2 优化参数设置 - 6.3 可扩展的训练技术 - 6.4 模型参数量计算与效率分析 - 6.5 预训练代码实践 第三部分 微调与对齐 第七章 指令微调 - 7.1 指令数据的构建 - 7.2 指令微调的训练策略 - 7.3 参数高效的模型微调 - 7.4 代码实践与分析 第八章 人类对齐 - 8.1 人类对齐的背景与标准 - 8.2 基于人类反馈的强化学习 - 8.3 非强化学习的对齐方法 - 8.4 关于 SFT 和 RLHF 的进一步讨论 第四部分 大模型使用 第九章 解码与部署 - 9.1 解码策略 - 9.2 解码加速算法 - 9.3 低资源部署策略 - 9.4 其他模型压缩方法 第十章 提示学习 - 10.1 基础提示 - 10.2 上下文学习 - 10.3 思维链提示 第十一章 规划与智能体 - 11.1 基于大语言模型的规划 - 11.2 基于大语言模型的智能体 第五部分 评测与应用 第十二章 评测 - 12.1 评测指标与评测方法 - 12.2 基础能力评测 - 12.3 高级能力评测 - 12.4 公开综合评测体系 第十三章 应用 - 13.1 大语言模型在研究领域的应用 - 13.2 大语言模型在专业领域的应用