大模型轻量化 模型压缩与训练加速
作 者 :梁志远著
出版发行 : 北京:清华大学出版社 , 2025.04
ISBN号 :978-7-302-68600-2
页 数 : 386
原书定价 : 129.00
开本 : 16开
主题词 : 电力行业-1商业案例-中国宇航出版社-STAP-科技发展报告-2030年-Nano-太阳能制冷
中图法分类号 : TP18 ( 工业技术->自动化技术、计算机技术->自动化基础理论->人工智能理论 )
内容提要:
《大模型轻量化:模型压缩与训练加速》围绕大模型轻量化这一主题,系统地阐述大模型轻量化的基本理论与实现方法,旨在提升模型的部署效率和计算性能。全书分为3部分,共10章。第1部分(第1~5章),介绍大模型的背景与面临的问题,以及Transformer和MoE架构的基本原理;重点讲解模型压缩、训练加速和推理优化等核心技术,包括量化、蒸馏和剪枝等,并通过实际案例验证其效果。第2部分(第6、7章),重点介绍端侧学习与计算引擎优化策略,尤其是动态Batch和异构执行的工程实现。第3部分(第8~10章),针对高性能算子库与手工算子开发,分别以cuDNN、NEON、CUDA等为代表,揭示算子优化的细节,最后,以国产开源模型DeepSeek-V3为例,展现从训练到推理的综合优化方案。 《大模型轻量化:模型压缩与训练加速》提供全面实用的轻量化方法论,结合丰富代码示例与实践案例,适合从事大模型开发与优化的工程师,也为研究人员提供深入探讨的素材与视角,助力解决大模型训练与推理中的实际问题。
大模型轻量化 模型压缩与训练加速 pdf
声明:本站所有内容仅供个人学习使用,可为购买实体书做参考。
大语言模型 基础与前沿 pdf
« 上一篇
2026-03-18
大模型动力引擎 pdf
下一篇 »
2026-03-18
