模型算法 强化学习微调与对齐
作者:
余昌叶著
出版发行: 北京:电子工业出版社 , 2025.04
I S B N 号: 978-7-121-50072-5
页数: 230
丛书名: 通用智能与大模型丛书
原书定价: 109.00
开本: 16开
主题词: 代数-Mathematics-几何-Springer-MO-数学分析-math-分析
中图法分类号:
TP391 ( 工业技术->自动化技术、计算机技术->计算技术、计算机技术->计算机的应用 )
内容提要:
本书系统地讲解了大模型技术、训练算法(包括强化学习、RLHF、DPO、SFT与蒸馏等)、效果优化及其实践。全书以大语言模型为核心,内容广泛且深入,绝大部分内容适用于视觉语言模型和多模态大语言模型。本书适合AI算法与工程领域的从业者,相关专业的学生,希望深入了解大模型技术、拥抱AI与大模型浪潮的读者阅读。
模型算法 强化学习微调与对齐
声明:本站所有内容仅供个人学习使用,可为购买实体书做参考。
地球物理反演理论、算法及应用 pdf
« 上一篇
2026-05-05
大模型技术30讲 pdf
下一篇 »
2026-05-05
