
会员
强化学习:原理与Python实战
更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
最新上架
- 会员
ChatGPT漫谈
本书深度探讨了构建和训练ChatGPT模型涉及的核心技术,以及ChatGPT在各种实际应用中的作用。全书精心划分为三部分,其中第1章为第1部分,第2章为第2部分,第3章和第4章为第3部分。首先,详细阐述了机器学习的历史演变与各种学习范式,同时也揭示了在人工智能生成内容(AIGC)领域下,图像处理和自然语言处理技术的历史发展趋势;接下来,对ChatGPT的运行机制和关键算法进行深度解析,包括大规模模计算机10.8万字 - 会员
深度学习时代的计算机视觉算法
本书着重阐述了深度学习时代的计算机视觉算法的工作原理,首先对深度学习与计算机视觉基础进行了介绍,之后对卷积神经网络结构的演化过程,以及基于深度学习的目标检测算法、图像分割算法、人体姿态估计算法、行人重识别与目标跟踪算法、人脸识别算法以及图像超分辨率重建方法进行了介绍。本书系统讲解了在日常生活和工作中常见的几项计算机视觉任务,并着重介绍了在当今深度学习时代,这些计算机视觉任务是如何工作的,可使读者快计算机9.9万字 具身智能:人工智能的下一个浪潮
自人工智能(AI)的概念诞生之日起,科学家们就热衷于探讨它的发展路径。第一阶段毫无疑问是计算智能,经过半个多世纪,AI在运算能力和记忆方面早已超越人类。第二阶段,是感知智能,让机器可以看得懂听得懂这个世界。科学界认为,尚未到来的第三阶段,是认知智能,甚至提到一个词:认知时代。我们来到大模型时代或者是生成式人工智能时代了吗?如果我们此时此刻正身处这个时代,那上一个是什么时代?有人说,大规模预训练已经计算机11.3万字- 会员
知识图谱从0到1:原理与Python实战
本书旨在帮助读者全面理解知识图谱的基本原理和概念。通过清晰的解释和实例,读者将深入了解知识图谱的构建、表示、推理等关键知识点。此外,本书通过提供代码实战,引导读者亲自动手构建知识图谱,并应用各种技术和工具进行实践。这种实践性的讲解方法可帮助读者更深入地理解知识图谱的实际应用。本书的目标是帮助读者全面理解知识图谱的基本原理和概念,并通过代码实战构建知识图谱。同时,本书也提供了关于大语言模型与知识图谱计算机9.6万字 大模型垂直领域低算力迁移:微调、部署与优化
本书是一本深度探讨大模型在低算力环境下实现迁移与微调的实践指南,并深入讲解了大模型的部署与优化策略。书中结合多个垂直领域的应用场景,从理论到技术实现,全程详尽讲解了如何应对大模型在行业落地中的技术挑战,帮助读者逐步掌握大模型的迁移与微调核心技术。无论你是大模型开发者、人工智能研究人员,还是对垂直领域AI应用感兴趣的行业专家,本书都将带你深入大模型的核心领域,提供从构建、优化到部署的全流程指导,助你计算机13.7万字- 会员
巧用ChatGPT轻松学演讲
本书分为23章,从基础的演讲知识入手,到演讲稿的写作技巧,再到指导读者如何有效地利用ChatGPT进行演讲稿写作和演讲练习,最后通过实际的行业案例进行深入的学习和实战应用。使读者不仅可以学习演讲的相关知识,还能对如何利用ChatGPT进行有效的演讲有所理解。计算机19.1万字 - 会员
预训练语言模型:方法、实践与应用
近年来,在自然语言处理领域,基于预训练语言模型的方法已形成全新范式。本书内容分为基础知识、预训练语言模型,以及实践与应用3个部分,共9章。第一部分全面、系统地介绍自然语言处理、神经网络和预训练语言模型的相关知识。第二部分介绍几种具有代表性的预训练语言模型的原理和机制(涉及注意力机制和Transformer模型),包括BERT及其变种,以及近年来发展迅猛的GPT和提示工程。第三部分介绍了基于Lang计算机12.7万字 - 会员
奇点到来:AIGC引爆增长新范式
增长是企业利用计算机、大数据、人工智能等新技术实现经营增长的新思路和新方法,本书作为该领域的入门级读物,介绍了AIGC在增长领域的技术和实战应用。本书分为4部分,第1部分、第2部分、第4部分主要针对有兴趣了解AIGC背后技术原理、增长模式的变化以及截至2023年3月业界、学术界的最新技术进展的读者;第3部分包含AI的基础知识、基础模型,并从实战应用角度介绍作为应用开发者如何高效上手与利用最新的开源计算机21.9万字 - 会员
空间智能原理与应用
本书从空间信息处理角度出发,将人工智能领域的理论研究与专业实践相结合,完整介绍人工智能方法及其在空间信息处理中的应用,不仅涵盖人工智能领域的基础概念与基本方法,而且探讨知识图谱、计算智能、新兴机器学习、深度学习等前沿技术,同时介绍人工智能在地理文本大数据、遥感影像、激光点云等空间信息处理中的应用实例,具有较强的代表性和启发性。本书可以作为高等院校空间信息与数字技术、遥感科学与技术等专业高年级本科生计算机23.8万字