会员
强化学习:原理与Python实战
肖智清更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
肖智清
主页
同类热门书
最新上架
- 会员
机器学习中的统计思维(Python实现)
机器学习是人工智能的核心,而统计思维则是机器学习方法的核心:从随机性中寻找规律性。例如,利用损失最小化思想制定学习策略,采用概率最大化思想估计模型参数,利用方差对不确定性的捕捉构造k维树,采用贝叶斯公式构建分类决策模型,等等。只有树立正确的统计思维,才能准确高效地运用机器学习方法开展数据处理与分析。本书以统计思维的视角,揭示监督学习中回归和分类模型的核心思想,帮助读者构建理论体系。计算机18万字 - 会员
人工智能对北京市就业的影响与应对
人工智能作为数字经济及高精尖产业发展的原创性、引领性和代表性技术,在北京国际科技创新中心、全球数字经济标杆城市的建设中迎来了发展的“关键窗口期”和“政策红利期”,成为北京高质量发展的重要引擎和打造高质量就业“北京样板”的重大机遇。本书是一部经济学学术专著,书稿导向积极。本书采用多元数据来源,运用案例研究法、舆情分析与大数据分析法等多种研究方法,从产业与就业动态匹配视角,聚焦人工智能对北京市就业的影计算机25.6万字 - 会员
合成生物学智能化设计与应用
本书以人工智能技术在合成生物学领域的理论、方法及应用为主线,详细阐述人工智能在合成生物学不同层面设计中的应用进展,深入讨论人工智能在合成生物学实际应用中面临的挑战与困难。本书先概述合成生物学与人工智能基本概念以及发展简史,然后介绍人工智能技术在生物元件、生物模块、生物系统设计方面的应用,并通过案例展示了人工智能与合成生物学技术在生物医药领域的研究进展,最后分析了人工智能驱动合成生物技术的发展趋势,计算机23万字 - 会员
MindSpore大语言模型实战
随着ChatGPT等大语言模型的迅速发展,大语言模型已经成为人工智能领域发展的快车道,不同领域涌现出各种强大的新模型。开发者想要独立构建、部署符合自身需求的大语言模型,需要理解大语言模型的实现框架和基本原理。本书梳理大语言模型的发展,首先介绍Transformer模型的基本原理、结构和模块及在NLP任务中的应用;然后介绍由只编码(Encoder-Only)到只解码(Decoder-Only)的技术计算机6.6万字 - 会员
ChatGPT漫谈
本书深度探讨了构建和训练ChatGPT模型涉及的核心技术,以及ChatGPT在各种实际应用中的作用。全书精心划分为三部分,其中第1章为第1部分,第2章为第2部分,第3章和第4章为第3部分。首先,详细阐述了机器学习的历史演变与各种学习范式,同时也揭示了在人工智能生成内容(AIGC)领域下,图像处理和自然语言处理技术的历史发展趋势;接下来,对ChatGPT的运行机制和关键算法进行深度解析,包括大规模模计算机10.8万字 - 会员
自适应和反应式机器人控制:动态系统法
本书主要介绍如何通过动态系统学习控制律,从而使机器人具备实时反应能力。本书首先介绍机器人学习数据的收集方法,然后重点讲解使用动态系统学习控制律的核心技术,使用动态系统进行轨迹规划的方法,以及使用动态系统进行柔性控制和力控制的方法。本书提供大量应用示例,包括机械臂、拟人手和仿人机器人的全身控制等。本书要求读者熟悉关于机器人控制的基础知识,并熟悉机器学习、统计、优化以及动态系统等相关内容,适合作为高等计算机20.3万字 - 会员
机器学习实战(视频教学版)
《机器学习实战:视频教学版》基于Python语言详细讲解机器学习算法及其应用,用于读者快速入门机器学习。《机器学习实战:视频教学版》共分12章,内容包括机器学习概述、Python数据处理基础、Python常用机器学习库、线性回归及应用、分类算法及应用、数据降维及应用、聚类算法及应用、关联规则挖掘算法及应用、协同过滤算法及应用,最后通过3个综合实战项目(包括新闻内容分类实战、泰坦尼克号获救预测实战、计算机10.1万字 - 会员
AIGC:让生成式AI成为自己的外脑
《AIGC:让生成式AI成为自己的外脑》针对近期较为火热的AIGC技术及其相关话题,介绍AIGC的技术原理、专业知识和应用。全书共分为九章。第一章介绍AIGC技术的基本概念和发展历程;第二、三章介绍AIGC的基础技术栈和拓展技术栈;第四、五章分别讨论了AIGC技术在文本生成和图像生成两个领域的现状和前景;第六章列举了目前较为热门的AIGC技术应用;第七章描述了AIGC的上、中、下游产业链及未来前景计算机12.8万字 - 会员
情感计算
在人工智能的研究中,既包括对于人类理性思维的模拟,还包括对人类感性思维的计算。本书重点讲述的文本情感分析技术就属于后者。该技术源于自然语言处理领域,但也有别于一般的自然语言处理任务。文本情感分析面向的处理对象是社交媒体中产生的用户评论文本,该文本的特点是带有大量的用户主观情感信息,因此该技术的核心是通过自动分析评论文本来进行情感的理解。文本情感分析技术已有20余年的研究历史,凝聚成了多项研究任务和计算机23.3万字