
会员
强化学习:原理与Python实战
更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
强化学习:原理与Python实战最新章节
查看全部- 封底
- 作者简介
- 16.8 练习与模拟面试
- 16.7 本章小结
- 16.6 案例:老虎
- 16.5 部分可观测Markov决策过程
- 16.4 半Markov决策过程
- 16.3 非齐次Markov决策过程
- 16.2 连续时间Markov决策过程
- 16.1 平均奖励离散时间Markov决策过程
最新上架
- 会员
ChatGPT进阶:提示工程入门
本书共分为9章,内容涵盖三个层次:介绍与解读、入门学习、进阶提升。第1-2章介绍与剖析了ChatGPT与提示工程,并从多个学科的角度探讨了提示工程学科。第3-5章演示了ChatGPT的实际运用,教你如何使用ChatGPT解决自然语言处理问题,并为你提供了一套可操作、可重复的提示设计框架,让你能够熟练驾驭ChatGPT。第6-9章讲解了来自学术界的提示工程方法,以及如何围绕ChatGPT进行创新。计算机9.7万字 - 会员
DeepSeek应用大全:从入门到精通的全方位案例解析
本书以国产自研的强大AI模型DeepSeek为核心,系统呈现了DeepSeek从基础操作到各领域应用的32个实战案例,旨在帮助读者快速掌握DeepSeek的用法。本书总计32章。第1章讲解DeepSeek的注册与使用,包括访问DeepSeek官网、熟悉DeepSeek的使用界面、本地部署DeepSeek、调用DeepSeekAPI等。第2章讲解提示词的使用技巧,深入讲解如何通过充分提供信息、用词计算机8.3万字 - 会员
DeepSeek操作应用大全:从入门到精通
本书是全面介绍DeepSeek人工智能平台及其应用的实用指南,旨在帮助读者从零基础开始,逐步掌握DeepSeek的各项功能,并最终达到精通水平,能够在各种实际场景中灵活运用DeepSeek解决复杂问题。无论你是人工智能的初学者,还是希望进一步提升技能的专业人士,本书都将为你提供详尽的操作指导和丰富的实战案例。本书共三篇25章,涵盖了DeepSeek的各个方面,从基础入门到高级应用,再到私有化部署,计算机15.6万字 - 会员
豆包:人人都能上手的AI工具
本书全面系统地介绍了字节跳动旗下AI智能助手——豆包的使用方法,涵盖注册登录流程及基本操作要点,并通过丰富多样的学习、工作、生活等场景的应用实例,如化身学习小能手、担当高效职场助手、呈现精彩模拟人物互动等,充分展现了豆包的强大效用。此外,还深入介绍了豆包智能体及其应用实例,以及豆包App的注册/登录方式和便捷功能。随书赠送学习资源,包含50个高效提问公式,40个深度提问模板、100个豆包智能体模板计算机7.1万字 - 会员
ChatGPT时代:ChatGPT全能应用一本通
本书共16章,内容包括人工智能、OpenAI、ChatGPT的概述及其操作技巧。生动展示了ChatGPT在教育与学术、商业管理、新媒体、办公、求职等12个领域的实际运用,同时探讨了ChatGPT当前面临的挑战以及大模型的未来发展方向。计算机12万字 - 会员
AI时代程序员开发之道:ChatGPT让程序员插上翅膀
本书从介绍“ChatGPT第一次接触”开始,分析如何使用该工具来提高开发效率和质量。书中每一章都涵盖了ChatGPT的不同应用场景,从编写各种文档,到辅助进行需求分析和系统设计,以及数据库设计和开发高质量代码等均有讲解。还介绍了如何使用ChatGPT辅助进行系统测试以及任务管理,并对源代码底层逻辑进行了分析。计算机8.8万字 - 会员
高效用DeepSeek:职场逆袭的实战指南
本书以DeepSeek应用为基础,讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导,展示了DeepSeek如何帮助自媒体人打造“爆款”内容,如何为咨询提供高效决策支持,如何在营销中实现流量裂变,如何重塑未来学习范式,以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂,案例丰富,无论是AI(ArtificialIntellig计算机8.2万字 - 会员
向AI提问的艺术:提示工程入门与应用
本书共十一章,主要包含四部分:第1章解读ChatGPT的基础原理和提示工程的基本概念;第2至5章介绍提示工程技巧,涵盖有效提示编写、针对复杂任务的提示设计技巧、对话中的提示设计技巧,以及提示的优化与迭代;第6章主要介绍当前ChatGPT推出的进阶功能;第7至11章结合教育领域、市场营销、新媒体运营、软件开发和数据分析实战展示提示工程技巧的应用。计算机12.9万字 - 会员
DeepSeek快速上手
DeepSeek是一种生成式人工智能(AI)大模型,擅长处理复杂任务,具有训练效率高、成本低、性能强、开源等优势,吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解,手把手地教读者如何使用DeepSeek。本书共6章,首先对DeepSeek进行概述,包括其成长路线、优势、技术原理、应用场景、应用方式等;其次讲解如何为DeepSeek写提示词,包括结构化计算机3.6万字