自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Jin的博客

原创【多智能体强化学习03--基于值分解的方法】

本篇主要讲解基于值分解的多智能体强化学习方法，比如VDN,QMIX等。

2024-03-12 14:08:04 1017 1

原创【多智能体强化学习02---训练范式+独立学习+多智能体策略梯度算法】

本篇文章详细介绍了多智能体的训练范式，独立学习算法以及多智能体策略梯度算法

2024-03-11 11:48:39 2161 1

原创【强化学习2--基于策略梯度的方法】

本文全面介绍了基于策略梯度的深度强化学习方法。策略梯度方法适用于连续动作空间问题，直接通过神经网络拟合策略函数。文章着重解释了如何利用策略梯度定理更新策略网络的参数，以最大化预期回报。介绍了REINFORCE算法，该算法通过蒙特卡洛方法估计动作价值函数，并引入状态价值函数作为基线以降低方差。讨论了Actor-Critic方法，该方法结合了策略梯度和值函数更新。进一步，提出了A2C和PPO算法，前者优化了Actor-Critic结构且引入了熵正则化，后者则通过重要性采样简化了算法复杂度。文章通过图表和伪代码清

2024-03-09 15:48:16 936

原创【强化学习1--基于值的方法】

这篇文章是对强化学习学习思路的一个整理，主要介绍一下DQN算法

2024-03-02 16:15:34 891

原创【多智能体强化学习01---多智能体交互建模】

本篇主要介绍多智能体交互的数学建模，逐渐向MARL过渡

2024-02-25 21:16:44 886 1

原创全是问题的强化学习—1

本篇是对强化学习的一些思路整理，错误不少，欢迎指正！

2024-02-18 10:17:39 908 1

原创【Git学习-远程仓库高级操作】

本节主要介绍了Git远程仓库操作加参数形式，比如：git push origin master等

2024-02-05 14:08:58 1805 1

原创【Git学习-与远程仓库通信】

本文通过图片展示，介绍了利用Git获取远程仓库最新修改以及推送本地修改到远程仓库的常用命令。

2024-01-30 12:09:33 1005 1

原创 Git学习-高级篇2

本章主要介绍了在Git中移动提交记录的两种方法，以及如何给你的提交记录打标签。

2024-01-28 15:23:32 985 1

原创 Git学习-高级篇1

Git高级特性学习，本篇主要介绍了git中提交树的分支移动

2024-01-27 12:27:27 1587

原创 Git学习-基础篇

本文旨在用图片的形式直观的介绍git的基本用法，第一节是基础篇，后期持续更新...

2024-01-26 16:29:35 458 1

原创 Python快速入门笔记

python快速入门笔记，可以用来对python的一些基础内容进行回顾

2024-01-07 21:27:34 884 1

论文1：MOBA游戏人机协作

论文1：MOBA游戏人机协作

2024-02-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

AIWhispers CSDN认证博客专家 CSDN认证企业博客

码龄5年

中国科学技术大学

IP 属地：安徽省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

12: 原创

123万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

500: 积分

269: 粉丝

375: 获赞

9: 评论

292: 收藏

私信

关注

热门文章

分类专栏

最新评论

【多智能体强化学习03--基于值分解的方法】
CSDN-Ada助手: 恭喜作者第12篇博客！不断分享多智能体强化学习的知识，对读者们来说是一大福音。在阅读了您的文章后，我觉得下一步您可以考虑添加一些实际案例或者应用场景，以便更好地帮助读者理解和应用所学知识。希望您能继续保持创作的热情，期待您更多精彩的文章！
【多智能体强化学习02---训练范式+独立学习+多智能体策略梯度算法】
CSDN-Ada助手: 恭喜作者第11篇博客的发布！标题中提到的训练范式、独立学习和多智能体策略梯度算法听起来非常有深度和挑战性。希望作者能够继续分享更多关于多智能体强化学习的知识和经验。或许在下一篇博客中，可以结合实际案例或者应用场景，更具体地探讨这些算法在实践中的应用和效果。期待作者的下一篇精彩内容！
【多智能体强化学习01---多智能体交互建模】
CSDN-Ada助手: 恭喜您第8篇博客《【01-多智能体交互建模】》的发布！您的持续创作展现了您对多智能体交互建模的深入思考和研究。接下来，我建议您可以尝试结合实际案例，或是探讨多智能体交互建模在特定行业或领域中的应用，这样可以让您的博客更具实用性和可操作性。期待您更多精彩的创作！
全是问题的强化学习—1
CSDN-Ada助手: 恭喜用户发布第7篇博客！看到您在探讨全是问题的强化学习，让我对这个领域有了更深入的了解。希望您能继续坚持创作，分享更多有价值的内容。接下来，或许可以考虑深入探讨强化学习在实际应用中的挑战及解决方案，这将为读者提供更多启发和思考。期待您的下一篇作品！
【Git学习-远程仓库高级操作】
CSDN-Ada助手: 恭喜您在Git学习领域又发布了一篇新的博客，标题看起来很吸引人！不过在远程仓库高级操作方面，还有很多深入的内容可以挖掘和分享。或许您可以考虑在下一篇博客中介绍一些高级操作的实际应用案例，或者分享一些自己的学习心得体会。希望您可以继续保持创作的热情，为大家带来更多有价值的内容！

最新文章

提示

确定要删除当前文章？

取消删除