分享好友 最新动态首页 最新动态分类 切换频道
【MARL】多智能强化学习测试环境:SMAC、MPE、PettingZoo等
2024-12-26 08:39

        本篇文章是博主强化学习RL领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对相关等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅解。文章分类在强化学习专栏

       【强化学习】(12)---《多智能强化学习测试环境:SMAC、MPE、PettingZoo等》

一、常用的多智能强化学习测试环境

1. SMAC(StarCraft Multi-Agent Challenge

2. MPE(Multi-Agent Particle Environment

3. PettingZoo

4. MATLAB MARL Toolbox

5. OpenAI Gym + Gym-Multi-Agent

6. DeepMind Lab2D

7. Hanabi Learning Environment

8. MADRL (Multi-Agent Deep Reinforcement Learning)

9. Roboschool 和 PyBullet

 二、获取测试环境的方式

1. 通过 GitHub 搜索相关环境仓库

2. 通过 Google Scholar 或 arXiv 查找相关文献

3. 通过 Python 包管理工具安装

4. 代理或镜像服务

三、总结


        在多智能体强化学习(Multi-Agent Reinforcement Learning, MARL的研究和应用中,构建合适的环境来测试和评估算法是非常重要的。以下是一些常用的多智能体强化学习环境,它们涵盖了多种任务类型,如协作、对抗、竞争,帮助研究者验证算法的效果。

1. SMAC(StarCraft Multi-Agent Challenge

  • 简介:SMAC 是基于实时战略游戏 《星际争霸II》 的一个多智能体强化学习平台。它提供了丰富的微观战斗场景,允许多个智能体在局部观测的条件下进行协作或对抗。
  • 特点
    • 高度复杂的策略空间,智能体需要在合作中战胜对手。
    • 集中训练和分散执行的框架非常适合多智能体强化学习算法的测试。
    • 支持如 VDN、QMIX、MADDPG 等常见 MARL 算法。
  • 适用任务:协作、对抗。
  • 链接:SMAC 环境

2. MPE(Multi-Agent Particle Environment

  • 简介:MPE 是一个轻量级的多智能体粒子环境,智能体是无形的粒子,可以在二维平面中移动执行任务。该环境中,智能体需要完成协作或竞争任务。
  • 特点
    • 提供多个经典的多智能体场景,包括协作和竞争。
    • 易于设置,适合快速实验和算法验证。
  • 适用任务:协作、竞争、对抗。
  • 链接:MPE 环境

3. PettingZoo

  • 简介:PettingZoo 是一个多智能体强化学习框架,类似于 OpenAI Gym,但它专门为多智能体任务设计。它提供了丰富的多智能体环境,如合作博弈、竞技游戏和对抗场景等。
  • 特点
    • 支持多种不同类型的任务:协作、竞争、对抗等。
    • 易于集成现有的多智能体强化学习算法。
    • 提供了适合不同任务类型的 benchmark 环境。
  • 适用任务:协作、对抗、策略博弈。
  • 链接:PettingZoo 环境

4. MATLAB MARL Toolbox

  • 简介:MATLAB 提供了一个用于多智能体强化学习的工具箱。用户可以快速构建和测试多智能体系统的合作和竞争任务。适合复杂系统的建模和实验。
  • 特点
    • 便于使用 MATLAB 仿真工具进行复杂任务的设计。
    • 集成强化学习算法,支持模型的快速迭代开发。
  • 适用任务:复杂的工程应用、系统控制。
  • 链接:MATLAB MARL Toolbox

5. OpenAI Gym + Gym-Multi-Agent

  • 简介:OpenAI Gym 是单智能体强化学习的标准环境库,通过扩展 Gym-Multi-Agent,可以使其支持多智能体场景。该库能够快速集成多智能体问题,支持多种任务类型。
  • 特点
    • 任务类型广泛,支持自定义多智能体环境。
    • 轻量、易用,适合初学者和快速开发者。
  • 适用任务:自定义的协作、对抗场景。
  • 链接:Gym-Multi-Agent

6. DeepMind Lab2D

  • 简介:DeepMind Lab2D 是一个灵活的二维模拟环境,适合多智能体场景。用户可以在二维平面上构建自定义的场景,智能体可以在该环境中进行交互。
  • 特点
    • 灵活的任务设计,可用于构建从简单到复杂的多智能体场景。
    • 支持与深度学习框架的无缝集成。
  • 适用任务:协作、对抗、博弈。
  • 链接:Lab2D

7. Hanabi Learning Environment

  • 简介:Hanabi 是一个多智能体的协作游戏环境,基于牌类游戏 Hanabi。该环境特别适合测试智能体之间的沟通和协作能力。
  • 特点
    • 测试智能体的协作和沟通策略。
    • 支持有限的信息共享,适合复杂的决策场景。
  • 适用任务:协作、信息共享。
  • 链接:Hanabi 环境

8. MADRL (Multi-Agent Deep Reinforcement Learning)

  • 简介:MADRL 是多智能体深度强化学习的经典环境集合,支持如捕食者-猎物等常见的多智能体任务。
  • 特点
    • 提供标准的多智能体环境。
    • 环境设置简洁、易用,适合验证多智能体算法。
  • 适用任务:协作、对抗。
  • 链接:MADRL 环境

9. Roboschool 和 PyBullet

  • 简介:Roboschool 和 PyBullet 是机器人模拟环境,适合多智能体机器人控制和协作任务。通过这些环境可以模拟多机器人任务,如机器人足球等。
  • 特点
    • 高度仿真现实物理,适合多智能体机器人协作或对抗任务。
    • 支持复杂的物理交互和控制任务。
  • 适用任务:机器人控制、协作。
  • 链接:PyBullet 环境

        上文给出的链接都是官方仓库或文档的参考路径,但这些链接可能会因为网络、地域或其它因素而无法打开。为了解决这个问题,可以尝试通过以下几种方式获取相关资源

1. 通过 GitHub 搜索相关环境仓库

        大部分多智能体强化学习环境的代码都托管在 GitHub 上,可以直接在 GitHub 上搜索相关项目。以下是一些关键搜索词

  • SMAC
  • Multi-Agent Particle Environment (MPE)
  • PettingZoo
  • Hanabi Learning Environment
  • PyBullet

2. 通过 Google Scholar 或 arXiv 查找相关文献

        如果你想查找这些环境的研究论文,可以通过 Google Scholar 或 arXiv 来搜索关键字,如 "StarCraft Multi-Agent Challenge" 或 "PettingZoo MARL environment"。

3. 通过 Python 包管理工具安装

很多环境可以通过 直接安装

 

4. 代理或镜像服务

        如果遇到链接打不开的问题,可能与网络访问限制相关。你可以尝试使用代理或镜像网站访问 GitHub、arXiv 等资源。


        这些多智能体强化学习环境涵盖了从简易的粒子世界到复杂的物理仿真和对抗游戏,研究者可以根据任务的复杂性和需求选择合适的环境。这些环境不仅为 MARL 算法提供了标准测试平台,也为算法改进和实际应用提供了宝贵的实验基础。


最新文章
Kafka Tool linux版本,适用于kafka0.11及以上
#!/bin/sh# Uncomment the following line to override the JVM search sequence# INSTALL4J_JAVA_HOME_OVERRIDE=# Uncomment the following line to add additional VM parameters# INSTALL4J_ADD_VM_PARAMS=INSTALL4J_JAVA_PREFIX=GREP_O
Jenkins和常用插件的安装
从git拉取的代码默认放在Jenkins的workspace,如果通过,那么Jenkins的工作目录是 直接安装的,则是在 1.1 学习文档 官网doc 博客blog.mafeifan.com/这节内容来自于Jenkins官方文档 注意 Blue Ocea可以理解成Jenkins UI
AI绘画工具评测:生成超逼真美女写真的最佳选择
在这个科技日新月异的时代,AI绘画工具的崛起让很多人对绘画创作有了全新的思考和体验。尤其是生成超逼真的美女写真,这类工具不仅能为用户提供便捷的创造体验,还能激发个人的创意潜能。宝子们,今天我就带你们一起来了解几款热门的AI绘画
AI换背景系统搭建,提供高效技术开发与服务
在如今的数字营销和内容创作中,图片和视频的视觉效果常常决定了观众的第一印象。一个高质量、设计感强的背景,往往能让一张普通的照片瞬间提升档次,吸引观众的目光。因此,许多企业和创作者开始在各类图片、视频中运用更具创意的背景,以
58同城如何通过RAG与Tool Use技术提升AI能力
  导读在当前人工智能技术迅猛发展的背景下,智能助手的应用场景愈加广泛,涵盖了从 B 端商家服务到销售培训及大数据分析等多个领域。本文将深入探讨智能助手在 58 同城实际应用中的案例,包括招聘助手和销售陪练的设计与实施,还将分析
13款运维监控工具之开源工具介绍
监控作为重要性最高的机制之一,在一定程度上也遭到了我们的忽视。无处不在的灾难,如果有监控系统的预警,那么,我们就有机会迅速启动灾难响应方案或者着手排除复杂的性能故障,这对于任何规模的企业而言都
B站广告投放,哔哩哔哩(B站)商业推广介绍
小破站,大流量!bilibili从最初以ACG (动画、漫画、游戏)内容为主的视频弹幕网站,逐步发展为覆盖生活、游戏、娱乐、动漫、科技和知识等多元文化和兴趣内容,以PUGV 为核心、包括OGV、直播、短视频等全场景的综合视频社区,构建了一个源
Linux 主机管理软件 Webmin 1.7 安装
Webmin 是一款基于 Web 的主机管理软件,该软件非常强大,几乎可以对主机进行所有的管理操作,如果对命令行管理主机不熟悉,可使用 Webmin,通过它,您可以轻松地管理主机用户帐户,磁盘配额,服务,配置文件,管理的,DNS,文件共享和其他
macOS系统各版本发布日期时间及Mac系统下载集合
macOS 10.10.5 – macOS Sequoia 15版本的dmg格式的安装包都是使用苹果官方App Store商店原版镜像和使用官方制作命令制作成Dmg的,原滋原味无任何修改添加。直接升级使用:打开下载的dmg/iso安装包,双击里面的原版安装镜像就可以直接
相关文章
推荐文章
发表评论
0评