陆军棋的规则和玩法(陆军棋的规则和玩法怎么放图片)

对棋类游戏的掌握程度,一直是判断人工智能(AI)是否真正智能的依据之一,因为这类游戏可以被用来评估 AI 代理在受控环境下自主开发和执行策略的能力。

如今,AI 在此前尚未掌握的经典棋类游戏 Stratego(西洋陆军棋)中,表现出了人类专家级一般的水准——

以97%的最低胜率击败了其他 AI 机器人;在 Gravon 平台上与人类专业玩家对弈,取得了84%的总胜率,在年初至今和历史排行榜上都排在前三名。

值得注意的是,这一惊人表现是在没有部署任何搜索方法的情况下实现的,这是 AI 之前在棋类游戏中取得多个里程碑式成就的关键。

(来源:维基百科)

相关研究论文以“Mastering the game of Stratego with model-free multiagent reinforcement learning”为题,已发表在权威科学期刊Science上。

多年来,Stratego 一直是人工智能行业的下一个前沿领域之一。Stratego 玩家既需要有像玩国际象棋一样的长期战略性思考,也需要能够像打扑克一样处理不完全的信息。

不完全信息,意味着参与人在进行博弈时不清楚博弈中的某些要素。例如,在桥牌游戏中,玩家并不清楚其他玩家手中的牌,在拍卖会中,竞拍人并不清楚其他竞拍人对物品的估价。

这个名为“DeepNash”的 AI 代理出自 DeepMind,在他们看来,这代表了一个非凡的成果;同样,Stratego 社区也认为,这用现有技术是不可能实现的。

Stratego 诞生于 1947 年,与中国陆军棋不同,其军衔、棋子数量较多,棋盘设计较为简单,没有铁路、行营,也没有裁判,当两方棋子相遇后,才会揭开来判断大小。二者的相同之处,都是以夺得对方军旗或消灭所有可移动的棋子为胜利标志。

陆军棋的规则和玩法(陆军棋的规则和玩法怎么放图片)

图|陆军棋与 Stratego

Stratego 便是一种不完全信息游戏。与之相反,国际象棋、跳棋、日本将棋和围棋可看作完全信息博弈,因为双方完全清楚游戏规则,当前局面对方可能的下法等信息。

而且,Stratego 具有非常复杂的结构,其博弈树具有10^535种可能的状态,比无限德州扑克(10^164)和围棋(10^360)都要多。

另外,在特定情况下,Stratego 玩家需要在游戏开始时推理出多于10^66对可能的排布,而在德州扑克中,这一数字仅为 10^6;完全信息游戏则没有这一阶段,相对更为简单。

在 Stratego 中,双方各有代表元帅(Marshal)、将军(General)、上校(Colonel)、中校(Major)、上尉(Captain)、中尉(Lieutenant)、士官(Sergeant)、除雷兵(Miner)、斥侯(Scout)、间谍(Spy)、地雷(Bomb)、军旗(Flag)的棋子。

具体游戏规则为:两方将所有己棋竖立、以正面朝后的方式排布,然后轮流移动一枚己棋;可以将棋子沿纵横方向移动一格至空格或敌棋处,但需要维持正面朝后;如果一方棋子到达敌棋处,便将两棋公开,一般胜方这一棋子会被放回原位且正面继续朝后,输方这一棋子则被移除游戏。

陆军棋的规则和玩法(陆军棋的规则和玩法怎么放图片)

图|胜负关系判定(来源:维基百科)

提前计划的能力,一直判断某一 AI 技术/代理是否成功的核心问题,Stratego 等不完全信息游戏,则常被用来测试 AI 代理依次做出相对缓慢、慎重和合乎逻辑的能力大小。

然而,目前利用不完全信息搜索技术来掌握 Stratego 是不可能的。

据论文描述,DeepNash 使用了一种博弈论的、无模型的深度强化学习方法 R-NaD,无需搜索,便能以从头开始的自我博弈方式来学习如何掌握游戏策略,比如虚张声势。

正如冯·诺伊曼(von Neumann)所描述的那样:“现实生活由‘虚张声势’‘欺骗的小策略’‘问问自己别人会认为我打算做什么’组成。”

陆军棋的规则和玩法(陆军棋的规则和玩法怎么放图片)

图|DeepNash(蓝色)在与人类(红色)的对阵中表现出“虚张声势”。正面虚张声势(A);负面虚张声势(B);DeepNash 将一个斥候伪装成一个间谍,并获得情报(C)。(来源:该论文)

研究团队表示,这项工作引入了一种新的博弈论方法,与最先进的基于搜索的学习方法截然不同,在训练过程中不执行任何形式的搜索或显式对手建模,只依赖于在测试时使用一些游戏特定的启发式教学。

展望未来,目前还没有迹象表明 R-NaD 在零和的双人游戏设定之外会如何发展。

然而,研究团队却认为,它或许可以解锁深度学习方法在现实世界中具有不完全信息特征的巨大空间的多智能体问题中的进一步应用。例如,最先进的双人扑克方法已经成功应用在六人扑克中。

该方法在这类不完全信息场景下或许有很多潜在应用,包括人群和交通建模、智能电网、拍卖设计和市场问题等。

参考链接:

www.science.org/doi/10.1126/science.add4679

来源:学术头条

本文所有内容来自互联网,如有侵权/不实内容请联系我们删除,联系邮箱postusb@foxmail.com

发布者:缘分,转转请注明出处:https://www.bjxdyg.com/baike/210069.html

(0)
缘分缘分
上一篇 2023年 5月 16日 上午1:32
下一篇 2023年 5月 16日

相关推荐

  • 美菱冰箱冷藏室温度怎么调(美菱冰箱冷藏室温度怎么调节,2度到8度那个是低的)

    老爸上次给我打电话说家里冰箱坏了,让我帮着挑一台新的。这必须得安排上呀!我立马动手上网搜罗一番。从颜值实用性节能几个方面一一对比挑选,毕竟是爸妈使用,还关系到食物的健康,还是得买好一点的。美菱BCD-530WP9CX冰箱就是我想要的!送到家后,爸妈说整体体验下来还是很满意的。 美菱冰箱采用典雅灰VCM面板,百搭又显高级,还很符合家里装修调性,而且不容易留指纹…

    2023年 6月 5日
    18900
  • 种子搜种子帝(种子搜种子帝链接)

    一、初级 你已经有兴趣看电影了,区别于那些完全不看电影的人。你可以在各大视频网站在线观看,效果差、片源少、更新慢。 二、中级: 如果你不是特别热爱电影,只是闲暇之余看看热门的新片、美剧,也不特别要求画质与速度的话,下面这几个网站能满足你了: 电影FM : http: //dianying.fm/ranking/imdb250 电影天堂: http: //ww…

    2023年 5月 9日
    17100
  • ipad怎么设置九宫格输入法(九宫格输入法怎么用)

    一直以来MacBook都没有九宫格输入法,对于需要进行大量数字录入和统计工作的人来说实在有点麻烦。 不用担心,这款Nums智能玻璃贴膜绝对是所有MacBook用户的福利。 只需把一张玻璃膜贴在电脑触控板上就能秒变九宫格数字输入,也太妙了吧。 不仅可以输入数字,还能通过手势运行自定义的快捷输入方式。 无论是网页、应用程序还是文件资料,在一拖一按之间调动,比常规…

    2023年 5月 6日
    22400
  • 有效实名认证(有效实名认证身份证)

    随着微信的版本不断更新,很多朋友想要对微信进行实名认证,但发现原来的认证入口不见了,不知道该如何进行认证,本期文章教大家如何进行微信实名认证和更换实名操作。 一、启动微信点击手机系统桌面上的“微信”图标,启动它。如下图: 二、服务启动“微信”以后,在微信界面的下方找到“我”。如下图: 点击“我”选项后,在弹出的界面里找到“服务”。如下图: 三、实名认证点击进…

    社会百科 2022年 8月 17日
    35500
  • oppo手机的备忘录在哪里打开(oppo手机备忘录在哪里面)

    OPPO手机是很多人都比较喜欢的一款手机了,很多人在买了之后,玩了一段时间却发现好多比较实用的小技巧自己都不会用,那这不是浪费了,所以呢今天就来给大家分享OPPO手机这5个实用的小技巧,每一个你都值得拥有哦。 一、无形解锁 现在的手机用的比较多的解锁方式就是密码解锁和指纹解锁,而无形解锁最大的好处就是别人根本看不出来,你是怎么解锁的,也打不开你的手机,是一直…

    2023年 3月 1日
    25200

发表回复

登录后才能评论

联系邮箱

postusb@foxmail.com

邮箱咨询: QQ交谈

邮箱:postusb@foxmail.com

工作时间:周一至周五,9:30-18:30,节假日休息