实时

您的位置:首页>资讯 >

中国麻将AI首次登顶日本麻将平台,战胜人类顶尖高手

潮新闻客户端 记者 鲁佳

7月11日,中国麻将AI出道了。腾讯宣布自研棋牌类 AI “绝艺LuckyJ” 在国际知名麻将平台“天凤”上达到十段水平,刷新了 AI 在麻将领域的最好成绩。

为什么要去日本打麻将比赛?


(资料图)

“天凤”,是知名的日本在线麻将竞技平台,创建于2006年,拥有较为体系化的竞技规则和专业段位规则,受到职业麻将界的广泛认可。

全世界的麻将AI基本都在这里进行训练和打段。“段位”,就有点类似于打游戏,根据参与的局数和不断累积的积分,判定你的段位。天凤按照1段—11段来进行排位,10段就相当于王者荣耀里的荣耀王者段位。

截至目前,天凤平台活跃人数 23.8万,7段以上3037人,约占百分之一,而能达到10段的仅 27 人(含AI),不到万分之一。

相比其他麻将AI和人类玩家,“绝艺 LuckyJ”不仅稳定段位更高,从零开始达到十段所需的对战局数也明显更少,仅需要 1321 局。

统计意义上看天凤稳定段位bootstrap的分布,绝艺LuckyJ显著强于之前最强的两个日本麻将AI(Suphx,NAGA):LuckyJ vs Suphx p value=0.02883;LuckyJ vs NAGA p value=3e-05。

天凤平台开发公司C-EGG的CEO角田真吾表示:“这是麻将AI的又一次突破,LuckyJ进一步拓宽了麻将AI的能力边界。令人感到兴奋的是,在特上房包括人类玩家在内的对战1000局以上的所有玩家中,LuckJ的稳定段位排名第一”。

在网上对LuckyJ历史对局有深入研究的天凤十段玩家、日本麻将战术研究家yousei评价,LuckyJ给人的印象是在每张牌上看到“攻击、防守的参数”,总体上,LuckyJ看起来“完全没有漏洞”,一方面通过保留安全牌等策略降低事故率。另一方面,即使手牌中同时存在多个和牌方向,LuckyJ也可以在这些复杂的分支中顺利进行下去。

值得一提的是,“绝艺LuckyJ“在国标麻将中也有亮眼表现,在线下职业选手邀请赛中击败六位职业选手,成为首个战胜国标麻将顶尖职业选手的麻将AI。

图注:对战数据显示,在近2000 场对局中,绝艺LuckyJ 的平均赢番达到 1.76番,这里番为国标麻将的结算单位,数值越大,说明赢得越多。

曾与“绝艺LuckyJ”对局的选手们,也对它做出了高度评价。“雀友杯”2014年世界麻将大师邀请赛冠军,腾讯麻将锦标赛年度总决赛(2018,2019)冠军成海华提到,AI在攻防两端都表现得都十分出色,充分体现了计算上的优势,让他刮目相看。

国标麻将职业选手,标榜麻将运动协会会长杨磊也有相同的感受:“经过数月与腾讯麻将AI的对抗测试,通过分析AI对局,AI无论在进攻还是防守都让我印象深刻。我们通常所谓的妙手、灵光一现,甚至基于经验和感觉做出的置之死地而后生的选择,对于AI来说可能算是常规操作。”

国标麻将及日本麻将职业选手黄林说,在与AI的上千次对战中,他一直惊叹于AI强大的牌效和精准的读牌,形容它“在攻防两端都做到了极致”。

为什么要研究麻将AI?

2017年,腾讯AI夺冠围棋的时候,网友呼吁进军麻将;2019年,腾讯AI打赢王者职业选手的时候,网友呼吁进军麻将;2020年,腾讯AI获得AI足球世界冠军的时候,网友也呼吁进军麻将……

为什么要等那么久?因为麻将对于AI来说——难。

腾讯 AI Lab 研究员介绍,围棋、象棋都属于完美信息博弈,参与竞技双方的每次决策,都可以看到全局的信息。AI能够通过强大的计算力来枚举各种可能性,从而找到致胜策略。而麻将无法看到对手的手牌,加上还有大量未揭开的牌,存在大量的隐藏信息,是典型的非完美信息博弈。

据介绍,麻将一共有136张牌,每一位玩家只能看到很少的牌,包括自己的13张手牌和所有人打出来的牌。牌局开始时,另外三位玩家的手牌以及墙牌都是看不到的,面对如此多的隐藏未知信息,麻将玩家的每一个决策都需要兼顾进攻和防守。

此外,在麻将的对战中,除了正常的摸牌、打牌之外,还要决定是否吃牌、碰牌、杠牌、立直以及是否胡牌。任意一位玩家的吃碰杠以都会改变摸牌的顺序,这一过程也涉及了大量的决策。

如上图所示,横坐标信息集数目表示可观察状态的多少,即牌面的信息。纵坐标信息集平均大小表示隐藏信息的多少,即其他所有对手的手牌的可能性。麻将所包含的隐藏信息要远远大于德州扑克。

为了更好地解决麻将游戏中存在的大量隐藏信息的难题,提升AI的决策能力,腾讯 AI Lab基于强化学习和遗憾值最小化的自我博弈技术,使得AI能从零开始自我学习和提高,并最终收敛到一个最强的混合策略,让AI在实际对战的过程中拥有更加平衡的策略能力。

同时,考虑到传统的非完美信息搜索算法在麻将面前很难发挥太大的作用,腾讯 AI Lab基于乐观价值估计的思想,提出了一种高效的非完美搜索方法,使得AI在有海量隐藏信息的游戏状态中,仍可以实时调整当前策略,从而更好地应对多变的战局。

相比人类,“绝艺 LuckyJ“在麻将游戏中,拥有更加平衡的策略,对局势的计算更精确,其中包括打每张牌的期望收益、未来可能胡哪些番型等等,通过这样的“策略”训练,也为AI走入更多行业打下了基础。

过去半个世纪以来,游戏在人工智能技术的演进中发挥了重要的作用。游戏多样化的情境为AI的训练和学习提供了便利的研究场景,从国际象棋到围棋,再到德州扑克、王者荣耀等游戏,AI 不断在游戏场景中拓展能力边界。

在模拟真实世界的虚拟游戏中,AI学会快速分析、决策与行动,就能执行更困难复杂的任务并发挥更大作用。现实生活中存在大量的隐藏信息和不确定的因素,麻将游戏中复杂的决策过程和带有随机性的博弈,比围棋这样的完美信息游戏更加接近真实的现实生活。

“绝艺LuckyJ” 在专业领域的突破,体现了腾讯 AI Lab 的深度强化学习智能体不断进化,正逐渐向解决更复杂更多样化的问题迁移。对非完美信息游戏的研究,将有助于开发出适用于真实生活场景的更加“智能”的AI系统。腾讯 AI Lab 研究员表示,现实世界中充满了需要在非完美信息状态下做决策的场景,比如金融交易、自动驾驶、交通物流、拍卖系统等。在游戏环境中推进决策AI的能力,最终是希望AI能从虚拟走向现实,解决真实世界的复杂问题。

“转载请注明出处”

关键词:

推荐阅读
潮新闻客户端记者鲁佳7月11日,中国麻将AI出道了。腾讯宣布自研棋牌类A

2023-07-12 07:25:23

热浪席卷北半球,而地处南半球的南非正在经历寒冷的冬季。当地时间10日

2023-07-12 06:11:05

7月11日装修装饰板块较上一交易日上涨0 41%,*ST广田领涨。当日上证指

2023-07-12 04:09:52

1、亲ziyuan已通过百度私信发送请点右上角【私信】查收若收不到私信。2

2023-07-12 01:04:05

7月11日,新城控股披露2023年6月销售简报。公告显示,2023年6月新城控

2023-07-11 22:20:26

近日,山东省鄄城县烟草专卖局(营销部)聚焦重点工作持续发力,提升基

2023-07-11 21:25:15

据证券时报,记者从公司方面获悉,7月11日,国美电器宣布旗下百家自营

2023-07-11 20:38:59

7月12日是2023年“全国低碳日”今年的主题是“积极应对气候变化,推动

2023-07-11 19:55:37

百济神州:子公司与诺华终止选择权协议将重新获得开发、生产和商业化欧

2023-07-11 19:11:39

新华社权威快报丨上半年我国新能源汽车产销量同比分别增长42 4%和44 1%

2023-07-11 18:33:48

【山推股份:上半年扣非净利同比预增100%-150%】山推股份(000680)7月11

2023-07-11 18:09:34

推出更多实习和见习岗位,帮助大学生提前进入就业“预热期”。记者从11

2023-07-11 17:22:16

7月10日,张帅(左) 多勒海德在比赛中交流。新华社记者李颖摄当日,在

2023-07-11 17:08:58

“三伏贴”又称三伏灸,是根据中医冬病夏治理论而发明的一种外用的贴敷

2023-07-11 16:34:20

来为大家解答以下的问题,10s是什么材质用什么焊条,310s是什么材质这

2023-07-11 16:05:01

1、水的物理性质如下:通常是无色、无味的液体。2、沸点:99 975℃(气

2023-07-11 15:32:28

7月6日,江苏南京一名女子突然从花神大道秦淮新河大桥上跃下正在附近休

2023-07-11 15:03:47

7月11日,菏泽江源化工有限公司工业级硫酸(98%)年产30万吨,价格60元

2023-07-11 14:21:27

不少淘宝天猫商家近期反馈,7月开始,商家已经可以0门槛直接开通会员运

2023-07-11 13:38:51

据中国网,7月11日上午,国新办就建设人与自然和谐共生的现代化有关情

2023-07-11 13:00:55