3胡への人工知能


スーパー神経によって


シーンの説明:Microsoftは、最も高い成功ダンを達成するためにプロスポーツのプラットフォームでは、麻雀AIモデルをリリースしました。彼らは、世界的なエンターテインメントとさえ神AIの鳥が困難を克服するために何の誕生、誕生とどのようなこの技術のより深い意味で国を総なめにしました。


キーワード:強化学習の麻雀Suphx深さ



著者:神経症神経ナイフ

編集:神経星


本日開催された人工知能の世界会議では、Microsoftがリリースされ、「鳥の神AIを」 - Suphxは、プロ麻雀競争力のあるプラットフォーム上で、強さはトップ人の選手の平均よりも優れています。


Suphxは、スーパーフェニックス(フェニックススーパー)の略で、2019年3月に「フォン日。」、日本麻雀プロスポーツのプラットフォームに上陸しました


640?wx_fmt = JPEG

マイクロソフトのグローバルなシャムサイトプレゼンテーションSuphxのエグゼクティブ・バイス・プレジデント


麻雀プラットフォームのこの最も有名で、AIはオープン競争力で「終わることのない特別な」、5000人の以上の人間のプレイヤーとのSuphxは、4つのゲームを開始した麻雀ゲームに参加し、徐々に自分の強さとレベルを果たしたことができます。


6月に、Suphxはダンが終わることのない最高の10個の特別なセクションに達したが、ほとんどのSuphx 11ダン「天豊ビット」の願望を制限するものではありませんでしたが、プラットフォームは、最も高度なAIシステムの戦争室へのアクセスを許可していません。


2006年の発売以来天豊プラットフォームは、4つの選手の麻雀は、約180の10のセクション、現役期間中に10人の選手が、また、ダースに達しました。しかし、安定したダンにレベルの強度を測定し、Suphxははるかに10セグメントに高い8.7節7.4節人間のプレイヤーに達しました。


640?wx_fmt = JPEG

Suphxは、AIの最高レベルでフェニックスのプラットフォーム上のすべての日です


以前は、他の二つのAIシステム、それぞれ、2015年に東京大学「ブラストビート」で発表され、そしてドワンゴ「NAGA25」が、安定したダンによって発行された2018年における天豊麻雀プラットフォームもアクティブの両方6.5以下であります、Suphxははるかに彼らの背後にあります。


麻雀の歴史の千年:レジャーの遅い進化


麻将,也称「麻雀」或「雀牌」等,是正宗的国粹。


有关麻将起源的说法五花八门,至于其真相也无从考证,但可以确定的是,麻将自从问世后,作为全民娱乐项目,麻将一直流行于民间,经久不衰。


640?wx_fmt = JPEG

麻将的前身,最早可追溯到汉代的叶子戏牌


而麻将牌的符号和制作也历经了多次变迁,最早的麻将牌竹子和动物骨头制作,此后还有过纸牌的时期。

 

在达官贵人中,还曾用犀牛角,象牙,金银铜,青花瓷来制作,彼时的麻将牌由精工巧将们一张张雕刻而来。


640?wx_fmt = JPEG

LV、Prada、爱马仕这些国际品牌,都曾推出过高级定制麻将

 

直到 1960 年以后,塑料用品的普及,以及机械化的发展,使得麻将逐渐以材料被大量生产。


但除了制作工艺上的变化,麻将里的最高科技,除了 AI,可能就是自动麻将机了。


 

AI 胡牌,全靠推理


在 AI 研究之前,很多人一度认为麻将中,运气是决定性的因素。但其实麻将的竞技规则,其实是很复杂的问题。


136 张麻将的排列组合有许多种结果,同一玩家两次出牌之间,夹杂了其他 3 位玩家的出牌,还有自己的摸牌,而且还有「吃」、「碰」、「杠」都会让牌局产生动态变化。


其次这是一个非完美信息问题。每个玩家只能知道自己的 13 张手牌,以及被打出的牌,而其他人的牌和剩余底牌都是未知,这些隐藏信息导致了变数众多。


640?wx_fmt = JPEG

几种牌类游戏的复杂度对比


即便是很有经验的玩家,也难以理清已知牌面和最佳打法之间的逻辑关系,丰富的隐藏信息会导致游戏的复杂度加剧。


这需要在整个过程中,做好策略的规划,比如在局势不利的情况下,战略性地「放炮」让第四名玩家获胜,以防止被总分第二名的反超。


因此,想要打造一个高手麻将 AI ,只有强大的算力是不够的,更需要的还在于,让 AI 具有直觉、预测、推理模糊决策的能力。


成为一代雀神,靠深度强化学习


针对上述难点,微软利用深度强化学习打造的 Suphx,通过最新的算法,一步步在学习和调试中,晋升成了竞技麻将的最强雀神。


640?wx_fmt = PNG


雀神 Suphx 是这么做到的


首先是「初始化」阶段,利用「天凤」平台的公开数据,研究人员通过有监督学习,得到一个初始模型,并在模型基础上,用自我博弈的方式进行强化学习训练。


随后,针对非完美信息博弈的挑战,Suphx 创新性地尝试了先知教练技术来提升强化学习的效果。


在训练阶段,利用不可见的隐藏信息,引导 AI 模型的训练方向,让它的学习路径更加清晰、贴近完美信息意义下的最优路径,从而促使 AI 模型深入理解可见信息,从中找到有效的策略。


640?wx_fmt = JPEG

经典的搜索树结构,AI 希望最小化对手的最大收益

但不适用于麻将游戏


此外,对于麻将复杂的牌面表达和计分机制,他们利用全盘预测技术,搭建起每轮比赛和 8 轮过后的终盘结果之间的桥梁。


通过精巧设计的预测器,模型能够理解每轮比赛对最终结果的影响,从而有全局性的决策视角。


研究团队还引入了新的机制,能够对牌局的过程进行动态调控,让 Suphx 在推理阶段根据最新信息进行策略调整,作出自适应的决策。


最后就是进入实战,通过不断参与到人类玩家的对局中,让 AI 不断学习以提升自己的技能。


640?wx_fmt = JPEG

该局中,Suphx 不仅胡牌还是大三元


プラットフォームへのマーチ天豊ので、Suphxは一定の自己進化してき。現時点では、攻撃と防御のバランスが、Suphxはトップ人の選手、短期および長期の収入の損失、および迅速な意思決定、既存の曖昧な情報に基づいて間の戦略的、完全なトレードオフよりも賢明な戦略を可能にします。


麻雀AI:ポーカーテーブルだけではなく結果


スタイルと劇中の新しいトレーニング技術とアルゴリズムのおかげで、Suphxがユニーク。


天豊プラットフォーム上のトップ人間のプレイヤーは、それがソーシャルメディア上でSuphxを賞賛し、彼は彼がSuphxゲームの多くを見たと思った、前に見たことがない技術の多くのことを学びました。


また、選手の多くは、Suphxの戦いで、戦いは実践的なスキルを学び、それゆえ「麻雀の教科書」と呼ばなければならないことがあると言っている「Suphxの先生。」


640?wx_fmt = JPEG

技術的な啓示は136麻雀をもたらしました


麻雀の勝ち負けでは、都市部の人が楽しんでいる運と経験のスリルを、そしてマスターは知的コンテストを楽しみます


このような「鳥の神は、」AIは、ほかに無敵麻雀コーチを作成するだけでなく、新たな視点を開くには、このエンターテイメントを解決するために、ディメンションデータのアルゴリズムから私たちをみましょう。


もはやギャンブラーとして運に依存などが、精神的なオーラの下で、徐々に法律の勝利のセットを探索し、それらのランダムな不確実なものを残して。


これはまさに道AIの開発、光それの最も魅力的なビームではないでしょうか?


640?wx_fmt = GIF


コンテンツ参照:マイクロソフトリサーチAIの見出しの"Microsoftスーパー麻雀AI Suphx、不完全情報ゲームをクラック" https://mp.weixin.qq.com/ S / S- axCx41WKD JG 2B。iGGTZfg)

- END -

 
  

-------------

過去のワンダフル:

640?wx_fmt = PNG

おすすめ

転載: blog.csdn.net/kMD8d5R/article/details/100165200