日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

繼圍棋、德州撲克、星際爭霸之后,AI技術又“卷”到了斗地主游戲。近日,網易互娛 AI Lab 聯合上海交通大學和 CMU開源斗地主AI模型“PerfectDou”。該AI模型不僅擊敗了一眾已知開源的AI“同行”,成為目前實力最強的斗地主AI,相關研究成果還登上了AI頂級學術會議NeurIPS 2022,受到國際學術界的高度認可。

image.png

對人類而言,斗地主可能只是一個簡單的紙牌游戲;但在AI眼中,斗地主的玩法極具挑戰性。作為一款非完美信息游戲,斗地主不僅涉及策略合作,隊友/對手水平等復雜因素,其牌型組合更是高達27472種,極大地限制了如 CFR 等搜索類算法的使用,這也對算法模型的創新探索提出了更高的要求。

image.png

針對上述難點,網易互娛 AI Lab 聯合上海交通大學和 CMU提出基于完美信息蒸餾(PTIE)的斗地主 AI“PerfectDou”。在斗地主游戲中,非完美信息的引入主要是由于三位玩家均不能看到別人的手牌,對于任意一位玩家而言,僅可知道其余兩位玩家當前手牌的并集,但很難精準判斷每位玩家當前手牌。針對此類非完美信息問題,完美信息蒸餾的思路是構建一個第三方角色,該角色可以看到三位玩家的手牌,該角色在不告知每位玩家完美信息的情況下,通過信息蒸餾的方式,引導玩家打出基于當前情況相對合理的出牌,并贏得比賽。

針對斗地主游戲出牌組合數較多的問題,PerfectDou 基于RLCard 的工作上對動作空間進行了簡化,對占比最大的兩個出牌牌型進行動作壓縮,將整體動作空間由 27472 種縮減到 621 種,幫助AI加速訓練過程。

image.png

(PerfectDou 策略網絡結構)

為驗證AI模型的強度, PerfectDou 與各個斗地主AI分別進行了1萬局的對戰,并與之前達到 SOTA 水平的 DouZero模型單獨進行了10萬局對戰。對戰主要指標包括兩種:勝率(WP)和場均得分(ADP)。考慮到場均得分更符合斗地主游戲規則,所以將其作為主要指標,勝率則作為輔助指標。實驗結果顯示,PerfectDou 擊敗了所有已知AI斗地主模型,創下最新的SOTA水平。

image.png

(上表中加粗數字代表 A 對戰 B 勝率超過 50% 或者 ADP 大于 0)

目前,網易互娛AI LAB已公布論文全文、對外開源PerfectDou代碼,并提供在線試玩平臺,以幫助人工智能領域學者進一步研究AI技術在斗地主游戲上的應用。

據悉,包括PerfectDou在內的最新AI游戲智能體研究成果,均已集成于網易互娛AI LAB自研游戲AI系統Athena AI中。該系統還擁有模仿學習、強化學習、進化學習算法等眾多前沿AI技術,為網易不同類型的熱門游戲,提供競技對戰、友好陪玩、平衡性測試等豐富多樣的AI解決方案。

網易互娛AI Lab成立于2017年,隸屬于網易互動娛樂事業群。作為游戲行業領先的人工智能實驗室,網易互娛AI Lab所提供的AI服務包括計算機視覺、自然語言處理、語音信號處理、游戲AI等;應用于《夢幻西游》《哈利波特:魔法覺醒》《陰陽師》《大話西游》《荒野行動》等網易旗下多款熱門游戲。

分享到:
標簽:獨占鰲頭 網易 血戰 開源 斗地主 最強 模型 AI
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定