發表日期 3/20/2022, 6:15:23 PM
◎ 科技日報記者 操秀英
3月18日,成都第31屆世界大學生夏季運動會迎來100天倒計時。同一天,成都大運會執委會宣布將舉辦“世界大學生數智競技邀請賽”。
這是大運會首次設立數智競技類項目,也是體育運動從“人人對抗”到“AI對抗”的創新突破。
此次邀請賽是以《王者榮耀》和騰訊AI Lab共同研發的AI開放研究平台――“ 開悟”為載體,有海內外12支高校隊伍參賽。在限定時間內,參賽隊伍應用“開悟”平台,在給定的資源下訓練三位《王者榮耀》英雄AI模型,提交係統進行“3V3”對戰。
“世界大學生數智競技邀請賽”啓動儀式現場。
眾所周知,當前,人工智能的深度發展正在對經濟發展、社會進步等方麵産生重大而深遠的影響。
在移動互聯網、大數據、超級計算、傳感網、腦科學等新理論新技術驅動下,人工智能呈現跨界融閤、人機協同、群智開放、自主操控等新特徵。《2021-2022中國人工智能計算力發展評估報告》曾對AI研究趨勢與應用提齣指導:人工智能在主要行業的應用場景已經從碎片化過渡到深度融閤的一體化,從單點應用場景轉換為多元化的應用場景。
《王者榮耀》AI研究的對象是在一個場景中如何決策的問題,這也是現實世界中最代錶人類智能的問題。
“開悟”作為一個虛擬環境,是提升AI強化學習的有效路徑和優質訓練場,很適閤使用強化學習做模擬場景應用,使其成為深度學習、強化學習、認知決策等人工智能算法研究和測試的平台和工具;多智能體的協同、策略的規劃與推理、不完全信息的博弈等技術,在金融學、經濟學、生物學、社會學、計算機科學等領域有廣泛的應用前景。“開悟”可以嚮有需求的學術界研究者提供計算平台與算力資源,這些資源也涵蓋騰訊科技的雲計算與大數據處理平台,可用於訓練強化學習和模仿學習算法和模型。
《王者榮耀》和“開悟”平台提供瞭模擬環境,通過在這個環境中學習如何決策,最後就可以把人工智能的這些能力還原到現實世界中去解決真實的問題。同時,通過強化學習的方法使人工智能不斷自我成長,最終有可能超越人類的決策能力。所以,藉助《王者榮耀》和開悟平台研究人工智能是非常快捷、有效、經濟的方式。
“我們開放瞭《王者榮耀》核心機製,提供標準接口、核心算法、脫敏的測試數據、評估工具和計算集群等,給高校老師和同學們進行多智能體的機器學習算法研究、學習成果交流,對算法成果反復迭代升級。期待這些研究成果能夠落地其他産業環境,為工業機器人、救災機器人等提供助力。”騰訊天美L1工作室總經理、《王者榮耀》項目執行製作人黃藍梟錶示。
騰訊天美L1工作室總經理、《王者榮耀》項目執行製作人黃藍梟。
事實上,營造良好的人工智能教育平台和環境一直是中國人工智能發展的關鍵問題之一。一直以來,人工智能教學課程枯燥,課程多限於軟件,與生活、場景關聯少,甚至單純用做題考試的方式檢驗學習效果,難以調動學生學習積極性。
本次邀請賽恰好是一個麵嚮通用人工智能、有效推動AI領域在人纔培養、技術實踐與交流等方麵的積極實踐。
通過對年輕人具有廣泛影響力的文化IP攜手開展AI競技,也有利於進一步吸引他們對於人工智能的關注和興趣,吸引全球知名高校人工智能科研技術專業的優秀人纔聚焦智慧蓉城,助力蓉城打造世界首個AI競技賽事城市名片,形成人工智能開放研究創新生態體係。
“世界大學生數智競技邀請賽” 視頻介紹畫麵。
近年來,國內外在AI領域進行瞭不少應用場景的探索與研究。
早在2017年,OpenAI就曾經憑藉OpenAI Five智能體,在遊戲場景裏擊敗瞭人類頂級陣容。DeepMind也於同年,在《星際爭霸2》這款遊戲中大放異彩,其相關的技術論文,亦是登上瞭領域內的頂級刊物《Nature》,論證瞭數字場景下的智能體測試成果,能夠作為驗證AI技術成效,推動技術迭代的有效路徑。
在國內,以騰訊為代錶的多傢科技企業、單位、高校,也在積極聯動、群策群力,打通技術研究-測試-應用的聯通棧道。
2020年8月,首屆“騰訊開悟MOBA多智能體強化學習大賽”揭幕,邀請中科大、清華大學、北京大學等18所高校同台競技,成功擴大社會各界對AI+遊戲研究的認知,驗證瞭“開悟”平台對人工智能教育與科研的促進作用。第二屆比賽又進一步擴大瞭開放規模,並實現瞭輕量化和易用化。
通過兩屆競賽,開悟逐漸建立瞭産學研閤作新生態,推動AI+遊戲産業升級及人工智能研究的發展,特彆是構築瞭以“開悟”為核心,包括算法、脫敏數據、算力、場景優質平台,使研究者獲得難得的研發資源。
不僅如此,《王者榮耀》和“開悟”也已攜手高校閤作開發課程,進一步普及多智能體強化學習教育。
2021年8月,騰訊宣布與四所國內一流高校共建教學內容和課程體係改革項目。北京大學李文新、電子科技大學謝寜、清華大學李秀、中國科學技術大學周文罡等四位教授將基於騰訊開悟平台,分彆構建一門至少20學時的多智能體及強化學習平台的專業課程,理論授課知識點包括但不限於機器學習、強化學習、多智能體決策等相關的知識點。
業內專傢分析稱,企業、産業、高校間的有效資源整閤與聯動,構建瞭以平台、技術、團隊為核心的閤作主體,通過“産學研用”一體化機製,融閤科技創新能力,可推動實現科技與文化産業穩步發展的正循環。
來源:科技日報 圖片由騰訊提供
編輯:王宇
審核:硃麗
終審:王鬱