“社恐”不善溝通?人工智能來幫忙“AI代理”會談判能達成協(xié)議
【資料圖】
苦于缺乏談判技巧的人們,或許未來可以求助于人工智能(AI)了。英國《自然·通訊》雜志6日報告,“深度思維”公司研發(fā)的一種“AI代理”會談判并能達成協(xié)議,其已在測試平臺中勝過其他無此能力的代理。這一成果展示了一種深度強化學(xué)習(xí)方法,用其建模的“AI代理”可與其他人工代理溝通合作,在玩游戲時共同制定計劃。
開發(fā)能展現(xiàn)出代理間合作和溝通的AI十分重要。流行桌面游戲《外交》為此類行為提供了有用的測試平臺,它包含玩家之間復(fù)雜的溝通、談判和形成同盟,而AI一直很難達成這些。要贏得游戲,《外交》需要推斷在場玩家的未來計劃、玩家間的承諾,和他們的誠實合作。過去的“AI代理”在單個玩家或兩個競爭性玩家的游戲中取得過成功,其中玩家之間沒有交流。
英國“深度思維”研究團隊此次設(shè)計了一種深度強化學(xué)習(xí)方法,讓代理可以協(xié)商同盟、共同制定計劃。研究人員創(chuàng)造出了模擬玩家的代理,形成團隊,嘗試勝過其他隊伍的策略。通過預(yù)測可能的未來游戲狀態(tài),這一學(xué)習(xí)算法允許代理對未來行動達成一致,識別有益交易。為接近人類水平的表現(xiàn),他們還通過檢驗一些代理間承諾破裂的場景(代理背離了過去的協(xié)議),調(diào)查了誠實合作的條件。
這些成果有助于“AI代理”形成靈活溝通機制,使其能根據(jù)環(huán)境調(diào)整策略。此外,這些發(fā)現(xiàn)還表明,對違反協(xié)議的同伴的制裁傾向會大大降低這類違反者的優(yōu)勢,有助于形成大多可信的交流,盡管情況最初更有利于違反協(xié)議者。
我們現(xiàn)在也常會跟AI打交道。它熱情洋溢、語調(diào)輕快地推銷商品,介紹活動,提供售后服務(wù)。不過,通常情況下我們很快就能發(fā)現(xiàn)電話那頭的是AI。它很難靈活變通,也回答不了超出設(shè)置之外的問題。在“深度思維”公司的這項研究中,AI已經(jīng)能上談判桌了。它們不僅會審時度勢,還會合縱連橫,并懲罰談判上的不可信者。當(dāng)然,人類不可能放心直接讓AI談判,但這類嘗試可以讓AI形成靈活溝通機制,從而增進它們在其他許多領(lǐng)域的表現(xiàn)。
關(guān)鍵詞: 強化學(xué)習(xí) 人工智能 熱情洋溢