近年來,人工智能技術(shù)變得越來越復雜?,F(xiàn)在,如此眾多的產(chǎn)品和服務(wù)都依靠技術(shù)來提供自動化和智能,以至于它與我們的日常生活密不可分。無論是通過我們用來在家里提供便利的設(shè)備還是我們一直使用的產(chǎn)品的制造方式,其影響無處不在,從而推動了我們生活中各個方面的創(chuàng)新。但是,這個難題中有一些遺漏的部分仍然會給用戶帶來挫敗感,并為試圖改善AI技術(shù)性能的研究人員提出了嚴峻的挑戰(zhàn)。
常識人工智能
微軟聯(lián)合創(chuàng)始人保羅·艾倫(Paul Allen)在2018年去世之前,投入了大量的時間和資源來解決似乎又一次又一次出現(xiàn)的重大挑戰(zhàn):人工智能技術(shù)中基本缺乏常識。艾倫先生,他的艾倫研究所人工智能(AI2)推出馬賽克繼續(xù)解決這一問題,陷害像這樣:
“在AI研究初期,人們對常識的關(guān)注很多,但是這項工作停滯了。人工智能仍然缺乏大多數(shù)10歲孩子擁有的東西:普通常識。我們希望迅速開展這項研究,以在該領(lǐng)域取得重大突破。”
艾倫的類比凸顯了深度學習技術(shù)當前狀態(tài)的一個大問題。盡管我們的AI產(chǎn)品通常很智能,但它們?nèi)匀粺o法回答我們可能會問到同事或配偶的較簡單的問題。例如,“如果我將這堵墻漆成紅色,明天還會變成紅色嗎?” 為了說明我們須解決的距離,AI2的執(zhí)行官Oren Etzioni舉了一個例子:“當AlphaGo在2016年擊敗圍棋玩家時,程序不知道圍棋是棋盤游戲?!?在我們解決這個問題之前,人工智能的成功潛力將限于狹窄的應(yīng)用。
解決常識問題的復雜方法
顯而易見的是,有必要采用常識性AI的多管齊下的策略來突破技術(shù)的局限性。為此,艾倫(Allen)的Mosaic項目“整合了機器閱讀和推理,自然語言理解,計算機視覺以及眾包技術(shù),從而為未來的AI系統(tǒng)建立了新的廣泛的基礎(chǔ)常識知識庫?!?對于像AI2這樣的組織,在研究層面上這是什么樣的?
視覺常識推理(VCR)是一項新的任務(wù),是用于認知級視覺理解的大規(guī)模數(shù)據(jù)集。該研究專注于為基于AI的視覺系統(tǒng)創(chuàng)建高階認知和常識推理。VCR是華盛頓大學和AI2研究人員之間的一項努力。VCR使用了一群人群工作者來注釋該項目的數(shù)據(jù)。
常識知識圖提供了一種表示常識概念的半結(jié)構(gòu)化方式。與其他知識來源相比,這種結(jié)構(gòu)提供了不同的觀點,但是,代表什么類型的知識以及如何較好地將其納入現(xiàn)代神經(jīng)網(wǎng)絡(luò)仍然是該領(lǐng)域研究的重要問題。為了解決這個問題,團隊目前正在構(gòu)建和發(fā)布資源,以探索常識的各個方面,例如有關(guān)社會狀況,心理狀態(tài)和因果關(guān)系的信息。
SWAG大規(guī)模數(shù)據(jù)集可完成扎根的常識推理,統(tǒng)一自然語言推理和扎根的推理。數(shù)據(jù)集包括有關(guān)基礎(chǔ)情況的113k個選擇題。每個問題都是來自LSMDC或ActivityNet字幕的視頻字幕,其中有四個答案可供選擇,以解決場景中接下來可能發(fā)生的情況。正確的答案是視頻中下一個事件的(真實)視頻標題;這三個錯誤的答案是對抗性地產(chǎn)生并經(jīng)過人工驗證的,目的是愚弄機器而不是人類。該團隊的目標是使SWAG成為評估扎實的常識NLI和學習表示形式的基準。