研究:中共網絡審查能影響人工智能準確度

0:00 / 0:00

較早時谷歌翻譯被揭發在翻譯一些有關中國的字句時出現錯誤,一項最新研究可能解釋到箇中原委。該研究表明,包括中共在內的政府審查制度可以影響人工智能運算。該研究指出,人工智能運算法可能學習了備受審查的單詞和短句,從而影響翻譯程式的用語。

據美國科技資訊網站《有線》(Wired) 報道,加州大學聖地亞哥分校的政治學教授瑪格麗特·羅伯茨(Margaret Roberts)和博士生Eddie Yang研究了經過兩種來源訓練的人工智能語言運算:其研究對象包括在中國受到屏蔽的「維基百科(Wikipedia)中文版」,以及類似維基但受到中共審查的中國網站「百度百科」。

羅伯茨和Eddie分別用學習「維基百科」和「百度百科」的人工智能來評估新聞條目意思是屬於「正面」抑或「負面」,結果表明,「維基百科」在遇到「選舉」、「自由」和「民主」等字眼時,多數會評價為「正面」,而「百度百科」就會對出現「監視」、「社會監控」和「中共」字眼的條目給予較高評價。他們也發現,維基百科認為「民主」可連繫「穩定」,但百度百科就認為「民主」跟「混亂」有關聯。

羅伯茨認為,研究中發現的差別可能並非完全出於政府審查,也有可能是詞條撰寫人本身的自我審查或他們來自不同的文化所造成。

羅伯茨表示,重要的是,要認識到政府政策可能導致其他形式的「偏見」潛伏在人工智能系統中。羅伯茨說:「我們認為這是一個起點,我們開始去嘗試理解政府授意(government-shaped)的數據如何在人工智能的學習過程中發揮作用。」

這項研究將在3月的2021年公平性問責制和透明度會議(FAccT)上發表。

上月有網民發現,於谷歌翻譯(Google translate)輸入「China breaks promise (中國違約)」,會得出「中國信守諾言」的結果;但輸入「US breaks promise (美國違約)」,則會得出「美國違約」的結果。但相關錯誤在稍後得到修正。