【翻牆問答】ChatGPT年代巧辨真假 防假真網站盜竊個資

0:00 / 0:00

問:現時很流行ChatGPT或類似的人工智能技術,有傳潛在被中國政府變成宣傳工具的危險,甚或被利用去製造假網站盜取個資。這些說法可信嗎?

李建軍: ChatGPT人工智能需要通過電腦深度學習,但由哪些人去預備給機器學習的資料,以及學習資料的來源包括哪些?暫時ChatGPT並無公開,因為外界不知道ChatGPT學了甚麼。英文版的ChatGPT,暫時知道是以一些國際頂級大傳媒的資料作為學習基礎,只不過,中文版ChatGPT資料來源若與英文版一樣來自傳媒,由於中文媒體內容中大量為中共喉舌,就可能對ChatGPT造成洗腦效果,因此中國當局要污染ChatGPT的答案並不難。要防止這種情況,除非ChatGPT的公司OpenAI聘用專門人員,防止中共利用他們的媒體霸權,令機器學一些不正確的答案。

至於製造假網站去偷資料的做法則更為高超。以往一些假網站是基於真網站資料再進行偽裝,但很容易在一些不能夠靠抄去偽裝的位置露底——例如一些客戶服務,或一些需要與用戶互動的內容就不能靠抄。稍為聰明的用戶,都可以憑一些互動方法,識破偽冒網站。例如在大陸模仿香港的網站,那些客戶服務人員居然不懂繁體字,一下便穿幫。但現在可以透過機器學習彌補到這些不足之處,原本透過互動辨別真假網站的做法就不再發揮作用了,用戶就要更小心去由技術資料區分真假網站,但並非人人都具備這樣的技能。

利用ChatGPT或者類似的技術,中國當局要製作一個民運人士釣魚帳戶,亦會比以前更容易,例如用相關技術假扮民運人士,發表文章掀起爭論,甚至大舉取得網上一些異見用戶資料亦可以。因此在人工智慧流行的年代,像推特和臉書的用戶身份認證功能之所那麼重要,因為在人工智能的年代,你不容易單憑語氣和筆法去判斷一個人的真實身份。亦因此,如果你本身是有一些名氣的網絡用戶,在安全容許的情況下,都應該善加利用推特或臉書的用戶身份認證功能,特別是針對名人使用的版本,因為純收費的身份認證的功能,中國當局仍然可以搶把假用戶認證來達到目標,因為中國當局仍然有一定經費去做這類搶註工作,中國亦有不少人,做搶註他人域名來賺錢的工作。

防止中國當局利用人工智慧來模仿用戶,這是相當之費煞思量。在這方面,可能只有YouTube會稍好,因為YouTube的版權管理工具,以及廣告收益分享的安排,都會對用戶真實身份作出核證。

問:那日後使用網站,遇到人工智能程式所作出的一些提問,應該如何處理?

李建軍:對於一些可靠的西方電子商貿網站,他們的人工智能客戶服務人員,暫時都仍然是可靠,因為他們往往有自己的保安系統,他們只是利用ChatGPT之類的演算法。另外,現時大部分西方電子商貿網站,不會洩漏不必要的個人資料,或者作出一些古怪提問。當然,你要小心偽裝網站用人工智能模仿成真的客戶服務人員一樣,所以你要學懂分辨網站真偽,例如有否出現古怪的域名之類。

對於中國的電子商貿網站,會否有政府當局乘機安插後門,借人工智慧作為偷資料的工具,這點是未知之數,因為技術上是有可能的。因此,如果你用中國的電子商貿網站,碰上人工智慧程式問一些與你要求的服務無關的問題,你應該改用其他支援方式,或者稍等一等,再試另一個人工智慧程式的提問。人工智慧的流行,並不見得令網絡更安全。