-
鄭戈:大模型不“關(guān)心”真理和事實(shí),但我們也不宜過早立法干預(yù)
【文/觀察者網(wǎng)專欄作者 鄭戈】
機(jī)器學(xué)習(xí)大模型是人工智能技術(shù)經(jīng)過60余年累積而綻放出的應(yīng)季花朵,令觀賞者贊嘆不已。由于當(dāng)下的多模態(tài)大模型不僅可以生成文字影音內(nèi)容(AIGC),甚至可以生成實(shí)物(借助3D打印技術(shù),比如商湯“日日新”大模型體系中的“格物”),所以被認(rèn)為是生成式人工智能的突破性進(jìn)展。
從技術(shù)上講,大模型并非基于任何知識上的創(chuàng)新,而是基于算力、算法和數(shù)據(jù)的規(guī)模升級,是摩爾定律和梅特卡夫定律所揭示的技術(shù)的政治經(jīng)濟(jì)效應(yīng)的表現(xiàn)。換句話說,大模型依靠的“暴力計(jì)算”,即高性能GPU運(yùn)行千億級參數(shù)模型通過海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。
用OpenAI首席科學(xué)家伊利亞·蘇茨克沃的話來說:“如何解決難題?使用大量訓(xùn)練數(shù)據(jù)以及一個大型神經(jīng)網(wǎng)絡(luò)。這樣,你可能得到的唯一結(jié)果就是成功?!睘榇?,OpenAI的主要投資者微軟投入數(shù)億美元資金為OpenAI打造了一套超算系統(tǒng),由上萬顆單價為數(shù)萬美元英偉達(dá)A100芯片組成,這套系統(tǒng)為訓(xùn)練ChatGPT提供了3640PF-days的算力消耗(即假如每秒計(jì)算一千萬億次、連續(xù)計(jì)算3640天)。
資料圖來源:Shutterstock
由此可見,大模型訓(xùn)練是一個燒錢的游戲和耗能的游戲,充滿著重資本的味道,一點(diǎn)兒也不節(jié)能環(huán)保。這時,我們就需要對大模型的商業(yè)和社會應(yīng)用進(jìn)行一番成本-收益分析,看看它所帶來的收益是否大于成本以及收益的歸屬和成本的分擔(dān)。在進(jìn)行這種分析的時候,我們應(yīng)當(dāng)注意到尚未被計(jì)入成本的那些外部性,比如實(shí)際上由公眾承擔(dān)成本的環(huán)境損害。
·系統(tǒng)性風(fēng)險
大模型能夠帶來的好處似乎是顯而易見的。
雖然訓(xùn)練成本高昂,但一經(jīng)訓(xùn)練成功,它就可以產(chǎn)生巨大的生產(chǎn)力,自動化地生產(chǎn)文字、圖像和音視頻內(nèi)容,比如幫助文字工作者生成文案和文學(xué)作品,幫助醫(yī)生了解病人的病史和癥狀描述并形成診斷和治療方案,幫助老師、科研人員和學(xué)生閱讀大量文本并提取關(guān)鍵知識點(diǎn)和主要論點(diǎn),幫助法律職業(yè)者審閱法律文件、分析法律問題并形成初步法律意見書等等。
進(jìn)一步,當(dāng)細(xì)分領(lǐng)域的專業(yè)化大模型出現(xiàn)的時候,它可以改變各行各業(yè)的生產(chǎn)方式和組織形態(tài),大幅度提升制造業(yè)、交通運(yùn)輸業(yè)、農(nóng)業(yè)乃至任何我們能夠想到的行業(yè)的自動化程度和生產(chǎn)率。
以商湯的“日日新”大模型體系為例,它包含:
作為對話和文本內(nèi)容生成平臺的“商量”(SenseChat),可以像ChatGPT那樣跟人進(jìn)行多輪對話,可以寫廣告語、文案、故事、小說和程序代碼;
如果用于智慧醫(yī)療,可以提供隨訪、健康咨詢、互聯(lián)網(wǎng)問診和輔助醫(yī)療服務(wù),這些功能已經(jīng)在上海新華醫(yī)院、鄭州鄭大一附院、成都華西醫(yī)院得到實(shí)際應(yīng)用;
它還包含根據(jù)文字生成圖像的“描畫”,可以生成圖文并茂的文案、漫畫并輔助其他形式的藝術(shù)創(chuàng)作;
還有生成元宇宙3D虛擬場景的“瓊宇”,可以實(shí)現(xiàn)對虛擬空間和虛擬物體的復(fù)刻與交互,比如耗時兩天即可生成具有厘米級復(fù)刻精度、還原場景的真實(shí)細(xì)節(jié)和光照效果的100平方公里虛擬城市,可用于數(shù)字孿生、建筑設(shè)計(jì)、影視創(chuàng)作、文旅宣傳和電商展示等場景;
以及“格物”,即連接3D物體生成與3D打印,將自動生成的物體制造成實(shí)物,可用于制造業(yè)。
這些都是大模型商業(yè)模式的從業(yè)者向我們展示的美好前景,在絲毫不否認(rèn)這些場景都有可能在近期實(shí)現(xiàn)的前提下,我想指出其另外一面,以便我們的公共選擇能夠促成一種普惠的現(xiàn)實(shí),而不是讓技術(shù)成為“割韭菜”的工具,在給少數(shù)人帶來巨大收益的同時讓多數(shù)人承擔(dān)成本而只得到極微小的、甚至是虛幻的好處。
首先,正如前面已經(jīng)暗示的那樣,現(xiàn)有的大模型訓(xùn)練方案是對人類已有的創(chuàng)造成果的規(guī)?;瘜W(xué)習(xí),所產(chǎn)生的結(jié)果是已有內(nèi)容的新的表達(dá)形式,它不會帶給我們關(guān)于事實(shí)的新知。
已有的實(shí)操都顯示出,ChatGPT更善于回答“主觀題”,而在“客觀題”方面則無法給我們提供準(zhǔn)確的答案。也就是說,大型語言模型學(xué)會了人類的油嘴滑舌和政治正確,卻絲毫不“關(guān)心”真理和事實(shí)。
這倒是與語言本身的功能高度吻合。按照悉尼大學(xué)語言學(xué)教授恩菲爾德(N. J. Enfield)的說法,語言是人類社會生活的產(chǎn)物,它的首要功能不是再現(xiàn)現(xiàn)實(shí),而是維系社會系和協(xié)調(diào)社會行動。
借助語言,我們不僅對其他人產(chǎn)生影響,而且與其他人一起來影響社會。在使用語言時,我們不僅考慮要不要表達(dá)自己的真實(shí)想法,還要考慮其他人會怎么理解我們所表達(dá)的內(nèi)容,以及他們在按照自己的理解消化了我們所表達(dá)的內(nèi)容后會如何回應(yīng)我們。
語言的功能塑造著語言的形態(tài),導(dǎo)致所有的人類語言中都包含大量表示人類主觀感受的詞匯,而描述自然事實(shí)的詞匯卻缺乏精準(zhǔn)性。比如,人眼可以辨別幾百種顏色,但描述顏色的詞匯在任何人類語言中都只有屈指可數(shù)的幾個。
他最后的結(jié)論是:語言對律師而言是好的,對科學(xué)家而言卻是糟糕的。
劉慈欣的《三體》也呈現(xiàn)了人類語言的這種特點(diǎn)。
三體人不借助語言來交流,所想即所見,這種特點(diǎn)可能是使他們的科技遠(yuǎn)遠(yuǎn)領(lǐng)先于地球人的原因之一。畢竟地球人耗費(fèi)于揣摩心思、編制花言巧語、維系社會關(guān)系上的時間和精力遠(yuǎn)遠(yuǎn)多于用來認(rèn)識客觀世界的時間和精力。甚至更專注于事實(shí)世界的人會被認(rèn)為不合群、不正常,因此會在社會選擇中被淘汰。
但人類思想的不透明也令三體人感到害怕,你永遠(yuǎn)無法從一個地球人說的話里判斷出他的真實(shí)想法。地球人也正是利用自己的這個比較優(yōu)勢(或比較劣勢)制定出了面壁者計(jì)劃。面壁者被假定是城府最深的人,他們所說所做的一切都是“計(jì)劃的一部分”,但這種計(jì)劃完全是私密的、不為外人所知的。
語言大模型的運(yùn)行機(jī)理不是透過話語的表象來呈現(xiàn)人的內(nèi)心,更不是超越語言來幫助人類認(rèn)識現(xiàn)實(shí),而是熟練地使用語言表象本身,使表象更加表象,乃至可以自動化地生成。
以下就是我跟ChatGPT兩段對話的截屏,從中我們可以看出ChatGPT是如何的“虛偽”,如何的不關(guān)注事實(shí),但又如何的圓滑和政治正確,而且這種政治正確是以它所學(xué)習(xí)的語料中呈現(xiàn)出的主流價值觀為標(biāo)準(zhǔn)的。
對話一:關(guān)于價值判斷的主觀題
對話二:關(guān)于簡單事實(shí)的客觀題
在社會交往中策略性地使用語言是人本身就很擅長的,我們所需要的人工智能是能夠?yàn)槲覀兝斫庹鎸?shí)世界提供可靠信息的助手,而不是能夠模仿我們熟練使用社交語言的“社牛”。在這一點(diǎn)上,大型語言模型還不如搜索引擎。
進(jìn)而,如果人們覺得大型語言模型支撐的各種聊天工具比真人說話更“動聽”,便會減少與親人、朋友、同事或同學(xué)的語言交流,沉浸于跟機(jī)器聊天。這將進(jìn)一步加劇社交媒體興起以來人在自己主觀世界中的沉浸和共同體意識的缺失?!靶畔⒗O房”、“過濾氣泡”和“回音室”等概念都描述了這樣一種數(shù)字化時代普遍現(xiàn)實(shí)。
對于平臺企業(yè)來說,這是一個巨大的商機(jī),因?yàn)槔萌巳硕加械娜觞c(diǎn)才能實(shí)現(xiàn)規(guī)?;?,而激勵人克服弱點(diǎn)的產(chǎn)品和服務(wù)卻不可能為大眾所樂于消費(fèi)。資本不負(fù)責(zé)教育人積極向上,這是一個基本事實(shí)。但人畢竟生存在真實(shí)世界中,這個世界的客觀事實(shí)總會檢驗(yàn)人的主觀認(rèn)知,一旦面臨生存考驗(yàn),沉浸于主觀滿足感的人類就會顯得十分脆弱。
- 原標(biāo)題:生成式人工智能的系統(tǒng)性風(fēng)險及其法律應(yīng)對 本文僅代表作者個人觀點(diǎn)。
- 責(zé)任編輯: 李泠 
-
花數(shù)百萬整容的市委書記,判了
2023-04-17 09:21 廉政風(fēng)暴 -
村民打漁疑被當(dāng)成獵物遭槍擊后死亡,嫌疑人被控制
2023-04-17 09:17 -
潛逃27年命案嫌犯不起訴?廣東省檢復(fù)查
2023-04-17 08:45 疑案追蹤 -
杭州蕭山機(jī)場濃煙滾滾,官方通報
2023-04-17 07:45 -
“男子研發(fā)恒壓閥被認(rèn)定槍支散件獲刑10年”追蹤:檢察院決定不起訴
2023-04-17 07:23 疑案追蹤 -
深圳建輝慈善基金會:暫停涉鄭州“抗癌共享廚房”的資助審批流程
2023-04-16 22:45 -
國務(wù)院國資委企干一局局長夏慶豐被查
2023-04-16 20:30 廉政風(fēng)暴 -
上千棵核桃樹被砍陷入“羅生門”,多方回應(yīng)
2023-04-16 16:38 基層治理 -
大陸剛發(fā)射衛(wèi)星,臺軍又炒作:飛過“臺灣北部外海上空”
2023-04-16 16:13 臺灣 -
青海湟中一油罐車爆炸,已造成2人死亡
2023-04-16 14:24 安全生產(chǎn) -
北京地鐵不再強(qiáng)制戴口罩,提示廣播詞已更改
2023-04-16 13:40 抗疫進(jìn)行時 -
江蘇省人大常委會原副主任劉捍東被查
2023-04-16 13:08 廉政風(fēng)暴 -
男子錘殺男童埋尸、勒索財物,已被執(zhí)行死刑
2023-04-16 11:09 -
學(xué)習(xí)貫徹習(xí)近平總書記給中國工合國際委員會重要回信精神專題研討會在滬召開
2023-04-16 10:59 -
我國首顆主動降水測量衛(wèi)星發(fā)射成功
2023-04-16 10:16 航空航天 -
焦點(diǎn)訪談丨國家安全是民族復(fù)興的根基
2023-04-16 09:19 2023全民國家安全教育日 -
第八個全民國家安全教育日 各地各部門多形式普及總體國家安全觀
2023-04-16 09:06 2023全民國家安全教育日 -
國安有我 全民共護(hù)——各地各部門廣泛開展全民國家安全教育日宣教活動
2023-04-16 09:04 2023全民國家安全教育日 -
曲婉婷名下的兩套房產(chǎn)將被拍賣
2023-04-16 08:53 廉政風(fēng)暴 -
干部喝20塊的白酒被處分,紀(jì)委:不是錢的問題
2023-04-16 08:48 廉政風(fēng)暴
相關(guān)推薦 -
最新聞 Hot
-
“特朗普夜不能寐,搞定全球問題比想象難得多”
-
靠岸中國貨船數(shù)“歸零”,美西港口官員驚到了
-
“出軌女下屬”,英國海軍一把手被免職
-
“聽加州的,否則美國最大經(jīng)濟(jì)體地位不?!?/a>
-
流浪53年后,蘇聯(lián)金星探測器墜落地球
-
伊朗官員:美國不真誠,一開始就設(shè)陷阱
-
?;鸬谝灰梗“突ハ嘀肛?zé)
-
為什么選出美國籍教皇?梵蒂岡消息人士:還不是因?yàn)樘乩势?/a>
-
普京提議:15日,俄烏直接談
-
王毅分別同印巴雙方通話
-
印度稱“不想升級”,巴方想“就此打住”
-
英法德波領(lǐng)導(dǎo)人訪問基輔,將與澤連斯基共同討論?;饐栴}
-
印軍否認(rèn)S-400防空系統(tǒng)被摧毀
-
印度前高官:勸巴基斯坦,中國的話好使
-
空中爆炸!巴軍通報7日空戰(zhàn)細(xì)節(jié),含擊落“陣風(fēng)”錄音
-
要松口了?印官員稱將“適時”公開
-