元宇宙百人會主旨報告 | 清華大學(xué)沈陽:AIGC將走向全球智能和虛實協(xié)同
6月3日上午,元宇宙百人會啟動儀式在國家科技傳播中心四樓高端發(fā)布大廳舉行。清華大學(xué)新聞學(xué)院元宇宙文化實驗室主任沈陽以《AIGC發(fā)展研究》為題進行了主旨報告。
沈陽表示,當(dāng)前AIGC(利用人工智能技術(shù)來生成內(nèi)容)發(fā)展迅猛。AIGC現(xiàn)在的典型發(fā)展趨勢是全球智能、虛實協(xié)同,即通過人和機器的緊密協(xié)作,充分利用信息、能源和材料等資源,以及借鑒歷史經(jīng)驗、關(guān)注當(dāng)下現(xiàn)象和展望未來趨勢,實現(xiàn)社會、經(jīng)濟和技術(shù)的可持續(xù)發(fā)展?,F(xiàn)在國內(nèi)在這個領(lǐng)域的產(chǎn)業(yè)發(fā)展格局是巨頭持續(xù)發(fā)展,小微企業(yè)還在尋找發(fā)展機遇。
AIGC發(fā)展下去會怎么樣?它和元宇宙之間在哪些點上可以匯合?這是需要關(guān)注的重點,其中多模態(tài)學(xué)習(xí)是一個重要的方面,大概GPT4、GPT5要做多模態(tài)學(xué)習(xí)。如果未來GPT6需要做知識推理,到GPT7就要做通用人工智能,到GPT8就要達到人類水平的自然語義理解。按照現(xiàn)在的路線圖,大概5年左右就可以達到這樣的水平。
AIGC能替代人類的很多腦力勞動
2022年11月30日ChatGPT發(fā)布之后,人工智能和元宇宙的領(lǐng)域發(fā)生了巨大的認知上的變化,原來人類認為體力勞動的替代會優(yōu)先發(fā)生,也就是說我們在家里邊干活會被機器人和人工智能替代一部分工作量,但是去年ChatGPT發(fā)布之后,大家發(fā)現(xiàn)在腦力勞動方面,可能有一部分工作會優(yōu)先被ChatGPT之類的AIGC所替代。這是認知上的重大變化,甚至對整個行業(yè)都直接產(chǎn)生了重大影響?,F(xiàn)在很多工作崗位都開始使用AIGC工具來替代人類的一部分工作。
沈陽表示AI替代某個工作主要取決于任務(wù)重復(fù)性、標準化程度、創(chuàng)新和判斷能力的需求、數(shù)據(jù)依賴性、經(jīng)濟成本、交互復(fù)雜性等因素。而每個工作的任務(wù)構(gòu)成決定了最后的整體替代率,以AIGC對各個職業(yè)和角色的替代率而言,秘書60%的工作可以替代,領(lǐng)導(dǎo)決策20%的部分工作可以被替代,教授進行教學(xué)和研究,大約有30%的工作也可以被替代??偠灾诤芏嘈袠I(yè)有不少工作內(nèi)容都可以被AIGC部分替代,這是各行各業(yè)都需要關(guān)注的。
生成式元宇宙的四個基本邏輯
從現(xiàn)在的生成式智能概念誕生了一些新的概念,比如說生成式數(shù)據(jù),也就是說我們在生活當(dāng)中大量使用的數(shù)據(jù)未來不是人生成的,而是由人工智能生成的,這就是生成式數(shù)據(jù)。對于元宇宙來說也是如此,未來的元宇宙,大部分工作不再需要人來完成,而是由人工智能來完成,所以元宇宙也是生成式元宇宙。
生成式元宇宙要基于生成式的數(shù)據(jù)、生成式的人工智能來搭建完成。以前認為元宇宙是人做出來的,沈陽表示,其實不是這樣,元宇宙的工作量太大,它大部分的工作會由生成式智能來完成。我們今天的生成式智能往后有3個大的步驟:首先是理解式的人工智能,接著是要走向體驗式的人工智能,再往后是自我意識覺醒的人工智能。
單就生成式元宇宙而言,現(xiàn)在有四個基本邏輯:第一個叫萬數(shù)皆用于我,所有的數(shù)據(jù)都為我所用,這個是基礎(chǔ)數(shù)據(jù)。第二個叫萬物皆備于我,所有的元宇宙的對象在我的空間里邊,它都是圍繞著我來轉(zhuǎn)的。第三個叫萬技皆賦于我,所有的技能,譬如畫畫、雕塑、譜曲、寫文言文、寫科幻小說等,我在元宇宙里邊都將擁有。第四個叫萬感皆通于我,百感交集在真實世界里邊很難做到,但是在元宇宙的世界里面非常容易實現(xiàn),在這些虛擬、或者虛實相混的對象里可以實現(xiàn)萬感皆通于我。這些基本邏輯也是生成式元宇宙最終要達成的目標。
大語言模型產(chǎn)業(yè)結(jié)合中國有獨特的優(yōu)勢
Meta公司剛剛公布了ImageBind大模型,這個大模型支持六種數(shù)據(jù),包括視覺、溫度、文本、音頻、深度信息、運動讀數(shù)。Meta公司的首席科學(xué)家楊立昆(也是圖靈獎得主)談到,下一步要增加觸覺、語音、嗅覺、大腦共振的信號。這個大模型就是元宇宙大模型。所以大模型要從語言的大模型,逐步走向多模態(tài)的大模型,再走向元宇宙的大模型。
當(dāng)前大模型有兩個趨勢,第一個趨勢叫做bigger and smarter,越來越大,每一代比上一代增加100倍以上,但也越來越智能,這個時間大概在1年左右。第二個趨勢叫free and smaller,越來越小,但是它是免費的,也很聰明,可以裝到手機里面。把一個大模型放到手機里面,未來手機就可以在授權(quán)的情況下,把微信的數(shù)據(jù)、微博的數(shù)據(jù)、小紅書的數(shù)據(jù)、抖音的數(shù)據(jù)整合到一起,從而在手機上建一個自己的AI分身。
針對大家關(guān)心的中國的GPT大模型發(fā)展問題,沈陽認為中國不會只有一個大模型,每個企業(yè)和個人都將有自己的GPT,在確保安全可控的前提下,企業(yè)可以通過開源微調(diào)實現(xiàn)快速發(fā)展。在安全可控、多維優(yōu)化的前提下,本地GPT還有較大的發(fā)展機遇。這是由于全球范圍內(nèi)語言和文化差異、數(shù)據(jù)安全及合規(guī)性要求等一些原因,大型語言模型的本地化是剛需,本地化能夠提高模型在特定語言、文化和行業(yè)背景下的準確性和實用性,從而滿足更多用戶需求。
沈陽表示,在大語言模型和產(chǎn)業(yè)結(jié)合方面,中國有著自己獨特的優(yōu)勢,現(xiàn)在中國的短視頻世界第一,直播帶貨世界第一,移動游戲世界第一。另外,工業(yè)制造的GDP在2010年就已經(jīng)是世界第一了,因此大語言模型可以和各個領(lǐng)域進行很好的結(jié)合,這是非常重要的一個方向。
不能忽視AIGC的風(fēng)險
AIGC的風(fēng)險是不能忽視的問題。譬如AI和生物病毒的制作相結(jié)合,對人類的影響是怎么樣的?還有就是AIGC同機器人、互聯(lián)網(wǎng)、無人駕駛汽車的結(jié)合會是怎么樣的?這些都是大家非常關(guān)心的問題。核心思想是在AI覺醒之前的發(fā)展初期為其提供良好的訓(xùn)練環(huán)境和數(shù)據(jù),以確保其成長過程中獲得正確的價值觀、認知和行為模式,確保AI安全和友善。
具體而言包括以下舉措:倫理和道德原則納入算法和模型的核心:使AI系統(tǒng)在做決策時遵循一定的道德規(guī)范,確保其行為符合人類的價值觀和利益;提高AI系統(tǒng)的透明度和可解釋性:有助于監(jiān)管者和用戶了解AI系統(tǒng)的運作原理,了解AI在特定情況下做出決策的依據(jù);建立多方監(jiān)管機制:建立跨學(xué)科、跨行業(yè)的監(jiān)管機制,確保AI系統(tǒng)的開發(fā)和應(yīng)用始終處于人類的控制范圍內(nèi);加強對抗式訓(xùn)練和強化學(xué)習(xí):使其在與其他AI或人類互動時更加適應(yīng)且遵循人類的價值觀,幫助AI系統(tǒng)更好地理解人類的行為和期望;培養(yǎng)具有同理心的AI:使其更加關(guān)心人類的需求和感受。這需要在AI系統(tǒng)的訓(xùn)練數(shù)據(jù)中包含人類的情感和社會行為信息;確保AI能力的可控性:限制其能力范圍,防止其成為不受控制的存在。需要開發(fā)一種“安全鎖”機制,以確保在關(guān)鍵時刻,人類可以介入并控制AI系統(tǒng)的行為。
AIGC的版權(quán)問題需要予以關(guān)注
在AIGC高速發(fā)展的當(dāng)下,沈陽也提醒,版權(quán)是一個需要重點關(guān)注的問題,特別是AIGC產(chǎn)生的數(shù)據(jù),它的版權(quán)尤其是二次創(chuàng)作版權(quán)問題,怎么樣來處理?這需要研究。如果AI是完全自主地創(chuàng)作內(nèi)容,沒有人的直接參與,那么創(chuàng)作主體的確定就更為困難。
針對AI的開發(fā)者的創(chuàng)作主體如何認定,沈陽認為,需要在法律法規(guī)上予以明晰。目前,日本對AIGC的數(shù)據(jù)不進行版權(quán)保護,雖然做法比較激進,但是有助于AI大規(guī)模地發(fā)展。
沈陽表示,AIGC在跨界應(yīng)用方面具有廣闊的前景,場景強化、多元輻射是發(fā)展的方向和潮流,也將推動元宇宙領(lǐng)域快速發(fā)展?,F(xiàn)在整體上來說,中國正處于AIGC和元宇宙結(jié)合的時間點上,中國需要抓住這個發(fā)展機遇,也需要解決其發(fā)展道路上遇到的一些問題和風(fēng)險。