GPT時(shí)代的創(chuàng)意寫(xiě)作
AI幫我擊敗莫言?
最開(kāi)始的時(shí)候,排名第一的是莫言發(fā)表在《十月》雜志上的小說(shuō)《等待摩西》??傻搅俗詈笠惶欤缎≌f(shuō)界》選送了我與AI共同創(chuàng)作的《出神狀態(tài)》。結(jié)果在AI評(píng)委的眼中,這篇小說(shuō)以0.0001分的優(yōu)勢(shì)反超登頂。就這樣,我成了“打敗”莫言的男人。
2017年,我與前Google同事工程師王詠剛一起開(kāi)始一場(chǎng)寫(xiě)作實(shí)驗(yàn),用CNN(Convolutional Neural Networks,卷積神經(jīng)網(wǎng)絡(luò))與LSTM(Long Short-Term Memory Network,即長(zhǎng)短期記憶網(wǎng)絡(luò))訓(xùn)練能夠模仿人類(lèi)創(chuàng)意寫(xiě)作的算法模型。機(jī)器寫(xiě)作并不是新鮮事,早在上世紀(jì)90年代,自動(dòng)化程序便能以拼貼組合的統(tǒng)計(jì)學(xué)方式寫(xiě)詩(shī),抓取實(shí)時(shí)資訊生成結(jié)構(gòu)性新聞等等,但是作為高度復(fù)雜的敘事文本——小說(shuō)所要求的邏輯性、自然語(yǔ)言理解能力,以及對(duì)于人物、情節(jié)、結(jié)構(gòu)、文法的不同層面的要求,之前的AI尚未達(dá)到這樣的能力。
我們用CNN對(duì)小說(shuō)文本進(jìn)行特征提取,然后將輸出的特征圖譜(feature map)映射為序列矢量輸入到LSTM網(wǎng)絡(luò),便可訓(xùn)練出能夠模仿人類(lèi)寫(xiě)作的算法模型,然后通過(guò)調(diào)整參數(shù),也就是所謂的fine tuning,讓它寫(xiě)出來(lái)的東西盡量接近我們現(xiàn)有對(duì)于文學(xué)的理解和審美。學(xué)習(xí)了上百萬(wàn)字我的作品之后,AI程序“陳楸帆2.0”可以通過(guò)輸入關(guān)鍵詞和主語(yǔ),來(lái)自動(dòng)生成每次大約幾十到一百字以內(nèi)的段落,我與它共同創(chuàng)作的作品《出神狀態(tài)》,甚至還贏得了一座由AI評(píng)委評(píng)出的獎(jiǎng)杯。
最開(kāi)始的時(shí)候,排名第一的是莫言發(fā)表在《十月》雜志上的小說(shuō)《等待摩西》。大家覺(jué)得算法挺靠譜,諾獎(jiǎng)得主得獎(jiǎng),那還能有錯(cuò)?可到了最后一天,《小說(shuō)界》選送了我與AI共同創(chuàng)作的《出神狀態(tài)》?!冻錾駹顟B(tài)》的靈感來(lái)源是智利作家羅貝托·波拉尼奧的短篇小說(shuō)集《地球上最后的夜晚》,故事記錄了主人公去上海圖書(shū)館還書(shū)途中的見(jiàn)聞思想,深入探究通訊中斷與緊急狀態(tài)下的人與社會(huì)。結(jié)果在AI評(píng)委的眼中,這篇小說(shuō)以0.0001分的優(yōu)勢(shì)反超登頂。就這樣,我成了“打敗”莫言的男人。這次比科幻還要更科幻的驚喜也讓我醒覺(jué)到,未來(lái)的機(jī)器將更深入地卷入人類(lèi)創(chuàng)作中,未來(lái)的內(nèi)容版圖也會(huì)變得更加復(fù)雜、曖昧而有趣。
巧合的是,2017年也正是Google發(fā)布重注意力機(jī)制與Transformer算法,并開(kāi)啟了機(jī)器學(xué)習(xí)在自然語(yǔ)言處理(NLP, Natural Language Process)領(lǐng)域狂飆突進(jìn)的歷史性時(shí)刻。之后,我們見(jiàn)證了OpenAI推出的GPT(Generative Pre-Trained Transformer)模型不斷進(jìn)化,挑戰(zhàn)人類(lèi)對(duì)于智能、意識(shí)以及創(chuàng)造力的理解邊界。
如何實(shí)現(xiàn)人機(jī)共舞
未來(lái)的作品,讀者或許根本分辨不出到底哪部分是人寫(xiě)的、哪部分是AI寫(xiě)的,因?yàn)檫@里包括非常多不同層次的修改和潤(rùn)色。AI提供給我們非常強(qiáng)大的工具,創(chuàng)意的工具、寫(xiě)作的工具、設(shè)計(jì)的工具,同時(shí)也讓我們思考到底原創(chuàng)性的邊界在哪里,人類(lèi)的主觀能動(dòng)性在哪里,包括知識(shí)產(chǎn)權(quán),包括怎么尊重被采集數(shù)據(jù)的作者,他們是否也擁有一定的權(quán)利。
2022年11月30日,在我的生日這天,OpenAI推出基于GPT-3.5的ChatGPT——一個(gè)能夠回答問(wèn)題、寫(xiě)作小說(shuō)、論文甚至代碼生成的對(duì)話式AI,在全球掀起現(xiàn)象級(jí)熱潮。它從0到獲得100萬(wàn)用戶只用了不到5天,而Twitter用了兩年,F(xiàn)acebook用了300天,Instagram用了75天。相比于之前的GPT-3模型,ChatGPT增加了“依據(jù)人類(lèi)反饋進(jìn)行強(qiáng)化學(xué)習(xí)”(RLHF, Reinforcement Learning with Human Feedback)的概念,能夠更好地理解文本更深層次的復(fù)雜含義,無(wú)論是連續(xù)流暢的對(duì)話,還是對(duì)于錯(cuò)誤想法的糾正,甚至能夠質(zhì)疑不合理前提或者干脆拒絕惡意提問(wèn),足以讓對(duì)話者產(chǎn)生“以假亂真”的幻覺(jué)。
如果說(shuō)2017年的“陳楸帆2.0”語(yǔ)言模型還是混沌不堪的“隨機(jī)鸚鵡”,簡(jiǎn)單的人稱(chēng)都搞不清楚,人物關(guān)系里面誰(shuí)是誰(shuí)、彼此的聯(lián)系是什么,寫(xiě)著寫(xiě)著它就搞混或者顛倒了。但到了GPT-3.5和ChatGPT,它的寫(xiě)作能力已經(jīng)超乎想象。在一個(gè)序列里,你給它一個(gè)環(huán)境或背景去做續(xù)寫(xiě),你能看到它前后的連貫性保持得非常好,甚至還能給出一些你意想不到的轉(zhuǎn)折,有一些甚至令我覺(jué)得帶有更深層的文學(xué)意味。
現(xiàn)在我花非常多的時(shí)間探索怎么跟ChatGPT合作,這肯定不是我們?cè)瓉?lái)想象的簡(jiǎn)單粗暴的“復(fù)制粘貼”的過(guò)程,它是一個(gè)非常復(fù)雜的人跟機(jī)器共生的、共同寫(xiě)作的過(guò)程。在這個(gè)過(guò)程中我會(huì)對(duì)自己的寫(xiě)作有非常多的反思,它讓你理解到你作為人類(lèi)的邊界、慣性在哪里。
我會(huì)用它來(lái)進(jìn)行頭腦風(fēng)暴,或者生成一些對(duì)某個(gè)陌生場(chǎng)景非常細(xì)致的描寫(xiě),甚至把一段話輸入進(jìn)去,讓它調(diào)節(jié)整體風(fēng)格,變得詼諧一點(diǎn),或者嚴(yán)肅一點(diǎn),也可以模仿某個(gè)作家的寫(xiě)作風(fēng)格。幾秒鐘之內(nèi),AI就可以給你生成一段接近你要求的內(nèi)容。但這是一個(gè)反復(fù)迭代的寫(xiě)作過(guò)程,它跟我們傳統(tǒng)的、人文主義的寫(xiě)作是完全不一樣的,我覺(jué)得這非常有意思,它會(huì)在可見(jiàn)的未來(lái)改變很多領(lǐng)域,寫(xiě)作也會(huì)是其中之一。
最近我正在寫(xiě)一個(gè)兒童科幻小說(shuō),寫(xiě)一個(gè)非常懂AI的城市女孩去一個(gè)原始村落,遇到另一個(gè)少數(shù)民族女孩的故事。我會(huì)讓ChatGPT幫我描繪一下未來(lái)的AI城市是什么樣的,這個(gè)女孩一天的生活場(chǎng)景是怎么樣的,它寫(xiě)出來(lái)的非常像《小靈通漫游未來(lái)》,我把文本再回輸進(jìn)去,要求它再增加一點(diǎn)文學(xué)性,再增加一點(diǎn)哲學(xué)的思考、一些生動(dòng)的比喻,它就會(huì)再修改。我甚至曾經(jīng)要求它用科馬克·麥卡錫的筆觸來(lái)寫(xiě)一個(gè)海嘯的場(chǎng)景,出來(lái)的文字不一定全都能用,但能給你一些感覺(jué)。
它也會(huì)生成一些我原來(lái)在大綱里沒(méi)有涉及的情節(jié),比如兩個(gè)女孩第一次見(jiàn)面,會(huì)有一些防備心理。那我可以順著這個(gè)防備心理的線索再去發(fā)展。和ChatGPT一起寫(xiě)作就像一個(gè)開(kāi)放的寫(xiě)作實(shí)驗(yàn),你不需要做任何預(yù)設(shè),由意象展開(kāi)成場(chǎng)景,再加上人物,借由ChatGPT,人物和場(chǎng)景之間發(fā)生的故事就不在你預(yù)先的設(shè)計(jì)范圍內(nèi)了。你就跟著它走,看它怎么把每個(gè)機(jī)器生成的模塊結(jié)合在一起,最后用你人類(lèi)的審美、文學(xué)性的判斷標(biāo)準(zhǔn)再做統(tǒng)一修改。未來(lái)的作品,讀者或許根本分辨不出到底哪部分是人寫(xiě)的、哪部分是AI寫(xiě)的,因?yàn)檫@里包括非常多不同層次的修改和潤(rùn)色。
機(jī)器所理解的文學(xué)性、哲學(xué)性,也是基于語(yǔ)言模型,抽象出很多文學(xué)作品里所謂的文學(xué)性,有時(shí)候會(huì)過(guò)度修飾,比如你讓它加點(diǎn)比喻,它恨不得每句話都來(lái)個(gè)比喻,你就知道了,機(jī)器把握不好這個(gè)平衡,而文學(xué)性的微妙恰恰在于取舍,在于留白,在說(shuō)與不說(shuō)之間,這部分機(jī)器還沒(méi)有那么智能。它對(duì)情節(jié)靈活性的掌握,來(lái)源于已經(jīng)學(xué)習(xí)了非常多歷史上的文學(xué)套路,讓它能跳脫出人類(lèi)作家的慣性。人類(lèi)寫(xiě)作很多時(shí)候還是會(huì)受限于以前的創(chuàng)作路徑,但AI可以從整個(gè)人類(lèi)的數(shù)據(jù)庫(kù)里抽象出非常多的原型,無(wú)限多地在原型里做排列組合,去生成無(wú)限多的分支結(jié)構(gòu)。
我也嘗試過(guò)用ChatGPT去翻譯,真的比我以前用過(guò)所有的翻譯軟件都好。它的流暢程度達(dá)到了一個(gè)新的高度。但我覺(jué)得有一些更微妙的東西,包括文化上的符號(hào)、引用的歷史典故等等,包括有時(shí)候有一些多義性的處理,AI還做不到人類(lèi)譯者的水平。
甚至包括封面和插畫(huà)也可以讓AI參與創(chuàng)作。我馬上要出的一本小說(shuō)集《贏家圣地》,封面就是我用另一個(gè)AI工具M(jìn)idjourney生成的。當(dāng)時(shí)我看了出版社請(qǐng)?jiān)O(shè)計(jì)師做的方案,覺(jué)得跟我想象的還是有點(diǎn)距離,就想自己來(lái),在很短時(shí)間內(nèi)生成了數(shù)十個(gè)版本,篩選之后,讓設(shè)計(jì)師加上字體——以后可能連這一步都可以由AI代勞。
五年的時(shí)間,AI就已經(jīng)進(jìn)化成了現(xiàn)在這樣。技術(shù)的進(jìn)步確實(shí)遠(yuǎn)遠(yuǎn)超過(guò)我們的預(yù)期,這一點(diǎn)是最可怕的。它的進(jìn)步不是我們習(xí)慣的線性增長(zhǎng),而是一個(gè)指數(shù)性的增長(zhǎng),而且這個(gè)增長(zhǎng)才剛剛開(kāi)始。AI提供給我們非常強(qiáng)大的工具,創(chuàng)意的工具、寫(xiě)作的工具、設(shè)計(jì)的工具,同時(shí)也讓我們思考到底原創(chuàng)性的邊界在哪里,人類(lèi)的主觀能動(dòng)性在哪里,包括知識(shí)產(chǎn)權(quán),包括怎么尊重被采集數(shù)據(jù)的作者,他們是否也擁有一定的權(quán)利。所有這些問(wèn)題都在一團(tuán)迷霧當(dāng)中尚待被理清和討論。
我們是否將迎來(lái)
真正意義上的“文學(xué)已死”
如果科技真的到了我們無(wú)法分辨人類(lèi)與機(jī)器的地步,哪怕只是語(yǔ)言層面上,都足以顛覆絕大部分行業(yè)及社會(huì)生活的面貌,因?yàn)槿祟?lèi)無(wú)法離開(kāi)語(yǔ)言進(jìn)行思考、表達(dá)與交流。許多人類(lèi)的職業(yè)會(huì)被替代,企業(yè)會(huì)高度自動(dòng)化。機(jī)器能夠無(wú)窮盡地生產(chǎn)出供人類(lèi)娛樂(lè)的個(gè)性化內(nèi)容,不輸歷史上任何經(jīng)典的文學(xué)、影像或游戲。我們是否將迎來(lái)真正意義上的“文學(xué)已死”?
用AI寫(xiě)作之后,我有一個(gè)非常明顯的感覺(jué),就是人也好,機(jī)器也好,創(chuàng)作的過(guò)程其實(shí)沒(méi)有太大區(qū)別。
我們寫(xiě)作、思考、交流,表達(dá)全都是用語(yǔ)言,那創(chuàng)作的本質(zhì)到底是什么?可能就是把你讀過(guò)的東西、你的體驗(yàn)、你的思考,重新排列組合成一種新的文字組合形式并表達(dá)出來(lái),而機(jī)器是用一種數(shù)學(xué)模型來(lái)做它的排列組合。人可能要更加復(fù)雜,用大腦神經(jīng)結(jié)合情感體驗(yàn)等等。但我覺(jué)得從根本上來(lái)講,這兩者的生成過(guò)程是非常相似的。就像人的寫(xiě)作很多時(shí)候也是從模仿開(kāi)始,只不過(guò)人的大腦的“算法”是一個(gè)更內(nèi)隱的過(guò)程,更像一個(gè)黑盒子,會(huì)被賦予一種神秘感,一種類(lèi)似于靈魂的光暈,就是本雅明所說(shuō)的Aura。而當(dāng)我們真的試圖去理解GPT到底怎么建出來(lái)的,你會(huì)發(fā)現(xiàn)非常多工程學(xué)上的具體實(shí)施細(xì)節(jié),我們都不知道它的原理是什么,只是通過(guò)非常多的試錯(cuò)來(lái)達(dá)成。所以,AI跟人的大腦一樣,我們都不知道它的底層邏輯是什么,都是黑匣子,只不過(guò)一個(gè)是碳基、一個(gè)是硅基。
當(dāng)你看到一個(gè)機(jī)器,它用這么簡(jiǎn)單粗暴的訓(xùn)練方式,也能寫(xiě)出讓你覺(jué)得“有一些東西”的文字時(shí),就會(huì)開(kāi)始回過(guò)頭想,那么多作家、畫(huà)家、詩(shī)人,這些藝術(shù)創(chuàng)作過(guò)程里到底有什么人類(lèi)的獨(dú)特性?我現(xiàn)在的答案是,可能并沒(méi)有那么的獨(dú)特,也沒(méi)有那么的不可替代。
隨著AI不斷以這種指數(shù)級(jí)的速度自我進(jìn)化、自我迭代,接下來(lái),非常多人類(lèi)本體的定義、人本主義的基礎(chǔ)會(huì)被動(dòng)搖,這是一個(gè)更深刻的東西,可能現(xiàn)在還沒(méi)有被討論得特別充分。我觀察到人文學(xué)者,包括一些傳統(tǒng)作家,他們面對(duì)新的事物還是比較保守,甚至很多會(huì)有一種拒斥心理。他會(huì)覺(jué)得這東西無(wú)非就是排列、組合、拼貼,從那么多東西里這兒抄一點(diǎn)、那兒抄一點(diǎn),但我覺(jué)得這個(gè)東西可能沒(méi)有他們想象的那么簡(jiǎn)單。原來(lái)大家會(huì)質(zhì)疑AI無(wú)法創(chuàng)造新的東西,但現(xiàn)在意識(shí)到,人類(lèi)創(chuàng)造的東西,很多也是通過(guò)原有的知識(shí)經(jīng)驗(yàn)打碎重組,放到新的場(chǎng)景里去運(yùn)用。
對(duì)于我來(lái)說(shuō),現(xiàn)在寫(xiě)作中最花力氣的地方反而是在最不花力氣的地方。這么說(shuō)可能有點(diǎn)玄,它不在收集信息、理解科技、編排人物與拿捏故事原型,而是在于不經(jīng)過(guò)理性思考判斷,從潛意識(shí)層面涌現(xiàn)的直覺(jué),也就是“非計(jì)算性”的部分。你無(wú)法控制它的到來(lái),很多時(shí)候只能等待,只能祈禱。這或許是AI尚未通過(guò)語(yǔ)言模型學(xué)會(huì)的部分。
最新的ChatGPT及各種變體已經(jīng)能夠以超乎想象的流暢程度與人類(lèi)進(jìn)行對(duì)話以及進(jìn)行特定領(lǐng)域的寫(xiě)作,比如財(cái)經(jīng)新聞、體育報(bào)道、法律文書(shū)、論文摘要……甚至模仿歷史上不同的作家風(fēng)格進(jìn)行創(chuàng)作。盡管生成內(nèi)容的質(zhì)量還不夠穩(wěn)定,且時(shí)常會(huì)犯一些常識(shí)性的錯(cuò)誤,但目前也有科學(xué)家嘗試教會(huì)機(jī)器理解我們所身處的“世界模型”。可以說(shuō),我們已經(jīng)生活在這樣的科幻現(xiàn)實(shí)中。如果科技真的到了我們無(wú)法分辨人類(lèi)與機(jī)器的地步,哪怕只是語(yǔ)言層面上,都足以顛覆絕大部分行業(yè)及社會(huì)生活的面貌,因?yàn)槿祟?lèi)無(wú)法離開(kāi)語(yǔ)言進(jìn)行思考、表達(dá)與交流。許多人類(lèi)的職業(yè)會(huì)被替代,企業(yè)會(huì)高度自動(dòng)化。新一代兒童會(huì)更習(xí)慣與機(jī)器進(jìn)行交流,相比之下,人類(lèi)的交流笨拙而低效,充滿了誤解。機(jī)器能夠無(wú)窮盡地生產(chǎn)出供人類(lèi)娛樂(lè)的個(gè)性化內(nèi)容,不輸歷史上任何經(jīng)典的文學(xué)、影像或游戲。我們是否將迎來(lái)真正意義上的“文學(xué)已死”?
發(fā)展人工智能,也是在認(rèn)識(shí)人類(lèi)自己,最后你也會(huì)去思考智能的本質(zhì)是什么,意識(shí)的本質(zhì)是什么,存在的本質(zhì)是什么,它是否也是由語(yǔ)言、符號(hào)來(lái)定義的,它是否也是從一個(gè)混沌海量的數(shù)據(jù)里面,涌現(xiàn)出來(lái)的一種秩序感?而最后的最后,我們不得不質(zhì)疑意識(shí)與智能的本質(zhì),因?yàn)閺谋碚魃弦褵o(wú)法區(qū)分人與機(jī)器,那么,二者的界限在哪里?
如果從人類(lèi)中心論的角度,未來(lái)無(wú)疑不站在我們這一邊。但如果將機(jī)器也視為我們文明延續(xù)的產(chǎn)物,那么我希望,新的智能生命能夠建立起更可持續(xù)發(fā)展的文明形態(tài),并平等地尊重所有物種,包括非生命的環(huán)境本身。按照卡達(dá)肖夫指數(shù)(Kardashev Scale)對(duì)文明的分類(lèi),人類(lèi)連全面利用行星級(jí)能源的一級(jí)文明都沒(méi)有達(dá)到,我們沒(méi)有任何理由自大甚至自戀,而應(yīng)該以開(kāi)放心態(tài)接受人類(lèi)作為通往更高級(jí)文明形態(tài)(在詹姆斯·拉夫洛克看來(lái)是純硅基生命的“新星世”)過(guò)渡期的命運(yùn)。
彼得·沃茨的《盲視》以及最新一季《愛(ài)死機(jī)》里面的“蟲(chóng)群”,其實(shí)說(shuō)的就是這樣的無(wú)意識(shí)集群智能文明,自我意識(shí)對(duì)于它們來(lái)說(shuō)是一種低效無(wú)用的冗余功能,就像盲腸一樣。但我同樣認(rèn)為,在那樣一種文明形態(tài)中會(huì)有不同水平的意識(shí)涌現(xiàn),也許是宇宙級(jí)別的分布式意識(shí),它成為塑造時(shí)空與不同維度現(xiàn)實(shí)的基礎(chǔ),而我們現(xiàn)在人類(lèi)所謂的意識(shí)與文明,只不過(guò)是其中渺如煙塵的分型與投射。但仍然,人類(lèi)有自己的命運(yùn),有自己的旅程,就像古希臘神話《奧德賽》一樣,奧德修斯歷經(jīng)磨難,戰(zhàn)勝了巨人與怪物,最后衣錦回鄉(xiāng),但他已經(jīng)不再是原來(lái)的自己,他回到的也并不是原來(lái)的故鄉(xiāng)。他領(lǐng)悟到更大的使命與歸屬,那種崇高感或許是跨越了一切物種與文明界限的終極意義。
而文學(xué),毫無(wú)疑問(wèn)正是承載這種文明崇高感與人類(lèi)鄉(xiāng)愁的意識(shí)織體。它將伴隨著我們一直航向歷史的盡頭,無(wú)論掌舵者究竟是人類(lèi),還是機(jī)器。