AI時代的語言規(guī)范——答案在每一個執(zhí)筆者的手中
2025年,語言學(xué)家朱德熙一段寫于40多年前的文字,被選入了高考語文全國二卷的語言文字應(yīng)用部分的試題。這段文字出自他對報紙文章《微小的敵人:灰塵》的評改,文中有一句“對灰塵之類的小東西,常常是不以為然的”,朱德熙認(rèn)為,這是把“不以為然”誤認(rèn)為是“不在乎”了?!安灰詾槿弧钡摹叭弧笔恰皩Α钡囊馑迹@個詞應(yīng)該表示“不認(rèn)為是對的”,跟“不在乎”是兩碼事。接著他寫了這樣一段話,成為高考考題的核心:
“有人說,語言是不斷演變的。今天認(rèn)為是不合法的用法,等到用的人多了,慢慢就變成合法的了。所以我們最好不要去反對它。這種理論是似是而非的。因為采取這種態(tài)度,我們勢必對于語言里所有新出現(xiàn)的不合習(xí)慣的說法都一概承認(rèn)是合法的,那么我們的語言還有什么規(guī)范和標(biāo)準(zhǔn)可言呢?只有當(dāng)一種說法得到社會普遍承認(rèn)之后,我們才能承認(rèn)它的合法性。這就是語言學(xué)家的態(tài)度。從這一點看來,語言學(xué)家是非常‘勢利眼’的。”
考題公開后,討論隨之而來。有人認(rèn)為,這道題“不偏不怪”,是對語言文字規(guī)范意識的一次鮮明倡導(dǎo);也有人質(zhì)疑,語言本就是在使用中不斷變化的,“約定俗成”是語言的基本規(guī)律,憑什么由語言學(xué)家來當(dāng)“守門人”?類似的爭議本身并不新鮮。從“說服”讀shuō還是讀shuì,到“的、地、得”的用法不同,再到網(wǎng)絡(luò)熱詞、爛梗對語言的沖擊,近年來互聯(lián)網(wǎng)上圍繞漢語語言規(guī)范現(xiàn)象的討論層出不窮,時常引起民眾的廣泛關(guān)注和激烈爭論。但把朱德熙的話放在“人工智能未來已來”的語境里,就別有意味了。
40多年前,朱德熙寫下這段話時尚沒有互聯(lián)網(wǎng)和社交媒體,更沒有今天的大語言模型。那一代的中國語言學(xué)家肩負(fù)著一項任務(wù):實現(xiàn)漢語的規(guī)范化。朱德熙對“不以為然”的較真,呂叔湘對現(xiàn)代漢語八百詞的辨析,周有光對漢語拼音“三原則”和“三不是”的堅持等工作的背后,是對“建立規(guī)范”這一使命的自覺承擔(dān)。
今天,現(xiàn)代漢語的基礎(chǔ)性規(guī)范體系已然建立。然而,我們卻面臨著一個全新的局面:一個非人的語言生產(chǎn)者悄然登場。大語言模型正在以前所未有的規(guī)模和速度生產(chǎn)漢語文本,而它的“語感”,來自對海量文本數(shù)據(jù)的統(tǒng)計學(xué)習(xí)。人們對語言的誤用,會被老師糾正,被語言規(guī)范;但在模型的訓(xùn)練過程中,它可能只是一個概率分布的微小偏移——沒有預(yù)警,也沒有人為此負(fù)責(zé)。
這意味著,我們對待語言規(guī)范的態(tài)度需要經(jīng)歷一次辯證的調(diào)整。當(dāng)語言規(guī)范體系已相對完善,而AI作為一個缺乏約束的語言生產(chǎn)者出現(xiàn)時,我們面臨的矛盾已經(jīng)發(fā)生了變化:不再是“如何建立語言規(guī)范”,而是“如何在一個人機共存的語言生態(tài)中維護規(guī)范的效力”。語言當(dāng)然需要變化,也無時無刻不在發(fā)生著變化,變化本身就是活力的證明。但是,這種變化不應(yīng)被算法的統(tǒng)計分布所裹挾。因此,我們需要重新思考語言規(guī)范的意義。
而這,正是朱德熙的評語在AI時代獲得新意義的原因。他反對的不是語言變化本身,而是那種“因為有人用所以就應(yīng)該承認(rèn)”的放任態(tài)度。他要求在“有人用”和“承認(rèn)其合法性”之間有一個“社會普遍承認(rèn)”的環(huán)節(jié),有一個觀察、判斷的過程。這個過程在過去是由人來完成的:老師指導(dǎo)、編輯把關(guān)、讀者聽者反饋?;蛘哒f,這是一個需要語言使用者集體“跟風(fēng)”的過程。但AI不會臉紅,不會猶豫,不會在寫完一個句子之后覺得不安而刪掉重寫。它只是按照概率輸出,無形中影響、塑造著人們的語言習(xí)慣。
先讓我們來一起看看AI生成的文本到底有什么問題。
一位初中生說,用AI幫自己寫作文,雖然AI用了很多高級的、自己不會用的詞匯和表述,但是讀起來,好像讓人感受不到文章的氣息、溫度和韻律,在文章中找不到“我”。一個“找不到‘我’”道出了問題的核心。當(dāng)流通的文本大多是這樣被AI生產(chǎn)出來的,語言還能保持它的精確性和表現(xiàn)力嗎?
問題還不止于此。相關(guān)研究發(fā)現(xiàn),GPT-4o等模型的中文詞表污染高達46.6%。這些模型在處理中文污染詞時“不能理解甚至不能重復(fù)”,輸入一個污染詞有時會輸出另一個污染詞。這意味著,AI不僅可能用錯表達,還可能在你不知情的情況下,把錯誤擴散和固化。更麻煩的是,當(dāng)越來越多的人使用AI生成文本,那些原本只是在口語或社交平臺中的“誤用”,很可能被逐漸固化成正式的書面語。它們被寫進新聞稿、廣告文案、各類文章,獲得了某種“合法”的外衣。這樣一來,AI生成的錯誤文本就可能變成常態(tài),常態(tài)就可能變成新的規(guī)范。如此循環(huán)往復(fù),語言的堤壩便一寸一寸地被侵蝕。
現(xiàn)在再看朱德熙那個“勢利眼”的比喻,他要表達的是語言學(xué)家的審慎:某個“不合法的用法”,必須等到它被社會“普遍承認(rèn)”之后才能點頭。這是一個有機的、自發(fā)的過程,但它的前提是使用語言的人在認(rèn)真地使用語言,他們在乎自己說的是什么,會自覺或不自覺地遵守一種共識,也會對那些不對勁的語言表達保持敏感。
AI的介入則打破了這種機制。它不參與人類關(guān)于語言規(guī)范的討論,目前也應(yīng)該還沒有“犯錯”的意識。這就是AI時代語言規(guī)范面臨的新挑戰(zhàn)。當(dāng)大量文本由模型自行生成,這些文本又反過來成為新的訓(xùn)練數(shù)據(jù)時,語言的演變可能就不再是一個人類社群內(nèi)部有意識、有選擇的進程,而可能成為一種被AI介入的、缺乏束縛的“漂移”。我們會漂向哪里?不知道。但可以說,方向不再完全由我們決定。
面對現(xiàn)狀,人們大概會有三種態(tài)度。
第一種是放任?!罢Z言本來就是不斷演變的,何必大驚小怪?”這種論調(diào)聽起來豁達,實則不負(fù)責(zé)任。語言固然是活的,但“活”不等于“亂”。語言的活力來自使用者的創(chuàng)造,而不是來自對錯誤的寬容。當(dāng)誤用和訛傳被AI放大、固化,語言就失去了它應(yīng)有的精確性,而精確性,恰恰是語言作為人類交際與思維工具的關(guān)鍵特性。
第二種是拒斥。有人主張甚至要求在各種領(lǐng)域禁用AI寫作。這種想法可以理解,但不太現(xiàn)實。AI生成文本的成本低、效率高,確實在很多場景下提供了便利,完全禁止既不可能,也無必要。同時,我們也要充分相信,語言本身具備適應(yīng)和調(diào)節(jié)的機制,語言生態(tài)在廣大語言使用者的共同維護下不會被AI沖擊得“面目全非”。
第三種態(tài)度是什么?語言學(xué)家的“勢利眼”或許能給我們啟發(fā)。他不是一味反對語言的變化,而是強調(diào)要有一個“觀察期”,要等一種用法“被社會普遍承認(rèn)”之后才能接納它。這意味著我們今天要有意識地重建一種機制——在AI文本和人類語言之間,擺一道“審查”關(guān)。
這個“審查”是一種集體的語言自覺,至少包括以下幾個層面:
教育層面。語文教育應(yīng)當(dāng)重視語言的基本功,培養(yǎng)學(xué)生對語言的敏感,讓他們能分辨什么表達準(zhǔn)確、鮮明、生動,什么表達似是而非。一個接受了良好語言訓(xùn)練的人,才會在使用AI輔助寫作時,有足夠的判斷力去主導(dǎo)寫作,而不是被AI帶跑。
媒體層面。報紙雜志、出版社、內(nèi)容平臺應(yīng)該參與到語言“把關(guān)人”的行列中。朱德熙曾在《大家都有責(zé)任》一文中說,改進文風(fēng),語文工作者、作家、翻譯工作者、編輯工作者責(zé)任尤其大。這句話在今天依然有效,并且涉及的范圍更大了。當(dāng)AI生成的內(nèi)容越來越多地進入公共傳播領(lǐng)域,專業(yè)的編審就變得更加重要。一篇經(jīng)過認(rèn)真編輯的文章,不僅是在傳遞內(nèi)容中的真知灼見,也是在為語言規(guī)范樹立標(biāo)桿。
技術(shù)層面。大語言模型本身也可以進一步改進、規(guī)范。未來的模型是否可能引入更多的約束機制?比如,在訓(xùn)練數(shù)據(jù)中提高優(yōu)質(zhì)的、規(guī)范的文本的權(quán)重,降低低質(zhì)文本的影響。盡管相關(guān)的技術(shù)路徑仍在探索中,但我想,方向是明確的:讓AI學(xué)會“說好漢語”,而不只是“說漢語”。
漢語是一種有著深厚傳統(tǒng)與歷史的語言,幾千年來,它經(jīng)歷過無數(shù)變化。然而近代以來,漢語的每一次巨變都伴隨著某種焦慮。五四時期,有人擔(dān)心白話文會毀掉漢語的美感;20世紀(jì)90年代,有人擔(dān)心網(wǎng)絡(luò)語言會讓漢語變得粗鄙。這些焦慮中有的被證明是多余的,有的則確實指出了問題。
AI時代帶來的變化,或許比以往任何一次都更深刻。因為以往的變化,無論多么劇烈,始終是人在變、人在用、人在選。而這一次,AI參與進來,并且扮演著越來越重要的角色。AI可以做到“倚‘碼’千言”,但它還不夠“認(rèn)真”,認(rèn)真是我們的事。
回到2025年的高考語文試題。朱德熙在文章中還說了這樣一句意味深長的話:“一個人寫文章時用語不符合一般人的習(xí)慣,別人對作者和他的文章也會有看法。文章是寫了給人看的,我們不能不考慮它的社會效果?!蹦壳暗腁I可以海量生成文章,但還理解不了這背后的東西,那就是人對自己所說所寫的語言的責(zé)任。每位在考場上答題的年輕人,在不知不覺中參與了一場關(guān)于語言規(guī)范的討論:語言的變化有沒有邊界?誰有權(quán)決定這些邊界?答案不在試卷上,在每一個執(zhí)筆者的手中。
(作者系澳門大學(xué)人文學(xué)院博士研究生)


