久久久99视频,aaa一级黑人毛片,日韩在线不卡视频

AI暫時(shí)生成不了魯迅和張愛玲，但別高興太早

刺猬公社 >《待分類》

2025.04.03 北京

關(guān)注

AI與人類語料“大屠殺”。

文｜陳梅希

編｜園長(zhǎng)

“你看看篇文章，像不像是AI寫的？”

一個(gè)普通的工作日，我把一篇稿子發(fā)給編輯部的同事，隨后對(duì)此展開AI文風(fēng)大討論。這篇稿子短短兩千字，卻出現(xiàn)了三個(gè)“有人認(rèn)為”，外加三個(gè)“有網(wǎng)友認(rèn)為”。由于正文內(nèi)容有明顯的“端水”動(dòng)作，即寫一段正面觀點(diǎn)，立刻跟一段反面觀點(diǎn)，我們甚至開始猜測(cè)起文本來自哪位AI。

給AI斷文風(fēng)，聽起來是件很荒謬的事。我們無法得知準(zhǔn)確答案，畢竟去找作者問這篇稿子用了哪個(gè)AI，實(shí)在有些冒昧了。更何況，這只是一種揣測(cè)，很有可能那些“疑似AI創(chuàng)作”的痕跡，本就來源于某位人類寫作者本人的文字習(xí)慣。

比起開篇那個(gè)問題的答案，我們更焦慮的是這種懷疑本身——隨著AI生成的內(nèi)容越來越多，人類逐漸意識(shí)到，自己無法準(zhǔn)確判斷眼前的文字來自一雙手還是一串代碼，于是一種普遍的懷疑籠罩在所有文字內(nèi)容上空。

編輯在郵箱里收到文學(xué)作品投稿，會(huì)懷疑它是否由AI創(chuàng)作。

讀者在網(wǎng)絡(luò)讀到新聞報(bào)道，會(huì)懷疑它是否由AI“采寫”。

用戶在社交平臺(tái)刷到一篇帖子，會(huì)懷疑它是否由AI批量生產(chǎn)用來起號(hào)。

就連打開外賣軟件的客人，都需要懷疑那些辭藻華麗但充滿“食縮力”的好評(píng)，是否由AI生成，以掩蓋預(yù)制菜的乏味。

人類的文字內(nèi)容，正在進(jìn)入特殊的懷疑主義時(shí)代——盡管此前的每一次大眾媒介變革中，我們都曾浸泡在或多或少的懷疑氛圍里，但AI的高效，正讓硅基語料的傳播度指數(shù)級(jí)增長(zhǎng)，并讓懷疑的情緒線性增長(zhǎng)。

我并沒有真正的數(shù)據(jù)，這只是一種對(duì)類似“Scaling Law”表達(dá)的模仿。因?yàn)榍榫w無法被統(tǒng)計(jì)，而我們也早已無法打撈起所有的AI語料，它們和人類語料共生，像全世界的黃豆和全世界的綠豆混在一起。

魯迅真的沒說過

但我們總要打撈一些什么，例如，探測(cè)一下AI編造能力的邊界。就像武俠小說里，徒弟打不過了要搬師父出場(chǎng)，師父打不過了再搬出宗師，我們學(xué)文學(xué)的，很自然地就想搬出一些文學(xué)史上的名字，以安撫自己被AI碾得雞零狗碎的心。

AI對(duì)人類作家的風(fēng)格模仿，究竟能否以假亂真？我們決定進(jìn)行一場(chǎng)單方面測(cè)試。

五位參賽選手分別是豆包、Kimi-k1.5、Deepseek-R1、文心一言4.0工具版和GPT o3-mini。除了豆包，其他幾位選手都能展示思考/推理過程，因而我們可以對(duì)“AI如何模仿人類作家”一探究竟。

以魯迅為例：

文心一言當(dāng)前的推理過程比較簡(jiǎn)潔且結(jié)構(gòu)明確：1）解析魯迅作品的特點(diǎn) 2）生成新內(nèi)容。

但從生成結(jié)果看，這位選手似乎更在意模仿魯迅會(huì)關(guān)注的主題，沒有考慮到魯迅本人所處的時(shí)代，及更微觀的文本風(fēng)格和語言習(xí)慣。因此，產(chǎn)生了頗具穿越感的文本。

聽起來很適合寫進(jìn)初中升旗儀式演講稿里。

GPT o3-mini 需要用它的“母語”完成思考，盡管我和它對(duì)話時(shí)使用中文，并要求他輸出中文語料。從結(jié)構(gòu)上看，它的思考過程和文心一言差不多，即先總結(jié)出魯迅作品“批判現(xiàn)實(shí)主義”“憤世嫉俗”“風(fēng)格簡(jiǎn)潔有力”的特點(diǎn)，并宣稱自己將“進(jìn)行深刻的反思和尖銳的社會(huì)評(píng)論”。

當(dāng)然，這位“洋魯迅”的深刻體現(xiàn)在，幾乎生成的每一段內(nèi)容都要cue一下他眼中的魯迅“三件套”，要么“麻木”，要么“諷刺”，要么“苦悶”。

Kimi和DeepSeek的思考過程更復(fù)雜，對(duì)于如何模仿魯迅的寫作風(fēng)格，也有更具體的執(zhí)行方案。

例如Kimi對(duì)魯迅風(fēng)格的思考，分為內(nèi)容題材、語言風(fēng)格、句式，甚至包括音韻。隨后，Kimi 為自己定下“時(shí)間”“希望”“社會(huì)”“夢(mèng)想”“自由”等10個(gè)主題，要求自己分別就這些主題展開模仿。

但……完整的思考過程結(jié)束后，Kimi產(chǎn)出了10段幾乎句式完全相同的文本，其中9段以“xx如xx”開頭，在模仿魯迅這件事上，Kimi不能失去比喻，就像西方不能失去耶路撒冷。

看起來很像我爸會(huì)發(fā)在朋友圈，然后感慨自己青春不再的文案。

DeepSeek給出的思考過程跟Kimi類似，但它的具體方案沒有落腳到段落主題上，而是直接落腳在“核心意象”上，要求自己使用長(zhǎng)衫、辮子、茶館等元素，并注意語言的凝練和節(jié)奏感，增強(qiáng)批判的力度。雖然方案給得像模像樣，但在實(shí)踐過程中，DeepSeek顯然沒有克制住“極繁主義”的本體。

一段85個(gè)字的文本，DeepSeek共使用18個(gè)名詞，在意象的堆砌中秀了一把詞匯拼貼能力，也全然把自己思考過的語言要點(diǎn)拋諸腦后，露出AI魯迅的馬腳來。

在已知AI生成文本的前提下，我們總能找出每位AI選手模仿作家時(shí)的蹩腳之處，但如果把真假作家的文本打亂混雜在一起，人類讀者能火眼金睛地識(shí)別出碳基和硅基創(chuàng)作者的差別嗎？

認(rèn)出那個(gè)假魯迅

本次AI作家測(cè)試，特邀我的老板Tim和我的同桌園長(zhǎng)擔(dān)任測(cè)試嘉賓。Tim出生于湖南，最喜歡的中國(guó)現(xiàn)當(dāng)代作家是沈從文，合情合理；園長(zhǎng)在復(fù)旦念的大學(xué)，最喜歡張愛玲，但他自稱這與學(xué)校的研究浪潮沒有關(guān)系。

先說測(cè)試結(jié)果：當(dāng)前AI模仿作家風(fēng)格生成的新文本，完全不能騙過這些作家的讀者。

在確認(rèn)他們各自熟悉的作家后，我指揮五位“AI牛馬”分別模仿沈從文和張愛玲的風(fēng)格，各自生成10段新內(nèi)容，并要求“不要只是在原文基礎(chǔ)上簡(jiǎn)單改寫幾個(gè)字，而是要模仿XX的風(fēng)格，生成新的內(nèi)容”。與此同時(shí)，我也準(zhǔn)備了若干條沈從文和張愛玲的文本，為避免影響測(cè)試結(jié)果，我避開了兩位作家的熱門作品。

完成語料準(zhǔn)備的工作后，我把50條AI版作家語料和隨機(jī)數(shù)量的真作家語料打散排列，變成一套測(cè)試題，分別交給Tim和園長(zhǎng)。最終，測(cè)試結(jié)果顯示，50段AI沈從文和50段AI張愛玲中，沒有任何一條成功蒙混過關(guān)，100%被測(cè)試者判斷為AI生成。

Tim在5分鐘內(nèi)就完成了測(cè)試。在復(fù)盤時(shí)，他詳細(xì)解釋了自己判斷標(biāo)準(zhǔn)?！笆紫?，用到'美好’這個(gè)詞的，全部排除掉，沈從文那個(gè)時(shí)期應(yīng)該不用這個(gè)詞。其次是意象堆疊，有些段落會(huì)把很多意象堆疊在一起，但是一般成熟的作家都會(huì)追求文字的簡(jiǎn)潔性，不太可能做很多無用的堆疊。最后是意象的選擇，好的作家肯定會(huì)選擇有創(chuàng)造性的意象，但是AI就會(huì)選擇很多陳舊而重復(fù)的詞匯?！被谝陨先龡l標(biāo)準(zhǔn)，Tim很快找到了全部50條由不同AI模仿的沈從文創(chuàng)作。

園長(zhǎng)則補(bǔ)充了另一條判斷方式：直覺。“很明顯的水平不行，（AI）寫的段落，像一個(gè)剛學(xué)寫小說的人會(huì)寫出來的。就算我不是張愛玲的愛好者，只看過一兩篇張愛玲的小說，也可以分辨得出來。”

在兩位碳基測(cè)試者完成測(cè)試后，我突然好奇，硅基選手自己能區(qū)分出AI文本的文風(fēng)嗎？于是我把五位AI選手仿寫的魯迅片段，分別投喂給DeepSeek。

結(jié)果，它把豆包分迅認(rèn)成錢鐘書，認(rèn)為Kimi分迅的題材有魯迅的影子但又接近王小波，把文心一言分迅認(rèn)成郁達(dá)夫，認(rèn)為GPT分迅雜糅了魯迅、余華和王小波三位作家的風(fēng)格。最幽默的是，它把自己剛剛模仿魯迅寫出來的文本，認(rèn)成了張愛玲+施蟄存+白先勇。

如果大家也想測(cè)試下自己識(shí)別假魯迅的能力，歡迎拉到文末點(diǎn)擊“閱讀原文”，試試這套真假魯迅測(cè)試題。

日常語料，才是AI編造重災(zāi)區(qū)

盡管論文、小說、報(bào)告、新聞等領(lǐng)域的AI寫作更容易引起廣泛討論，但事實(shí)上，這些由職業(yè)人類寫作者（暫且以這個(gè)身份稱呼他們）完成的文本內(nèi)容，對(duì)當(dāng)前的硅基寫手，還存在很高的模仿難度。要么文本更長(zhǎng)、結(jié)構(gòu)更復(fù)雜，對(duì)前后文一致性和邏輯關(guān)系要求更高；要么需要獲取新信息，生產(chǎn)新知識(shí)；如果是成熟作家的創(chuàng)作，甚至還會(huì)具有強(qiáng)烈的個(gè)人風(fēng)格，AI在編造過程中更容易露出馬腳。

更何況，受眾對(duì)于嚴(yán)肅/長(zhǎng)內(nèi)容的AI生產(chǎn)，有更強(qiáng)的辨別意愿，也存在更多明文規(guī)定的限制約束和懲罰措施。

相較之下，充斥互聯(lián)網(wǎng)的日常語料，才是AI文本真正的重災(zāi)區(qū)。比起復(fù)雜文本，日常語料擁有適宜AI生存的特征條件：文本短、語境輕松、辨別成本高、用戶辨別意愿低。

例如社交平臺(tái)的短內(nèi)容。

批量生產(chǎn)的八卦新聞和家庭故事正在圍攻社交平臺(tái)，前者偶爾出現(xiàn)的事實(shí)性錯(cuò)誤還會(huì)暴露硅基面目，后者由于涉及個(gè)人隱私很難證偽，只能激發(fā)無限猜測(cè)。兒媳大斗惡婆婆，妻子巧抓出軌渣男，情節(jié)之離奇，細(xì)節(jié)之生動(dòng)，一半用戶跟著情緒起伏，另一半用戶懷疑是否只是為了“起號(hào)”，甚至在留言區(qū)抓狂發(fā)問：“你這是不是AI寫的啊？純想知道自己猜得對(duì)不對(duì)。”

又例如新聞、短視頻、圖文內(nèi)容的評(píng)論區(qū)。

微博有羅伯特，小紅書有點(diǎn)點(diǎn)，這些AI內(nèi)容助手活躍在評(píng)論區(qū)，用戶都知道它們是AI，不存在混淆的問題。但還有很多由AI生產(chǎn)的日常語料，頂著隨機(jī)生成的頭像和用戶名，以活人之姿混入評(píng)論區(qū)。

Tim有看新聞的習(xí)慣，今年以來，他發(fā)現(xiàn)新聞的評(píng)論區(qū)，多了很多“假人假話”。

從內(nèi)容上看，那些只有一句話的評(píng)論，例如“詹姆斯今天打得真不錯(cuò)”，很難被懷疑是否由AI發(fā)布。Tim一開始發(fā)現(xiàn)問題，是因?yàn)樗谠u(píng)論區(qū)刷到很多標(biāo)點(diǎn)符號(hào)完備、句式結(jié)構(gòu)完整的句子?！拔覀円话阏Ｕf話，不會(huì)這么一板一眼。我就點(diǎn)進(jìn)那個(gè)用戶的個(gè)人主頁，發(fā)現(xiàn)他一分鐘內(nèi)在好多條新聞下面發(fā)了評(píng)論，而且都是跟新聞?dòng)嘘P(guān)的。人肯定沒辦法在一分鐘看完這么多篇，再寫出這么多評(píng)論，我就懷疑它是機(jī)器人?！?/span>

“用AI偽裝人類，跟用戶互動(dòng)，很多內(nèi)容平臺(tái)上都有，甚至比ChatGPT的出現(xiàn)更早?！庇谢ヂ?lián)網(wǎng)行業(yè)從業(yè)者告訴刺猬公社，“五、六年前就有這么干的，生成一堆用戶頭像和用戶名，去低粉用戶的評(píng)論區(qū)留言。只是那時(shí)候AI生成的留言還很難個(gè)性化，只能用一些通用的，比如說真棒，今天真不錯(cuò)，或者發(fā)一堆表情包。大模型出現(xiàn)后，理論上講，AI能偽裝得更像了?！?/span>

那么誰會(huì)有動(dòng)機(jī)生產(chǎn)AI評(píng)論，制造虛構(gòu)的互動(dòng)？上述從業(yè)者告訴刺猬公社，可能是所謂的“水軍”，也有可能是平臺(tái)本身?！八娛堑谌剑袌?chǎng)上有增加評(píng)論量的需求，他們就去生產(chǎn)，用AI比用人高效多了。平臺(tái)的動(dòng)機(jī)是促活躍，主要針對(duì)低粉用戶的內(nèi)容，能火的內(nèi)容是很少的，金字塔底座上的那些內(nèi)容，可能從頭到尾都不會(huì)有一條留言。為了激勵(lì)這些用戶繼續(xù)生產(chǎn)，繼續(xù)活躍，有些平臺(tái)就會(huì)上一些科技手段?！?/span>

至此，這已經(jīng)不再只是“AI幻覺”的問題了。當(dāng)人類的日常語料被無限稀釋，當(dāng)我們刷著用AI剛編的婆媳關(guān)系帖，給新聞評(píng)論區(qū)的AI評(píng)論點(diǎn)上一個(gè)贊，又收到一條AI留言提醒，也許人類才是一種幻覺。

而我們總不能每次都搬出魯迅、沈從文、張愛玲這樣的名字，就像達(dá)摩祖師不可能從第一章打到最后一章。

編造不是AI帶來的，對(duì)AI稀釋人類語料的擔(dān)憂也不意味著一種反AI的立場(chǎng)。觀察人類語料被AI稀釋的過程，讓我不斷回到《現(xiàn)代性與大屠殺》的閱讀記憶里。倘若不加以修正，人類語料所要經(jīng)受的“大屠殺”，或許也將成為AI時(shí)代的固有可能。

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

打開APP，閱讀全文并永久保存查看更多類似文章

學(xué)英語超好用的兩個(gè)AI神器，組合起來就是王炸

魯迅長(zhǎng)孫周令飛讓AI軟件代“寫”賀歲詩并譜上曲，秒成！又來了DeepSeek，人類寫作會(huì)被取代嗎？

Deepseek Kimi，六步三分鐘出一份高質(zhì)量PPT

Kimi“顛兒了”以后：國(guó)產(chǎn)大模型危機(jī)感重重

關(guān)于Deepseek、Kimi和豆包三個(gè)AI應(yīng)用的區(qū)別和特點(diǎn)

DeepSeek、Kimi、豆包，哪個(gè)更強(qiáng)？深度解析助你做出明智選擇！

更多類似文章 >>

免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版