畢業(yè)論文寫完那天,王子依進行第一次AIGC率(人工智能生成內(nèi)容比例,以下簡稱AI率)檢測。結(jié)果給了她重重一擊:論文被系統(tǒng)判定70%為AI生成。
過去兩年,湖北大學(xué)、福州大學(xué)、中國人民大學(xué)、中國傳媒大學(xué)等多所高校將畢業(yè)論文的AI率納入畢業(yè)答辯流程,并設(shè)置比率紅線。
但許多學(xué)生發(fā)現(xiàn),AI率檢測結(jié)果并不穩(wěn)定:不同平臺差別大,有時甚至相互矛盾。寫得越規(guī)范、用詞越準確,AI率反而越高。有人引用公式、法條、經(jīng)典文章被判“AI生成”,有人連致謝也被標紅。
一邊是學(xué)生想盡辦法“降A(chǔ)I率”“向AI證明自己不是AI”才能參與答辯。模糊的判定標準下,還催生出一條隱秘的灰色產(chǎn)業(yè)鏈。
另一邊是教師在教學(xué)中如何感知和把握AI“介入”。查還是不查、用還是不用、在哪個階段使用算“作弊”?這些問題沒有統(tǒng)一答案。
這一學(xué)術(shù)監(jiān)管難題,正在困擾全球教育系統(tǒng)。AI率檢測似乎在幫助識別“人”與“機器”的邊界,但已有不少教師開始反思,當論文寫作正好落入AI最擅長的范圍時,當前的考核,是否已經(jīng)悖離了教育的初衷?
新京報記者 李聰
知網(wǎng)個人AIGC檢測服務(wù)頁面的常見問題解答中提到,AI特征值與論文質(zhì)量無關(guān),檢測結(jié)果僅供參考,可能存在誤差。 網(wǎng)站截圖
降A(chǔ)I率比寫論文還難?
直到答辯前一周,王子依仍深陷AI率的困擾。
她就讀于小學(xué)教育專業(yè),畢業(yè)論文研究主題是“小學(xué)游戲化教學(xué)”。早在實習(xí)期間,她便完成問卷發(fā)放和數(shù)據(jù)收集的工作,原以為只需打磨內(nèi)容、順利答辯即可畢業(yè)。
今年年初學(xué)校發(fā)布新規(guī),論文除查重外,還需接受知網(wǎng)“AI率”檢測,并由個人在答辯前提交檢測報告。檢測結(jié)果原則上不得超過40%,若超出可能被認定為學(xué)術(shù)不端,將可能給予重寫或延畢。
王子依坦言自己在數(shù)據(jù)分析部分使用過AI工具,進行樣本獨立性檢驗。但她發(fā)現(xiàn),AI檢測報告標出的多是一些格式規(guī)范,“其一”“其二”等分點闡述和名詞解釋被大面積標記,甚至連致謝中引用的一句歌詞也未能幸免。
王子依嘗試修改被標記的句子,但AI率始終在50%上下徘徊。她在社交媒體上發(fā)帖求助,很快涌來上百條評論。王子依注意到,最近一個月,常常會在凌晨兩三點收到新的評論和收藏。
有學(xué)生稱自己的論文在不同平臺的AI率相差懸殊,免費網(wǎng)站查詢60%,付費網(wǎng)站查詢只有10%;有學(xué)生引用的古詩詞被標注;有學(xué)生越改AI率越高;還有學(xué)生稱自己將論文里的句號全部改成逗號,AI率降低了20%。
評論區(qū)里還有很多降A(chǔ)I率攻略。使用翻譯軟件,將中文內(nèi)容轉(zhuǎn)譯為其他語種后再譯回,結(jié)果語句生硬、邏輯錯亂,連作者自己都讀不下去。有人說可以添加“啊”“呢”“哦”之類的語氣詞。
甚至“魔法對轟”——“用AI降A(chǔ)I率”。王子依采用了這種方法,論文中原本結(jié)構(gòu)清晰的教學(xué)設(shè)計,被轉(zhuǎn)化成了口語化的“老師說什么、學(xué)生怎么回應(yīng)”的對話體,她說,讀起來像是一本兒童繪本。
新京報記者在評論區(qū)看到,也有學(xué)生質(zhì)疑,“憑什么讓AI定義我是不是AI”。來自一所高校首飾設(shè)計專業(yè)的趙霖有同樣的疑惑,她的論文是作品說明的一部分,但學(xué)校規(guī)定AI率必須低于10%。她原本用AI幫忙潤色語句,系統(tǒng)判定90%的內(nèi)容是AI生成。
“我們是先做出作品,再寫出想法,AI只是順了順語言。”她說,結(jié)果系統(tǒng)只看“像不像AI寫的”,卻完全無視思考過程。在她眼中,“抄襲”和“使用AI潤色”是兩回事。前者意味著沒有貢獻,后者則是一種輔助。但在AI率檢測面前,這兩者往往被同等對待。
在一遍一遍的修改和檢測后,王子依覺得自己的論文“千瘡百孔”,而她自己也像個被檢測結(jié)果支配的AI。老師建議她先專注于內(nèi)容,不必過分糾結(jié)檢測。但她擔心影響答辯,只能不斷刪減被標紅的段落。
早在2024年6月,華東師范大學(xué)與北京師范大學(xué)聯(lián)合推出《生成式人工智能學(xué)生使用指南》,要求確保AI生成內(nèi)容不超過全文的20%;天津科技大學(xué)2024年的要求是AIGC檢測不得超過40%;福州大學(xué)要求學(xué)生答辯前、答辯后進行兩次AIGC檢測,檢測結(jié)果將作為成績評定和優(yōu)秀畢業(yè)論文評選的參考依據(jù)。今年以來,又有多所高校加入檢測隊伍。
許多學(xué)生開始緊盯每一次檢測后的“數(shù)字”。多位學(xué)生表示,他們真正擔憂的,是在一個模糊的系統(tǒng)面前,要想盡辦法通過檢測數(shù)字上的“達標”,才能獲得參加答辯的資格。
“像不像AI”誰說了算?
經(jīng)過大半個月的努力,王子依提交了知網(wǎng)檢測AI率為20%的檢測報告。但她卻始終搞不懂AI率到底是怎么計算出來的。
北京航空航天大學(xué)法學(xué)院教授、數(shù)字正義研究中心執(zhí)行主任裴煒分析,目前多數(shù)AI率檢測系統(tǒng)是基于“語言預(yù)測”:通過分析大量AI生成文本,歸納出AI的語言習(xí)慣,比如一個詞組后面通常會跟著哪些詞等。再將其與學(xué)生論文進行比對,如果發(fā)現(xiàn)與AI生成文本的特征高度相似,就可能判定某段文字為“AI生成”。
然而,人類本來也會使用規(guī)范、重復(fù)的表達,尤其在學(xué)術(shù)寫作、技術(shù)報告等規(guī)范性文本中。“AI生成”不是“AI原創(chuàng)”,而是AI基于人類創(chuàng)作的語料,模仿人類思考表達模式的產(chǎn)物。“換句話說,沒有AI,人也可能做出類似的語詞聯(lián)系和表達”。
裴煒提到,當前AI率的判斷技術(shù)本身存在不確定性。她試用過一些AI檢測工具,發(fā)現(xiàn)“容易誤傷”,直接使用和認定有可能錯判學(xué)生的真實勞動成果。
另外,不同檢測網(wǎng)站的原始數(shù)據(jù)庫不同,也會造成檢測結(jié)果的不同。一位人工智能方向的從業(yè)人員向新京報記者解釋,由于大模型的算法內(nèi)部機制和決策過程是黑箱式的,無法解釋為什么這段話被判斷為AI生成,只能給出一個結(jié)果,比如“AIGC率為73%”。
此前Open AI也在2023年1月發(fā)布一款A(yù)I文本檢測工具“AI C lassifier”,旨在確定文本是不是人工智能生成的,但由于準確率只有26%,于當年7月宣布停止。
而即便是人類的語言學(xué)專家,也很難分辨二者區(qū)別。
2023年,美國南佛羅里達大學(xué)的一項研究,邀請語言學(xué)專家區(qū)分AI生成的文字內(nèi)容和人類寫的內(nèi)容,72名專家的正確率為39%。
新京報記者注意到,多個檢測網(wǎng)站都標注了“免責說明”。“AI生成可能性及被標注的文本,僅表示具有AI生成文本的部分特征,并不確定為AI生成,結(jié)果僅供參考。”“由于AI模型的差異性,檢測結(jié)果可能存在誤差。”還有“AI特征值與論文質(zhì)量無關(guān),檢測結(jié)果僅供參考”。
盡管AIGC檢測的原理和準確性是模糊的,但學(xué)生們的焦慮很真實。
新京報記者在多個社交平臺上發(fā)現(xiàn)“代降A(chǔ)I率”的廣告,有的是利用AI網(wǎng)站降重,購買相應(yīng)的字數(shù),就能自動生成;也有提供人工降重服務(wù),聲稱“一對一修改、改到滿意”。價格從幾十元到幾百元不等,常按字數(shù)或目標AI率定價。
記者詢問了幾位“降A(chǔ)I率”服務(wù)博主,對方稱一篇一萬字、AI率45%的論文,花80元可以降到個位數(shù),方法是“純?nèi)斯ふ{(diào)整”。另一位按照修改的字數(shù)收費,千字10元。
另外記者看到,有檢測平臺一邊提供檢測AI率,一邊銷售“降A(chǔ)I率”服務(wù)。一家網(wǎng)站智能降A(chǔ)IGC的價格為每千字3-5元,自動改寫AIGC疑似度高的片段;人工降重則需要添加客服微信,根據(jù)論文題目、檢測結(jié)果、字數(shù)以及降到多少進行報價。
“我不再是寫作者,而是信息傳送帶”
在教學(xué)實踐的另一端,無需檢測,不少老師也能從論文中察覺出“AI味兒”。
表述奇怪、“不合年級水平”的表現(xiàn)、虛構(gòu)的參考文獻等——這些線索逐漸構(gòu)成他們判斷學(xué)生是否使用AI的依據(jù)。
陜西一所高校的會計專業(yè)教師彭玉發(fā)現(xiàn),今年有人交上來的初稿結(jié)構(gòu)還算完整、字數(shù)達標,但語言干巴,財務(wù)數(shù)據(jù)分析簡單又籠統(tǒng)。“有點兒像在很大的數(shù)據(jù)庫里搜點兒東西拼湊出來。”
她本擔心誤判,結(jié)果學(xué)生回復(fù)“好的”,答應(yīng)重寫。她意識到學(xué)生也心虛了。她還記得一個學(xué)生的致謝里,每個句子都是句號,對方也坦承“整頁都是AI寫的”。
類似的直覺也出現(xiàn)在小語種教學(xué)中。一位北京高校的小語種老師嚴遠提到,自己所在的學(xué)校尚未啟動AI率檢測機制,但今年答辯時,他明顯感受到,部分學(xué)生論文中展現(xiàn)出“與其學(xué)習(xí)階段不匹配”的知識儲備和表達水準。
他提到,AI對翻譯類作業(yè)的影響尤其顯著。學(xué)生提交的外譯中文本中,充滿排比、隱喻和修辭性的陌生表達。而中譯外的文本,又過于流暢和自然。
西南財經(jīng)大學(xué)社會發(fā)展研究院副教授陳晶環(huán)的“警覺期”更早。2022年底Chat GPT問世幾個月后,她就注意到學(xué)生作業(yè)在質(zhì)量上的明顯躍升。
她最初還欣喜,后來卻發(fā)現(xiàn)許多作業(yè)盡管使用了大量專業(yè)術(shù)語和書面表達,但句與句之間缺乏邏輯遞進、語言空洞,甚至彼此相似。她感嘆,如今看到不太流暢的句子,反而高興,覺得是學(xué)生自己寫的。她坦言,“老師也很矛盾。”
對于AI率檢測,老師們態(tài)度不一。
彭玉所在學(xué)校今年首次設(shè)立AIGC率檢測機制,規(guī)定學(xué)生論文中AI生成內(nèi)容不得超過35%,檢測費用每人最多可報銷200元。她認為這項制度“至少能震懾一批人”。
裴煒則認為,即便是目前廣泛使用的“重復(fù)率”,也在學(xué)位論文評價中存在缺陷。在法學(xué)專業(yè)中,很多術(shù)語和法律表達是固定的,如果為了“降重”而扭曲表達,反而有損論述的準確性和嚴謹性。相較于重復(fù)率,AI率的情況更為復(fù)雜,在現(xiàn)有技術(shù)和評價標準尚不成熟的情況下,直接予以適用可能制造更大的不公與誤傷。
同時她認為人機協(xié)作的界限非常模糊,如何衡量一個學(xué)生在寫作中投入了多少“自己的智力”?從簡單輸入一個標題就生成一整篇論文,到給出完整的研究問題、思路框架,再讓AI完成擴展,或是讓AI協(xié)助潤色和修改文本,這之間很難用一個“率”去界定。
嚴遠提到要警惕新的技術(shù)官僚主義。學(xué)生們用AI寫論文、用AI查AI率,再用AI降A(chǔ)I率,變成了考查大家誰更會使用AI,變成教育者和被教育者之間的斗智斗勇。
陳晶環(huán)看到有被AI率誤傷的大學(xué)生,“防守和進攻都靠AI,誰也沒能真正走出AI的圈子。”她建議是否可以建立一個溝通解釋機制。讓學(xué)生可以提供一些初稿、改動痕跡等內(nèi)容,而不是強硬地根據(jù)檢測數(shù)字決定是否能參與答辯。
而在學(xué)業(yè)之外,AI對學(xué)生思維習(xí)慣的重塑更讓部分教師警惕。
陳晶環(huán)將其稱為“習(xí)得性求助”。“這是一種有問題第一反應(yīng)就不再是自己思考,而是立刻去找AI。”這種習(xí)得性求助意味著學(xué)生主動思考的過程被跳過了:“我不再是寫作者,而是信息傳送帶。”
她感受到,工具的過度使用不僅帶來了思維能力的弱化,更削弱了學(xué)生的閱讀力、耐心和表達欲望。“有學(xué)生甚至連AI給出的內(nèi)容都不愿讀完,只覺得前兩句差不多,就直接復(fù)制進論文。”
而大學(xué)階段最核心的成長,就在于是否形成了自主思考的習(xí)慣和能力。在她看來,這種被工具牽引和主導(dǎo)、逐漸失去主動權(quán)的過程,就是“異化”。
AI無法替代人類對現(xiàn)實的感知與回應(yīng)
夜里十一點,彭玉的微信又響起,是學(xué)生發(fā)來修改完的論文。
這樣的情況她早已習(xí)慣。大四不少學(xué)生已在實習(xí)單位報到,重心不在學(xué)術(shù)上,而是如何盡快完成學(xué)業(yè)、順利畢業(yè)。論文修改是他們在下班后,或者擠出周末的時間趕工出來的。在就業(yè)壓力與工具便利的雙重作用下,論文變成一項需要完成的“任務(wù)”。
本科畢業(yè)論文最初的設(shè)想,是訓(xùn)練學(xué)生的科研能力與培養(yǎng)探索精神,也就是“能不能提出一個研究問題,并進行系統(tǒng)性的分析”。
但陳晶環(huán)指出,在實踐中,這個目標不斷被“降維處理”。“我們已經(jīng)不苛求本科生做出理論創(chuàng)新了,重點要求學(xué)生要有最基本的學(xué)術(shù)規(guī)范,只要他能用學(xué)術(shù)語言、說得通、講得順,就算合格。”
而表述結(jié)構(gòu)清晰、語言規(guī)范、格式統(tǒng)一,這恰恰是AI最擅長模仿的領(lǐng)域。
嚴遠直言,在如今的技術(shù)面前,傳統(tǒng)的作業(yè)或者考核已經(jīng)失去意義,像一場師生間的互相欺騙,“裝作AI不存在。”
換句話說,目前高校的教育考核方式,已經(jīng)難以適應(yīng)人工智能等新工具的廣泛使用。更有老師直言,這相當于用農(nóng)業(yè)社會的考法,應(yīng)對智能社會的工具。
裴煒認為不可能在AI技術(shù)高速發(fā)展的同時,又禁止學(xué)生使用。相反地,在未來社會,學(xué)生的數(shù)字能力、智能能力將是其核心競爭力。因此問題的關(guān)鍵不在于學(xué)生使用AI去應(yīng)對考評,而在于AI時代教育理念、教育方式和人才評價機制需要與時俱進。
陳晶環(huán)認為,技術(shù)的變化正要求教育做出結(jié)構(gòu)性調(diào)整——改變考核方式、更新評價指標、重塑教學(xué)目標。“這是教育的責任,而不是學(xué)生的負擔。”
比起限制或一味禁止AI使用,多位教師提到,重點是在教育中正視工具的存在,并引導(dǎo)學(xué)生在使用中保持思維的主動權(quán)。嚴遠注意到,一些學(xué)生通過AI輔助,能夠更便捷地查閱多語種資料、了解語法細節(jié),尤其是在教師未能覆蓋到的地方,AI反而起到了“補課”作用。
面對這種趨勢,老師們正主動調(diào)整,布置無法被AI完成的作業(yè),或者讓AI只能起到輔助作用。
陳晶環(huán)將課程論文寫作改成口頭匯報對某本社會學(xué)著作的理解,并且不使用PPT脫稿講解,這樣學(xué)生就必須在理解的基礎(chǔ)上,用自己的語言表達。她還讓學(xué)生書寫個人生活史。這種非結(jié)構(gòu)化、貼近生活的寫作,迫使學(xué)生自己動手,無法靠AI代勞。在研究生課程上,她則鼓勵學(xué)生有意識地探索AI的可能性。
嚴遠嘗試讓學(xué)生翻譯文本并配音。學(xué)生可以用AI翻譯,但必須親自配音。在小語種學(xué)習(xí)中,口頭轉(zhuǎn)述比筆頭兒更能檢驗學(xué)習(xí)質(zhì)量。
此外,嚴遠在講授生態(tài)環(huán)保等復(fù)雜議題時,課堂時間限制沒辦法拓展。他鼓勵學(xué)生用AI梳理背景知識,再在課堂上討論AI給出的觀點。這種方式不僅拓寬了學(xué)生的視野,還激發(fā)了多元思考。“不同學(xué)生使用AI,有時會提出意料之外的觀點,這反而讓討論更深入和多元。”
在裴煒看來,技術(shù)帶來的變化是每一代人都要面對的。從更長遠的尺度看,當AI更加深入地介入學(xué)術(shù)研究,學(xué)術(shù)誠信的邊界如何劃分,在文章中如何提及AI的貢獻,AI能否列為論文作者,乃至如何定義學(xué)術(shù)誠信、合作、學(xué)術(shù)剽竊,可能都需要教育界和學(xué)術(shù)界一起慢慢探索。
采訪中,陳晶環(huán)提到去大涼山做田野調(diào)查的故事。她長期關(guān)注彝族地區(qū)的農(nóng)村基層治理,涉及當?shù)靥赜械奈幕瘋鹘y(tǒng)。這些信息只有通過實地田野調(diào)查才能積累起來,如果把時間線拉長到十年的追蹤,觀察政策如何影響一個具體村莊的變遷,這種深度和系統(tǒng)性AI無法做到。
“AI等待被人類喂養(yǎng)。”她認為,AI再強大,也無法替代人類對現(xiàn)實的感知與回應(yīng),這恰恰是最不該放棄的能力。
(應(yīng)受訪者要求,文中嚴遠、王子依、趙霖、彭玉為化名)
新京報記者在一個免費進行AI率檢測的網(wǎng)站上看到有付費進行降A(chǔ)I率的服務(wù)。 網(wǎng)站截圖
王子依收藏的降A(chǔ)I率“攻略”。 受訪者供圖
畢業(yè)論文寫完那天,王子依進行第一次AIGC率(人工智能生成內(nèi)容比例,以下簡稱AI率)檢測。結(jié)果給了她重重一擊:論文被系統(tǒng)判定70%為AI生成。
過去兩年,湖北大學(xué)、福州大學(xué)、中國人民大學(xué)、中國傳媒大學(xué)等多所高校將畢業(yè)論文的AI率納入畢業(yè)答辯流程,并設(shè)置比率紅線。
但許多學(xué)生發(fā)現(xiàn),AI率檢測結(jié)果并不穩(wěn)定:不同平臺差別大,有時甚至相互矛盾。寫得越規(guī)范、用詞越準確,AI率反而越高。有人引用公式、法條、經(jīng)典文章被判“AI生成”,有人連致謝也被標紅。
一邊是學(xué)生想盡辦法“降A(chǔ)I率”“向AI證明自己不是AI”才能參與答辯。模糊的判定標準下,還催生出一條隱秘的灰色產(chǎn)業(yè)鏈。
另一邊是教師在教學(xué)中如何感知和把握AI“介入”。查還是不查、用還是不用、在哪個階段使用算“作弊”?這些問題沒有統(tǒng)一答案。
這一學(xué)術(shù)監(jiān)管難題,正在困擾全球教育系統(tǒng)。AI率檢測似乎在幫助識別“人”與“機器”的邊界,但已有不少教師開始反思,當論文寫作正好落入AI最擅長的范圍時,當前的考核,是否已經(jīng)悖離了教育的初衷?
新京報記者 李聰
知網(wǎng)個人AIGC檢測服務(wù)頁面的常見問題解答中提到,AI特征值與論文質(zhì)量無關(guān),檢測結(jié)果僅供參考,可能存在誤差。 網(wǎng)站截圖
降A(chǔ)I率比寫論文還難?
直到答辯前一周,王子依仍深陷AI率的困擾。
她就讀于小學(xué)教育專業(yè),畢業(yè)論文研究主題是“小學(xué)游戲化教學(xué)”。早在實習(xí)期間,她便完成問卷發(fā)放和數(shù)據(jù)收集的工作,原以為只需打磨內(nèi)容、順利答辯即可畢業(yè)。
今年年初學(xué)校發(fā)布新規(guī),論文除查重外,還需接受知網(wǎng)“AI率”檢測,并由個人在答辯前提交檢測報告。檢測結(jié)果原則上不得超過40%,若超出可能被認定為學(xué)術(shù)不端,將可能給予重寫或延畢。
王子依坦言自己在數(shù)據(jù)分析部分使用過AI工具,進行樣本獨立性檢驗。但她發(fā)現(xiàn),AI檢測報告標出的多是一些格式規(guī)范,“其一”“其二”等分點闡述和名詞解釋被大面積標記,甚至連致謝中引用的一句歌詞也未能幸免。
王子依嘗試修改被標記的句子,但AI率始終在50%上下徘徊。她在社交媒體上發(fā)帖求助,很快涌來上百條評論。王子依注意到,最近一個月,常常會在凌晨兩三點收到新的評論和收藏。
有學(xué)生稱自己的論文在不同平臺的AI率相差懸殊,免費網(wǎng)站查詢60%,付費網(wǎng)站查詢只有10%;有學(xué)生引用的古詩詞被標注;有學(xué)生越改AI率越高;還有學(xué)生稱自己將論文里的句號全部改成逗號,AI率降低了20%。
評論區(qū)里還有很多降A(chǔ)I率攻略。使用翻譯軟件,將中文內(nèi)容轉(zhuǎn)譯為其他語種后再譯回,結(jié)果語句生硬、邏輯錯亂,連作者自己都讀不下去。有人說可以添加“啊”“呢”“哦”之類的語氣詞。
甚至“魔法對轟”——“用AI降A(chǔ)I率”。王子依采用了這種方法,論文中原本結(jié)構(gòu)清晰的教學(xué)設(shè)計,被轉(zhuǎn)化成了口語化的“老師說什么、學(xué)生怎么回應(yīng)”的對話體,她說,讀起來像是一本兒童繪本。
新京報記者在評論區(qū)看到,也有學(xué)生質(zhì)疑,“憑什么讓AI定義我是不是AI”。來自一所高校首飾設(shè)計專業(yè)的趙霖有同樣的疑惑,她的論文是作品說明的一部分,但學(xué)校規(guī)定AI率必須低于10%。她原本用AI幫忙潤色語句,系統(tǒng)判定90%的內(nèi)容是AI生成。
“我們是先做出作品,再寫出想法,AI只是順了順語言。”她說,結(jié)果系統(tǒng)只看“像不像AI寫的”,卻完全無視思考過程。在她眼中,“抄襲”和“使用AI潤色”是兩回事。前者意味著沒有貢獻,后者則是一種輔助。但在AI率檢測面前,這兩者往往被同等對待。
在一遍一遍的修改和檢測后,王子依覺得自己的論文“千瘡百孔”,而她自己也像個被檢測結(jié)果支配的AI。老師建議她先專注于內(nèi)容,不必過分糾結(jié)檢測。但她擔心影響答辯,只能不斷刪減被標紅的段落。
早在2024年6月,華東師范大學(xué)與北京師范大學(xué)聯(lián)合推出《生成式人工智能學(xué)生使用指南》,要求確保AI生成內(nèi)容不超過全文的20%;天津科技大學(xué)2024年的要求是AIGC檢測不得超過40%;福州大學(xué)要求學(xué)生答辯前、答辯后進行兩次AIGC檢測,檢測結(jié)果將作為成績評定和優(yōu)秀畢業(yè)論文評選的參考依據(jù)。今年以來,又有多所高校加入檢測隊伍。
許多學(xué)生開始緊盯每一次檢測后的“數(shù)字”。多位學(xué)生表示,他們真正擔憂的,是在一個模糊的系統(tǒng)面前,要想盡辦法通過檢測數(shù)字上的“達標”,才能獲得參加答辯的資格。
“像不像AI”誰說了算?
經(jīng)過大半個月的努力,王子依提交了知網(wǎng)檢測AI率為20%的檢測報告。但她卻始終搞不懂AI率到底是怎么計算出來的。
北京航空航天大學(xué)法學(xué)院教授、數(shù)字正義研究中心執(zhí)行主任裴煒分析,目前多數(shù)AI率檢測系統(tǒng)是基于“語言預(yù)測”:通過分析大量AI生成文本,歸納出AI的語言習(xí)慣,比如一個詞組后面通常會跟著哪些詞等。再將其與學(xué)生論文進行比對,如果發(fā)現(xiàn)與AI生成文本的特征高度相似,就可能判定某段文字為“AI生成”。
然而,人類本來也會使用規(guī)范、重復(fù)的表達,尤其在學(xué)術(shù)寫作、技術(shù)報告等規(guī)范性文本中。“AI生成”不是“AI原創(chuàng)”,而是AI基于人類創(chuàng)作的語料,模仿人類思考表達模式的產(chǎn)物。“換句話說,沒有AI,人也可能做出類似的語詞聯(lián)系和表達”。
裴煒提到,當前AI率的判斷技術(shù)本身存在不確定性。她試用過一些AI檢測工具,發(fā)現(xiàn)“容易誤傷”,直接使用和認定有可能錯判學(xué)生的真實勞動成果。
另外,不同檢測網(wǎng)站的原始數(shù)據(jù)庫不同,也會造成檢測結(jié)果的不同。一位人工智能方向的從業(yè)人員向新京報記者解釋,由于大模型的算法內(nèi)部機制和決策過程是黑箱式的,無法解釋為什么這段話被判斷為AI生成,只能給出一個結(jié)果,比如“AIGC率為73%”。
此前Open AI也在2023年1月發(fā)布一款A(yù)I文本檢測工具“AI C lassifier”,旨在確定文本是不是人工智能生成的,但由于準確率只有26%,于當年7月宣布停止。
而即便是人類的語言學(xué)專家,也很難分辨二者區(qū)別。
2023年,美國南佛羅里達大學(xué)的一項研究,邀請語言學(xué)專家區(qū)分AI生成的文字內(nèi)容和人類寫的內(nèi)容,72名專家的正確率為39%。
新京報記者注意到,多個檢測網(wǎng)站都標注了“免責說明”。“AI生成可能性及被標注的文本,僅表示具有AI生成文本的部分特征,并不確定為AI生成,結(jié)果僅供參考。”“由于AI模型的差異性,檢測結(jié)果可能存在誤差。”還有“AI特征值與論文質(zhì)量無關(guān),檢測結(jié)果僅供參考”。
盡管AIGC檢測的原理和準確性是模糊的,但學(xué)生們的焦慮很真實。
新京報記者在多個社交平臺上發(fā)現(xiàn)“代降A(chǔ)I率”的廣告,有的是利用AI網(wǎng)站降重,購買相應(yīng)的字數(shù),就能自動生成;也有提供人工降重服務(wù),聲稱“一對一修改、改到滿意”。價格從幾十元到幾百元不等,常按字數(shù)或目標AI率定價。
記者詢問了幾位“降A(chǔ)I率”服務(wù)博主,對方稱一篇一萬字、AI率45%的論文,花80元可以降到個位數(shù),方法是“純?nèi)斯ふ{(diào)整”。另一位按照修改的字數(shù)收費,千字10元。
另外記者看到,有檢測平臺一邊提供檢測AI率,一邊銷售“降A(chǔ)I率”服務(wù)。一家網(wǎng)站智能降A(chǔ)IGC的價格為每千字3-5元,自動改寫AIGC疑似度高的片段;人工降重則需要添加客服微信,根據(jù)論文題目、檢測結(jié)果、字數(shù)以及降到多少進行報價。
“我不再是寫作者,而是信息傳送帶”
在教學(xué)實踐的另一端,無需檢測,不少老師也能從論文中察覺出“AI味兒”。
表述奇怪、“不合年級水平”的表現(xiàn)、虛構(gòu)的參考文獻等——這些線索逐漸構(gòu)成他們判斷學(xué)生是否使用AI的依據(jù)。
陜西一所高校的會計專業(yè)教師彭玉發(fā)現(xiàn),今年有人交上來的初稿結(jié)構(gòu)還算完整、字數(shù)達標,但語言干巴,財務(wù)數(shù)據(jù)分析簡單又籠統(tǒng)。“有點兒像在很大的數(shù)據(jù)庫里搜點兒東西拼湊出來。”
她本擔心誤判,結(jié)果學(xué)生回復(fù)“好的”,答應(yīng)重寫。她意識到學(xué)生也心虛了。她還記得一個學(xué)生的致謝里,每個句子都是句號,對方也坦承“整頁都是AI寫的”。
類似的直覺也出現(xiàn)在小語種教學(xué)中。一位北京高校的小語種老師嚴遠提到,自己所在的學(xué)校尚未啟動AI率檢測機制,但今年答辯時,他明顯感受到,部分學(xué)生論文中展現(xiàn)出“與其學(xué)習(xí)階段不匹配”的知識儲備和表達水準。
他提到,AI對翻譯類作業(yè)的影響尤其顯著。學(xué)生提交的外譯中文本中,充滿排比、隱喻和修辭性的陌生表達。而中譯外的文本,又過于流暢和自然。
西南財經(jīng)大學(xué)社會發(fā)展研究院副教授陳晶環(huán)的“警覺期”更早。2022年底Chat GPT問世幾個月后,她就注意到學(xué)生作業(yè)在質(zhì)量上的明顯躍升。
她最初還欣喜,后來卻發(fā)現(xiàn)許多作業(yè)盡管使用了大量專業(yè)術(shù)語和書面表達,但句與句之間缺乏邏輯遞進、語言空洞,甚至彼此相似。她感嘆,如今看到不太流暢的句子,反而高興,覺得是學(xué)生自己寫的。她坦言,“老師也很矛盾。”
對于AI率檢測,老師們態(tài)度不一。
彭玉所在學(xué)校今年首次設(shè)立AIGC率檢測機制,規(guī)定學(xué)生論文中AI生成內(nèi)容不得超過35%,檢測費用每人最多可報銷200元。她認為這項制度“至少能震懾一批人”。
裴煒則認為,即便是目前廣泛使用的“重復(fù)率”,也在學(xué)位論文評價中存在缺陷。在法學(xué)專業(yè)中,很多術(shù)語和法律表達是固定的,如果為了“降重”而扭曲表達,反而有損論述的準確性和嚴謹性。相較于重復(fù)率,AI率的情況更為復(fù)雜,在現(xiàn)有技術(shù)和評價標準尚不成熟的情況下,直接予以適用可能制造更大的不公與誤傷。
同時她認為人機協(xié)作的界限非常模糊,如何衡量一個學(xué)生在寫作中投入了多少“自己的智力”?從簡單輸入一個標題就生成一整篇論文,到給出完整的研究問題、思路框架,再讓AI完成擴展,或是讓AI協(xié)助潤色和修改文本,這之間很難用一個“率”去界定。
嚴遠提到要警惕新的技術(shù)官僚主義。學(xué)生們用AI寫論文、用AI查AI率,再用AI降A(chǔ)I率,變成了考查大家誰更會使用AI,變成教育者和被教育者之間的斗智斗勇。
陳晶環(huán)看到有被AI率誤傷的大學(xué)生,“防守和進攻都靠AI,誰也沒能真正走出AI的圈子。”她建議是否可以建立一個溝通解釋機制。讓學(xué)生可以提供一些初稿、改動痕跡等內(nèi)容,而不是強硬地根據(jù)檢測數(shù)字決定是否能參與答辯。
而在學(xué)業(yè)之外,AI對學(xué)生思維習(xí)慣的重塑更讓部分教師警惕。
陳晶環(huán)將其稱為“習(xí)得性求助”。“這是一種有問題第一反應(yīng)就不再是自己思考,而是立刻去找AI。”這種習(xí)得性求助意味著學(xué)生主動思考的過程被跳過了:“我不再是寫作者,而是信息傳送帶。”
她感受到,工具的過度使用不僅帶來了思維能力的弱化,更削弱了學(xué)生的閱讀力、耐心和表達欲望。“有學(xué)生甚至連AI給出的內(nèi)容都不愿讀完,只覺得前兩句差不多,就直接復(fù)制進論文。”
而大學(xué)階段最核心的成長,就在于是否形成了自主思考的習(xí)慣和能力。在她看來,這種被工具牽引和主導(dǎo)、逐漸失去主動權(quán)的過程,就是“異化”。
AI無法替代人類對現(xiàn)實的感知與回應(yīng)
夜里十一點,彭玉的微信又響起,是學(xué)生發(fā)來修改完的論文。
這樣的情況她早已習(xí)慣。大四不少學(xué)生已在實習(xí)單位報到,重心不在學(xué)術(shù)上,而是如何盡快完成學(xué)業(yè)、順利畢業(yè)。論文修改是他們在下班后,或者擠出周末的時間趕工出來的。在就業(yè)壓力與工具便利的雙重作用下,論文變成一項需要完成的“任務(wù)”。
本科畢業(yè)論文最初的設(shè)想,是訓(xùn)練學(xué)生的科研能力與培養(yǎng)探索精神,也就是“能不能提出一個研究問題,并進行系統(tǒng)性的分析”。
但陳晶環(huán)指出,在實踐中,這個目標不斷被“降維處理”。“我們已經(jīng)不苛求本科生做出理論創(chuàng)新了,重點要求學(xué)生要有最基本的學(xué)術(shù)規(guī)范,只要他能用學(xué)術(shù)語言、說得通、講得順,就算合格。”
而表述結(jié)構(gòu)清晰、語言規(guī)范、格式統(tǒng)一,這恰恰是AI最擅長模仿的領(lǐng)域。
嚴遠直言,在如今的技術(shù)面前,傳統(tǒng)的作業(yè)或者考核已經(jīng)失去意義,像一場師生間的互相欺騙,“裝作AI不存在。”
換句話說,目前高校的教育考核方式,已經(jīng)難以適應(yīng)人工智能等新工具的廣泛使用。更有老師直言,這相當于用農(nóng)業(yè)社會的考法,應(yīng)對智能社會的工具。
裴煒認為不可能在AI技術(shù)高速發(fā)展的同時,又禁止學(xué)生使用。相反地,在未來社會,學(xué)生的數(shù)字能力、智能能力將是其核心競爭力。因此問題的關(guān)鍵不在于學(xué)生使用AI去應(yīng)對考評,而在于AI時代教育理念、教育方式和人才評價機制需要與時俱進。
陳晶環(huán)認為,技術(shù)的變化正要求教育做出結(jié)構(gòu)性調(diào)整——改變考核方式、更新評價指標、重塑教學(xué)目標。“這是教育的責任,而不是學(xué)生的負擔。”
比起限制或一味禁止AI使用,多位教師提到,重點是在教育中正視工具的存在,并引導(dǎo)學(xué)生在使用中保持思維的主動權(quán)。嚴遠注意到,一些學(xué)生通過AI輔助,能夠更便捷地查閱多語種資料、了解語法細節(jié),尤其是在教師未能覆蓋到的地方,AI反而起到了“補課”作用。
面對這種趨勢,老師們正主動調(diào)整,布置無法被AI完成的作業(yè),或者讓AI只能起到輔助作用。
陳晶環(huán)將課程論文寫作改成口頭匯報對某本社會學(xué)著作的理解,并且不使用PPT脫稿講解,這樣學(xué)生就必須在理解的基礎(chǔ)上,用自己的語言表達。她還讓學(xué)生書寫個人生活史。這種非結(jié)構(gòu)化、貼近生活的寫作,迫使學(xué)生自己動手,無法靠AI代勞。在研究生課程上,她則鼓勵學(xué)生有意識地探索AI的可能性。
嚴遠嘗試讓學(xué)生翻譯文本并配音。學(xué)生可以用AI翻譯,但必須親自配音。在小語種學(xué)習(xí)中,口頭轉(zhuǎn)述比筆頭兒更能檢驗學(xué)習(xí)質(zhì)量。
此外,嚴遠在講授生態(tài)環(huán)保等復(fù)雜議題時,課堂時間限制沒辦法拓展。他鼓勵學(xué)生用AI梳理背景知識,再在課堂上討論AI給出的觀點。這種方式不僅拓寬了學(xué)生的視野,還激發(fā)了多元思考。“不同學(xué)生使用AI,有時會提出意料之外的觀點,這反而讓討論更深入和多元。”
在裴煒看來,技術(shù)帶來的變化是每一代人都要面對的。從更長遠的尺度看,當AI更加深入地介入學(xué)術(shù)研究,學(xué)術(shù)誠信的邊界如何劃分,在文章中如何提及AI的貢獻,AI能否列為論文作者,乃至如何定義學(xué)術(shù)誠信、合作、學(xué)術(shù)剽竊,可能都需要教育界和學(xué)術(shù)界一起慢慢探索。
采訪中,陳晶環(huán)提到去大涼山做田野調(diào)查的故事。她長期關(guān)注彝族地區(qū)的農(nóng)村基層治理,涉及當?shù)靥赜械奈幕瘋鹘y(tǒng)。這些信息只有通過實地田野調(diào)查才能積累起來,如果把時間線拉長到十年的追蹤,觀察政策如何影響一個具體村莊的變遷,這種深度和系統(tǒng)性AI無法做到。
“AI等待被人類喂養(yǎng)。”她認為,AI再強大,也無法替代人類對現(xiàn)實的感知與回應(yīng),這恰恰是最不該放棄的能力。
(應(yīng)受訪者要求,文中嚴遠、王子依、趙霖、彭玉為化名)
新京報記者在一個免費進行AI率檢測的網(wǎng)站上看到有付費進行降A(chǔ)I率的服務(wù)。 網(wǎng)站截圖
王子依收藏的降A(chǔ)I率“攻略”。 受訪者供圖
本文鏈接:當畢業(yè)論文遇到AI“審判”http://www.sq15.cn/show-2-12713-0.html
聲明:本網(wǎng)站為非營利性網(wǎng)站,本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
上一篇: 福建艦三歲了 “三航母時代”意味著什么?