當(dāng)前位置:首頁 > 廠商動態(tài) > 貿(mào)澤電子
[導(dǎo)讀]生成式預(yù)訓(xùn)練轉(zhuǎn)換器 (GPT) 等自然語言處理 (NLP) 模型以制作類人文本、回答復(fù)雜問題和巧妙辯論各種主題的能力震驚世界,而其被濫用的可能性引發(fā)的擔(dān)憂也在日益加劇。

是AI還是人類  如何判斷文章是否為ChatGPT所寫?

圖源:Brian/Stock.adobe.com

作者:Becks Simpson,貿(mào)澤電子專稿

發(fā)布日期:2023年3月30日

生成式預(yù)訓(xùn)練轉(zhuǎn)換器 (GPT) 等自然語言處理 (NLP) 模型以制作類人文本、回答復(fù)雜問題和巧妙辯論各種主題的能力震驚世界,而其被濫用的可能性引發(fā)的擔(dān)憂也在日益加劇。雖然這些模型可以用于很多寫作應(yīng)用,但如果用來完成作業(yè)將對學(xué)生的學(xué)習(xí)產(chǎn)生負(fù)面影響。因此,教育工作者也在尋求一些方法,以通過手動(如查看內(nèi)容本身的標(biāo)志)或自動(如使用人工智能 (AI) 構(gòu)建的文本分類器)的方式,來判斷文本是否由AI生成。此外,還有一些人在嘗試重新設(shè)計課程,以讓學(xué)生無法用AI完成作業(yè),或者鼓勵學(xué)生自己完成作業(yè)。在所有方法中,重新設(shè)計課程似乎取得了較大的成效。

適當(dāng)借助工具進(jìn)行創(chuàng)作

新的NLP AI模型,特別是GPT變體(ChatGPT、GPT-3等),將徹底改變?nèi)祟悓懽鞣绞?。擁有如此?qiáng)大的技術(shù)意味著,用戶可以更快地把一個想法或一系列要點(diǎn)變成一篇文章。 他們可以通過一些有用的提示和新的思路來激發(fā)寫作靈感,擺脫困擾。無論是否有經(jīng)驗(yàn),都可以借助新一代NLP模型來進(jìn)行創(chuàng)作,而沒有經(jīng)驗(yàn)的人更容易將自己的想法轉(zhuǎn)化為精彩的文章和故事。

然而,使用這些AI模型作為寫作輔助工具也有缺點(diǎn)。比如對于中高等教育等來說,寫作練習(xí)的目標(biāo)是學(xué)習(xí)如何寫好文章,以及如何提出和表達(dá)有說服力的想法和論點(diǎn)。寫作也是學(xué)習(xí)如何研究論據(jù)以支持文章中提出的觀點(diǎn)以及磨練批判性思維技能的工具。完全依靠AI模型來完成這項(xiàng)工作會跳過這一過程,讓學(xué)生們無法學(xué)到這一重要技能。因此,了解如何確定某些東西是否是由AI編寫的成為了當(dāng)下努力的方向。

發(fā)掘跡象:如何識別AI創(chuàng)作

隨著AI智能寫作的逐漸普及,我們看到AI創(chuàng)作的機(jī)會也越來越多,這也為我們提供了一個了解AI創(chuàng)作類型的窗口, 幫助我們識別內(nèi)容特征,以確定作者是人類還是機(jī)器。有趣的是,雖然準(zhǔn)確性是一個較為具體的指標(biāo),但這些特征大多與散文的整體流暢度而非語法和拼寫細(xì)節(jié)有關(guān)。然而,對于通常引用明確答案或同一事實(shí)的高度熱門話題來說,即使是人類編寫的內(nèi)容也很可能看起來與AI生成內(nèi)容相似并重復(fù)。對于較短的文本來說更是如此,無論是看起來還是聽起來都難以辨別。因此,只有在文本足夠長的情況下,才有可能有效地識別出是否出自AI。

所以,AI文章往往會重復(fù)一些內(nèi)容,尤其是在編寫長篇文章時。ChatGPT這類模型會以先前所有的預(yù)測令牌為基礎(chǔ)預(yù)測下一個令牌;因此,在一系列的預(yù)測文本中,某些單詞出現(xiàn)得越早,它們重新出現(xiàn)的可能性就越大。AI寫作的另一個跡象是沒有感情,內(nèi)容平淡,沒有任何特別強(qiáng)烈的情感或觀點(diǎn)。對于師生這種讀者熟悉作者個性的情況,就很容易識別出來。如果還有同一作者的其他文本作為參考,就更加容易識別出AI文本,尤其是那些在考試等監(jiān)督條件下寫出來的文本可能沒有那么精致,更能表達(dá)作者的真實(shí)聲音。如果兩篇文章的常用表達(dá)方式和語言有很大差異,那么就很可能不是出自同一人之手。

另一個跡象是,是否正確陳述事實(shí),以及引用是否正確。眾所周知,像GPT-3和ChatGPT等生成模型很難產(chǎn)生正確的答案(它們可能會自信地斷言并非如此),因?yàn)榧词顾鼈兪褂么罅炕ヂ?lián)網(wǎng)文本信息進(jìn)行訓(xùn)練,但實(shí)際上也無法記住所有內(nèi)容。因此,這些模型是在對事物有了大致了解的基礎(chǔ)上,將所學(xué)知識以類似人類的語言展現(xiàn)出來,而不是原樣照搬一些細(xì)枝末節(jié)。對于很多沒有關(guān)聯(lián)元素用以檢驗(yàn)真實(shí)性的模型來說,由做了足夠研究的人發(fā)現(xiàn)作業(yè)中存在的錯誤,也能很好地證明這篇文章是由AI生成的, 尤其是在內(nèi)容與時事、人物或地點(diǎn)有關(guān)時,這是因?yàn)樽钚掳姹镜墓_模型只在某個日期(通常是2021年或2022年)的數(shù)據(jù)上進(jìn)行了訓(xùn)練。然而,在評估這一特定跡象時,需要檢查這一模型是否發(fā)布了更新的知識。

用魔法打敗魔法

隨著AI復(fù)雜度的不斷提升,其中一些跡象將消失或變得很微妙,以至于人類很難檢測到。一些新興的AI工具可用來檢測書面內(nèi)容是否來自AI;例如,一些較新的大型語言模型 (LLM) 正在接受訓(xùn)練,以便知道何時向外部來源發(fā)出某些請求,進(jìn)而檢索事實(shí)信息或運(yùn)行數(shù)學(xué)計算。 為了消除難以確定作業(yè)是否由AI編寫的可能性,各大公司甚至推出了大量可以確定內(nèi)容出處的AI模型。就連ChatGPT的制作方OpenAI也發(fā)布了一款工具,便于教育工作者區(qū)分某篇文章是否由LLM編寫。經(jīng)過一系列測試,發(fā)現(xiàn)它能夠識別26%的AI書寫文本,但有9%的誤報率,會將人類書寫的文本錯誤標(biāo)記為AI文本。盡管還存在準(zhǔn)確性問題,但OpenAI仍希望這些不完美的工具能夠幫助打擊使用AI的學(xué)術(shù)不端行為。

組合分類器是另一種可以通過使用AI來提高檢測AI文本成功率的方法。GPTSZeroX和DetectGPT等其他文檔分類器可以檢測文本的突發(fā)性和困惑度。這兩個指標(biāo)分別用于衡量機(jī)器人預(yù)測下一個文本的可能性,前提是人類創(chuàng)作具有更高的隨機(jī)性;以及困惑度在句子中的變化,以AI更傾向于保持困惑度不變?yōu)榍疤?。這些分類器都存在一定的局限性,例如,DetectGPT僅適用于某些GPT模型,因此將其中幾個分類器的結(jié)果組合起來可能會更好地識別出AI文本。

如何徹底解決問題

某種程度上來說,這看起來像是試圖用AI打敗AI的一種循環(huán)! 在檢查AI技術(shù)進(jìn)步的同時,寫作AI也在不斷地學(xué)習(xí),并將學(xué)會繞過這種檢查。這個循環(huán)將一直持續(xù)下去,直到某個時刻,幾乎不可能僅僅通過檢查內(nèi)容來確定一篇文章是否出自AI。這就會引導(dǎo)教育工作者嘗試對作業(yè)結(jié)構(gòu)和任務(wù)進(jìn)行測試,例如,布置一些小眾主題(例如,當(dāng)?shù)厣鐓^(qū)或鮮為人知的歷史人物)的作業(yè),讓學(xué)生寫一些個人的東西,或更多地關(guān)注基于項(xiàng)目的學(xué)習(xí),進(jìn)而讓他們發(fā)現(xiàn)AI難以勝任。

選擇小眾主題是因?yàn)橥ǔI對它們了解較少,學(xué)生們必須自己經(jīng)過研究才能找到正確的答案。他們可能仍然會使用這些模型來創(chuàng)作書面內(nèi)容,但至少學(xué)會了研究和評估信息相關(guān)性。要求學(xué)生寫個人話題更多的是源自心理學(xué),因?yàn)楫?dāng)自己成為焦點(diǎn)時,人們更傾向于親歷親為。老師們發(fā)現(xiàn),相較于處理外部話題,學(xué)生在處理個人話題時更開放、更興奮?;陧?xiàng)目的學(xué)習(xí)也非常好,因?yàn)樗硕鄠€不同復(fù)雜程度的任務(wù),通常存在一些AI無法完成的實(shí)際問題。例如,一個跨學(xué)區(qū)的項(xiàng)目涉及到研究當(dāng)?shù)卣邔λ|(zhì)的影響,這意味著學(xué)生不僅需要研究政策,還需要實(shí)地測量水質(zhì)。他們還需要以圖形、圖表和圍繞數(shù)據(jù)的故事形式展示他們的發(fā)現(xiàn),這是ChatGPT難以做到的。

結(jié)語

雖然GPT模型家族在某些領(lǐng)域可能非常有用,但對于中高等教育等領(lǐng)域,還是應(yīng)該謹(jǐn)慎使用這些模型,以避免過度依賴和忽視學(xué)習(xí)成效。因此,有些教育工作者正在尋求一些方法,以通過檢查文本是否存在事實(shí)記憶差、寫作無創(chuàng)意或缺乏創(chuàng)意以及過度重復(fù)等跡象,來確定某項(xiàng)作業(yè)是否是AI生成的。也有些人則在尋求AI檢測工具的幫助。然而,由于這兩種方法可能都不夠完美,或者會產(chǎn)生錯誤的結(jié)果,所以我們還需要找到更好的作業(yè)布置方法,以求超出AI能力范疇或者打消學(xué)生使用AI的想法。后者可能效果更好,因?yàn)樗鼜囊婚_始就在很大程度上規(guī)避了使用AI的欲望,從長遠(yuǎn)來看也可以讓學(xué)生更加投入。

作者簡介

是AI還是人類  如何判斷文章是否為ChatGPT所寫?

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉