国产高潮流白浆喷水a片,夜色55夜色66亚洲精品网站,毛片基地大全免费毛片

[導(dǎo)讀]生成式預(yù)訓(xùn)練轉(zhuǎn)換器 (GPT) 等自然語言處理 (NLP) 模型以制作類人文本、回答復(fù)雜問題和巧妙辯論各種主題的能力震驚世界，而其被濫用的可能性引發(fā)的擔(dān)憂也在日益加劇。

是AI還是人類如何判斷文章是否為ChatGPT所寫？

圖源：Brian/Stock.adobe.com

作者：Becks Simpson，貿(mào)澤電子專稿

發(fā)布日期：2023年3月30日

生成式預(yù)訓(xùn)練轉(zhuǎn)換器 (GPT) 等自然語言處理 (NLP) 模型以制作類人文本、回答復(fù)雜問題和巧妙辯論各種主題的能力震驚世界，而其被濫用的可能性引發(fā)的擔(dān)憂也在日益加劇。雖然這些模型可以用于很多寫作應(yīng)用，但如果用來完成作業(yè)將對學(xué)生的學(xué)習(xí)產(chǎn)生負(fù)面影響。因此，教育工作者也在尋求一些方法，以通過手動（如查看內(nèi)容本身的標(biāo)志）或自動（如使用人工智能 (AI) 構(gòu)建的文本分類器）的方式，來判斷文本是否由AI生成。此外，還有一些人在嘗試重新設(shè)計課程，以讓學(xué)生無法用AI完成作業(yè)，或者鼓勵學(xué)生自己完成作業(yè)。在所有方法中，重新設(shè)計課程似乎取得了較大的成效。

適當(dāng)借助工具進(jìn)行創(chuàng)作

新的NLP AI模型，特別是GPT變體（ChatGPT、GPT-3等），將徹底改變?nèi)祟悓懽鞣绞?。擁有如此?qiáng)大的技術(shù)意味著，用戶可以更快地把一個想法或一系列要點(diǎn)變成一篇文章。他們可以通過一些有用的提示和新的思路來激發(fā)寫作靈感，擺脫困擾。無論是否有經(jīng)驗(yàn)，都可以借助新一代NLP模型來進(jìn)行創(chuàng)作，而沒有經(jīng)驗(yàn)的人更容易將自己的想法轉(zhuǎn)化為精彩的文章和故事。

然而，使用這些AI模型作為寫作輔助工具也有缺點(diǎn)。比如對于中高等教育等來說，寫作練習(xí)的目標(biāo)是學(xué)習(xí)如何寫好文章，以及如何提出和表達(dá)有說服力的想法和論點(diǎn)。寫作也是學(xué)習(xí)如何研究論據(jù)以支持文章中提出的觀點(diǎn)以及磨練批判性思維技能的工具。完全依靠AI模型來完成這項(xiàng)工作會跳過這一過程，讓學(xué)生們無法學(xué)到這一重要技能。因此，了解如何確定某些東西是否是由AI編寫的成為了當(dāng)下努力的方向。

發(fā)掘跡象：如何識別AI創(chuàng)作

隨著AI智能寫作的逐漸普及，我們看到AI創(chuàng)作的機(jī)會也越來越多，這也為我們提供了一個了解AI創(chuàng)作類型的窗口，幫助我們識別內(nèi)容特征，以確定作者是人類還是機(jī)器。有趣的是，雖然準(zhǔn)確性是一個較為具體的指標(biāo)，但這些特征大多與散文的整體流暢度而非語法和拼寫細(xì)節(jié)有關(guān)。然而，對于通常引用明確答案或同一事實(shí)的高度熱門話題來說，即使是人類編寫的內(nèi)容也很可能看起來與AI生成內(nèi)容相似并重復(fù)。對于較短的文本來說更是如此，無論是看起來還是聽起來都難以辨別。因此，只有在文本足夠長的情況下，才有可能有效地識別出是否出自AI。

所以，AI文章往往會重復(fù)一些內(nèi)容，尤其是在編寫長篇文章時。ChatGPT這類模型會以先前所有的預(yù)測令牌為基礎(chǔ)預(yù)測下一個令牌；因此，在一系列的預(yù)測文本中，某些單詞出現(xiàn)得越早，它們重新出現(xiàn)的可能性就越大。AI寫作的另一個跡象是沒有感情，內(nèi)容平淡，沒有任何特別強(qiáng)烈的情感或觀點(diǎn)。對于師生這種讀者熟悉作者個性的情況，就很容易識別出來。如果還有同一作者的其他文本作為參考，就更加容易識別出AI文本，尤其是那些在考試等監(jiān)督條件下寫出來的文本可能沒有那么精致，更能表達(dá)作者的真實(shí)聲音。如果兩篇文章的常用表達(dá)方式和語言有很大差異，那么就很可能不是出自同一人之手。

另一個跡象是，是否正確陳述事實(shí)，以及引用是否正確。眾所周知，像GPT-3和ChatGPT等生成模型很難產(chǎn)生正確的答案（它們可能會自信地斷言并非如此），因?yàn)榧词顾鼈兪褂么罅炕ヂ?lián)網(wǎng)文本信息進(jìn)行訓(xùn)練，但實(shí)際上也無法記住所有內(nèi)容。因此，這些模型是在對事物有了大致了解的基礎(chǔ)上，將所學(xué)知識以類似人類的語言展現(xiàn)出來，而不是原樣照搬一些細(xì)枝末節(jié)。對于很多沒有關(guān)聯(lián)元素用以檢驗(yàn)真實(shí)性的模型來說，由做了足夠研究的人發(fā)現(xiàn)作業(yè)中存在的錯誤，也能很好地證明這篇文章是由AI生成的，尤其是在內(nèi)容與時事、人物或地點(diǎn)有關(guān)時，這是因?yàn)樽钚掳姹镜墓_模型只在某個日期（通常是2021年或2022年）的數(shù)據(jù)上進(jìn)行了訓(xùn)練。然而，在評估這一特定跡象時，需要檢查這一模型是否發(fā)布了更新的知識。

用魔法打敗魔法

隨著AI復(fù)雜度的不斷提升，其中一些跡象將消失或變得很微妙，以至于人類很難檢測到。一些新興的AI工具可用來檢測書面內(nèi)容是否來自AI；例如，一些較新的大型語言模型 (LLM) 正在接受訓(xùn)練，以便知道何時向外部來源發(fā)出某些請求，進(jìn)而檢索事實(shí)信息或運(yùn)行數(shù)學(xué)計算。為了消除難以確定作業(yè)是否由AI編寫的可能性，各大公司甚至推出了大量可以確定內(nèi)容出處的AI模型。就連ChatGPT的制作方OpenAI也發(fā)布了一款工具，便于教育工作者區(qū)分某篇文章是否由LLM編寫。經(jīng)過一系列測試，發(fā)現(xiàn)它能夠識別26%的AI書寫文本，但有9%的誤報率，會將人類書寫的文本錯誤標(biāo)記為AI文本。盡管還存在準(zhǔn)確性問題，但OpenAI仍希望這些不完美的工具能夠幫助打擊使用AI的學(xué)術(shù)不端行為。

組合分類器是另一種可以通過使用AI來提高檢測AI文本成功率的方法。GPTSZeroX和DetectGPT等其他文檔分類器可以檢測文本的突發(fā)性和困惑度。這兩個指標(biāo)分別用于衡量機(jī)器人預(yù)測下一個文本的可能性，前提是人類創(chuàng)作具有更高的隨機(jī)性；以及困惑度在句子中的變化，以AI更傾向于保持困惑度不變?yōu)榍疤?。這些分類器都存在一定的局限性，例如，DetectGPT僅適用于某些GPT模型，因此將其中幾個分類器的結(jié)果組合起來可能會更好地識別出AI文本。

如何徹底解決問題

某種程度上來說，這看起來像是試圖用AI打敗AI的一種循環(huán)！在檢查AI技術(shù)進(jìn)步的同時，寫作AI也在不斷地學(xué)習(xí)，并將學(xué)會繞過這種檢查。這個循環(huán)將一直持續(xù)下去，直到某個時刻，幾乎不可能僅僅通過檢查內(nèi)容來確定一篇文章是否出自AI。這就會引導(dǎo)教育工作者嘗試對作業(yè)結(jié)構(gòu)和任務(wù)進(jìn)行測試，例如，布置一些小眾主題（例如，當(dāng)?shù)厣鐓^(qū)或鮮為人知的歷史人物）的作業(yè)，讓學(xué)生寫一些個人的東西，或更多地關(guān)注基于項(xiàng)目的學(xué)習(xí)，進(jìn)而讓他們發(fā)現(xiàn)AI難以勝任。

選擇小眾主題是因?yàn)橥ǔI對它們了解較少，學(xué)生們必須自己經(jīng)過研究才能找到正確的答案。他們可能仍然會使用這些模型來創(chuàng)作書面內(nèi)容，但至少學(xué)會了研究和評估信息相關(guān)性。要求學(xué)生寫個人話題更多的是源自心理學(xué)，因?yàn)楫?dāng)自己成為焦點(diǎn)時，人們更傾向于親歷親為。老師們發(fā)現(xiàn)，相較于處理外部話題，學(xué)生在處理個人話題時更開放、更興奮?；陧?xiàng)目的學(xué)習(xí)也非常好，因?yàn)樗硕鄠€不同復(fù)雜程度的任務(wù)，通常存在一些AI無法完成的實(shí)際問題。例如，一個跨學(xué)區(qū)的項(xiàng)目涉及到研究當(dāng)?shù)卣邔λ|(zhì)的影響，這意味著學(xué)生不僅需要研究政策，還需要實(shí)地測量水質(zhì)。他們還需要以圖形、圖表和圍繞數(shù)據(jù)的故事形式展示他們的發(fā)現(xiàn)，這是ChatGPT難以做到的。

結(jié)語

雖然GPT模型家族在某些領(lǐng)域可能非常有用，但對于中高等教育等領(lǐng)域，還是應(yīng)該謹(jǐn)慎使用這些模型，以避免過度依賴和忽視學(xué)習(xí)成效。因此，有些教育工作者正在尋求一些方法，以通過檢查文本是否存在事實(shí)記憶差、寫作無創(chuàng)意或缺乏創(chuàng)意以及過度重復(fù)等跡象，來確定某項(xiàng)作業(yè)是否是AI生成的。也有些人則在尋求AI檢測工具的幫助。然而，由于這兩種方法可能都不夠完美，或者會產(chǎn)生錯誤的結(jié)果，所以我們還需要找到更好的作業(yè)布置方法，以求超出AI能力范疇或者打消學(xué)生使用AI的想法。后者可能效果更好，因?yàn)樗鼜囊婚_始就在很大程度上規(guī)避了使用AI的欲望，從長遠(yuǎn)來看也可以讓學(xué)生更加投入。

作者簡介

是AI還是人類如何判斷文章是否為ChatGPT所寫？