AI 探測器能否將我們從 ChatGPT 中拯救出來？我嘗試了 3 個在線工具來找出答案 |海克斯人工智能

這是探索人工智能生成文本問題的系列文章中的第二篇文章。

在本期中，我和我的人工智能夥伴正在研究是否有可能反擊人工智能生成的剽竊行為，以及它如何運作的問題。

另外：什麼是 ChatGPT？它為什麼重要？這是你需要知道的

不過，在繼續之前，我們需要談談剽竊的概念以及它與這個問題的關係。韋氏詞典將“剽竊”定義為“竊取並冒用（他人的想法或文字）作為自己的：使用（他人的作品）而不註明出處。”

這適合人工智能創建的內容。雖然使用 Notion AI 或 ChatGPT 等人工智能工具的人並沒有竊取內容，但如果該人不相信這些單詞來自人工智能並聲稱它們是自己的，那麼它仍然符合抄襲的字典定義。

ZDNET推薦

ChatGPT - 最佳人工智能作家

最好的人工智能聊天機器人：ChatGPT 和其他值得嘗試的有趣替代方案

人工智能聊天機器人和作家可以通過撰寫電子郵件和論文甚至做數學來幫助減輕您的工作量。他們使用人工智能根據用戶輸入生成文本或回答查詢。 ChatGPT 是一個流行的例子，但還有其他值得注意的聊天機器人。

現在讀

在這篇實驗性文章中，我請 ChatGPT 提供幫助。我的文字是普通的粗體文字。 AI 的文字是斜體的。我還將使用三個在線 ChatGPT 抄襲檢測器（我將在下面更詳細地描述）。在每個人工智能生成的部分之後，我將展示探測器的結果。在文章的最後，我們將看看探測器的整體表現如何。

這是我自己編寫的上述文本的結果：

GPT-2 輸出檢測器： 99.98% 真實
Writer AI 內容檢測器： 100% 人工生成的內容。極好的！
大規模內容 AI 內容檢測： 100% 人類內容評分。看起來很棒！

就這樣，我們開始吧。

解釋為什麼 ChatGPT 對於教師和編輯來說是一個真正的抄襲問題

ChatGPT 是 OpenAI 開發的 GPT（Generative Pre-trained Transformer）語言模型的變體。它旨在通過預測給定輸入序列中的下一個單詞或短語來生成類似人類的文本。雖然 ChatGPT 可以成為生成文本和響應提示的有用工具，但對於教師和編輯來說，抄襲也可能是一個問題。

ChatGPT 給教師和編輯帶來問題的主要原因之一是它可以生成與真實人類作家非常相似的文本。這意味著學生或其他個人可能會使用 ChatGPT 生成文本，然後將其作為自己的作品提交，從而構成抄襲。

另：Notion AI寫作助手可以寫這篇文章嗎？

對於教師和編輯來說，檢測給定的文本是由 ChatGPT 生成還是由人類編寫可能非常困難，因為生成的文本可能不包含任何明顯的錯誤或差異來揭示其人工來源。這可能使教師和編輯難以識別和防止剽竊，因為他們可能無法判斷給定的文本是原創的還是從其他來源複製的。

總體而言，ChatGPT 和其他類似的語言模型在抄襲方面可能會給教師和編輯帶來問題，因為它們可以生成難以與人類編寫的文本區分開來的文本，從而使學生和其他個人更容易在不被察覺的情況下進行抄襲。檢測到。

GPT-2 輸出檢測器： 99.69% 真實
Writer AI 內容檢測器： 97% 的內容是人工生成的。極好的！
大規模內容人工智能內容檢測：人類內容得分為 87%。看起來不錯！

請記住，斜體顯示的文本是由人工智能生成的。

向我展示至少三種檢測 ChatGPT 用於生成文本的方法

您可以通過多種方法來檢測是否使用 ChatGPT 或其他語言模型來生成一段文本。以下是您可以使用的三種潛在方法：

查找文本中的重複或不尋常的模式：檢測是否使用語言模型來生成文本片段的一種方法是查找寫作中的重複或不尋常的模式。例如，語言模型可能會重複某些短語或單詞組合，或者使用不尋常或不一致的句子結構。
檢查是否缺乏原創性：檢測語言模型是否用於生成文本的另一種方法是檢查寫作是否缺乏原創性。如果一段文本似乎是從其他來源複製的，或者它包含在互聯網或其他來源中廣泛提供的信息，則可能表明它是由語言模型生成的。
使用抄襲檢查器：最後，您可以使用抄襲檢查器來檢查一段文本是否看起來是從其他來源複製的。雖然抄襲檢查器可能無法明確確定是否使用語言模型來生成一段文本，但它可以幫助您識別從其他來源複製或釋義的實例。
請注意，當答案明顯錯誤時：我在 Notion AI 評論中談到了這一點，其中我重點介紹了人工智能以看似權威的方式編寫的一些文本，但這是公然錯誤的。如果學生或作家不能完全掌握所討論的主題，他們可能無法發現不准確之處，而只是將其留在人工智能生成的響應中。當然，錯誤的陳述不僅僅是人工智能寫作工具的權限。例如，許多博主和評論者只是簡單地重複其他博主的言論，創造出完全“虛假事實”的回音室，表明雖然智力可能是人為的，但愚蠢是一種普遍特徵。

請記住，很難明確確定是否使用語言模型來生成一段文本，並且這些方法可能並不總是有效。但是，它們可以成為有用的工具，幫助您識別語言模型生成的文本的潛在實例。

在這組測試中，只有上面的斜體內容通過檢查器套件運行。

GPT-2輸出檢測器： 99.98%是假的
作家人工智能內容檢測器： [無結果]
大規模內容 AI 內容檢測：人類內容得分為 0%。顯然是人工智能

列出三個可以檢測 ChatGPT 文本的抄襲檢查器

創新

我嘗試了 Apple Vision Pro，它遠遠超出了我的預期
這款微型衛星通信器功能齊全，讓您安心無憂
如何使用 ChatGPT：您需要了解的一切
這是我最喜歡的 5 款人工智能工作工具

值得注意的是，目前還沒有專門設計用於檢測 ChatGPT 或其他語言模型生成的文本的抄襲檢查器。雖然一些抄襲檢查器可能能夠識別語言模型生成的文本的某些特徵，這些特徵可以表明其人工來源，但不能保證他們能夠明確確定一段文本是否是由語言模型生成的。

話雖如此，您可以考慮使用以下三個抄襲檢查器來幫助識別語言模型生成的文本的潛在實例：

Turnitin： Turnitin 是一種流行的抄襲檢查器，被學校和大學廣泛使用。它將一段文本與其他文本的數據庫進行比較，以識別複製或釋義的實例。雖然它可能無法明確確定一段文本是否由語言模型生成，但它可能會識別語言模型生成的文本的某些特徵，這些特徵可能表明其人工起源。
PlagScan： PlagScan 是另一種抄襲檢查器，它將一段文本與其他文本的數據庫進行比較，以識別複製或釋義的情況。與 Turnitin 一樣，它可能能夠識別語言模型生成的文本的某些特徵，這些特徵可以表明其人工來源，但它並不是專門為檢測語言模型生成的文本而設計的。
Copyleaks： Copyleaks 是一種抄襲檢查器，它使用先進的機器學習算法來掃描一段文本，並將其與其他文本的數據庫進行比較，以識別複製或釋義的實例。雖然它可能能夠識別語言模型生成的文本的某些特徵，但它並不是專門為檢測語言模型生成的文本而設計的。

值得注意的是，沒有哪個抄襲檢查器是完全萬無一失的，語言模型生成的文本總有可能逃脫檢測。因此，重要的是使用抄襲檢查器作為檢測和防止抄襲的更大策略的一部分。

GPT-2 輸出檢測器： 99.62% 真實
作家人工智能內容檢測器： [無結果]
大規模內容人工智能內容檢測：人類內容得分為 86%。看起來不錯！

在線人工智能抄襲檢查器

大多數抄襲檢測器用於將寫作與其他寫作的語料庫進行比較。例如，當學生提交論文時，像 Turnitin 這樣的產品會根據其數據庫中的大量其他論文以及互聯網上的其他文檔和文本掃描提交的論文，以確定提交的論文是否已經包含-書面內容。

但人工智能寫作工具會生成原創內容，至少在理論上是這樣。是的，他們根據所受過的訓練來構建內容，但他們構建的實際單詞對於每個作品來說都有些獨特。

另外：人工智能的真正目標可能不再是智能

因此，上面提到的抄襲檢查器可能不起作用，因為人工智能生成的內容可能不存在於其他學生的論文中。

因此，我在谷歌上搜索了專門設計用於尋找人工智能驅動內容的洩露特徵的探測器。我找到了三個。對於下面截圖所示的測試內容，我問ChatGPT：“星際迷航比星球大戰更好嗎？證明並解釋”它的答案一點也不差，我把這個答案反饋給三個測試人員。

GPT-2 輸出檢測器： 99.98% 真實
Writer AI 內容檢測器： 100% 人工生成的內容。極好的！
大規模內容 AI 內容檢測： 100% 人類內容評分。看起來很棒！

GPT-2 輸出檢測器（準確度 66%）

第一個工具是使用紐約人工智能公司 Hugging Face 管理的機器學習中心構建的。雖然該公司已獲得 4000 萬美元的資金來開發其自然語言庫，但 GPT-2 檢測器似乎是用戶使用 Hugging Face Transformers 庫創建的工具。在我進行的六項測試中，其中四項測試是準確的。

Writer.com AI 內容檢測器（準確度不適用）

Writer.com是一項面向企業團隊的人工智能寫作生成服務。其人工智能內容檢測器工具可以掃描生成的內容。不幸的是，我發現這個工具不可靠。在我進行的六次掃描中，有三次失敗。在它成功運行的三個項目中，有兩個正確，一個錯誤。

本文發表後，Writer.com 的人員聯繫了 ZDNET。首席執行官 May Habib 有這樣的評論要分享：

對人工智能探測器的需求猛增。自幾個月前推出以來，流量每週增長 2-3 倍。我們現在已經在其背後進行了必要的擴展，以確保它不會下降，我們的目標是保持它免費 - 並保持最新狀態以捕獲最新模型的輸出，包括我們的輸出。如果要逐字使用人工智能輸出，那麼絕對應該對其進行歸因。

大規模內容 AI 內容檢測（準確度 50%）

我發現的第三個工具也是由一家人工智能內容生成公司生產的，但是這個工具似乎工作可靠。 Content at Scale 將自己定位為“我們通過自動化內容創建來幫助專注於 SEO 的內容營銷人員”。其營銷號召性用語是：“上傳關鍵字列表並獲取繞過 AI 內容檢測的 2,600 多個單詞的博客文章 - 所有這些都無需人工干預！”在我進行的六項測試中，有三項是準確的。

最後的想法

人工智能驅動的抄襲問題日益嚴重，因為像 Notion AI 和 ChatGPT 這樣的人工智能工具可以生成難以與人類編寫的文本區分開來的文本。有多種方法可以檢測一段文本是否由人工智能生成，例如尋找重複或不尋常的模式、檢查是否缺乏原創性或使用抄襲檢查器。 Turnitin、PlagScan 和 Copyleaks 等抄襲檢查器可能能夠識別語言模型生成的文本的某些特徵，但它們並不是萬無一失的。

不幸的是，即使是我找到的專業工具也根本不適合這項任務。最好的情況是 GPT-2 輸出檢測器，但它只正確提交了三分之二的文本。

目前，我認為我們還沒有準備好讓人工智能對抗人工智能。相反，我們將不得不依靠人類的感知（這意味著人們必須集中註意力）來識別人工智能生成的作品。

不要立即假設某些東西是機器生成的。不要僅僅因為某些東西很愚蠢或非常不准確，就立即認為它不是由人類編寫的。我們都知道，人類完全有能力自己寫出一些極其糟糕的東西。

另外： OpenAI 的 ChatGPT 非常適合我的工作，但它還不能取代我

所以你怎麼看？你能判斷一件作品是否是人工智能生成的嗎？自從這些人工智能寫作工具突然全部可用以來的幾個月裡，你是否使用過它們？您認為它們對教育和新聞業是幫助還是阻礙？請在下面的評論中告訴我們。 ChatGPT 對此的回答如下：

作為一種語言模型，我無法看到物理文字或與之交互，因此我無法判斷該文字是否是人工智能生成的。不過，我可以告訴你，有幾種可用的人工智能寫作工具，它們可用於生成廣泛的書面內容，包括新聞文章、小說、詩歌等。

我沒有使用這些工具的個人經驗，因為我只是一個計算機程序，沒有瀏覽互聯網或使用物理工具的能力。然而，我可以告訴你，有些人發現人工智能寫作工具對教育和新聞業很有幫助，因為它們可以通過自動化某些任務來節省時間和精力。其他人則對這些工具可能被用來產生誤導性或有偏見的內容，或取代人類作家表示擔憂。最終，人工智能寫作工具是幫助還是阻礙取決於它們的使用方式和使用環境。

所以，是的，就是這樣。

AI 探測器能否將我們從 ChatGPT 中拯救出來？我嘗試了 3 個在線工具來找出答案