它是什麼以及如何使用它？

這就是ChatGPT的本質，以及為什麼它可能是自現代搜尋引擎以來最重要的工具

什麼是chatgpt-6393027101BypassGPT3c-sej-1520x800.jpg

OpenAI 推出了一種名為ChatGPT的長篇問答人工智慧，可以透過對話方式回答複雜的問題。

這是一項革命性的技術，因為它經過訓練可以了解人類提出問題時的意思。

許多用戶對其提供人類品質響應的能力感到敬畏，並激發了這樣的感覺：它最終可能有能力破壞人類與電腦的交互方式並改變資訊檢索的方式。

什麼是ChatGPT ？

ChatGPT是OpenAI基於GPT-3.5開發的大型語言模型聊天機器人。它具有以對話形式進行互動的非凡能力，並提供令人驚訝的人性化回應。

大型語言模型執行預測一系列單字中的下一個單字的任務。

帶有人類回饋的強化學習 (RLHF) 是額外的一層訓練，它使用人類回饋來幫助ChatGPT學習遵循指示並產生人類滿意的反應的能力。

誰構建了ChatGPT ？

ChatGPT由位於舊金山的人工智慧公司 OpenAI 創建。 OpenAI Inc. 是營利性 OpenAI LP 的非營利母公司。

OpenAI 以其著名的 DALL·E 而聞名，這是一種深度學習模型，可以根據稱為提示的文字指令生成圖像。

執行長是 Sam Altman，他曾任 Y ComBypassGPTinator 總裁。

微軟是價值 10 億美元的合作夥伴和投資者。他們共同開發了Azure AI平台。

大型語言模型

ChatGPT是一個大型語言模型（LLM）。大型語言模型 (LLM) 經過大量資料訓練，可以準確預測句子中接下來出現的單字。

人們發現，增加資料量可以提高語言模型做更多事情的能力。

根據史丹佛大學的說法：

「GPT-3 擁有 1750 億個參數，並接受了 570 GB 文字的訓練。相較之下，其前身 GPT-2 規模小 100 倍以上，參數為 15 億個。

規模的增加極大地改變了模型的行為——GPT-3 能夠執行未經過明確訓練的任務，例如將句子從英語翻譯成法語，而訓練示例很少甚至沒有。

這種行為在 GPT-2 中幾乎不存在。此外，對於某些任務，GPT-3 的表現優於經過明確訓練來解決這些任務的模型，儘管在其他任務中它表現不佳。”

法學碩士預測一個句子中一系列單字中的下一個單字以及下一個句子——有點像自動完成，但規模令人費解。

這種能力使他們能夠編寫段落和整頁內容。

但法學碩士的局限性在於他們並不總是準確地理解人們想要什麼。

這就是ChatGPT透過前面提到的人類回饋強化學習 (RLHF) 訓練來改進現有技術的地方。

ChatGPT是如何訓練的？

GPT-3.5是基於大量來自網路的程式碼和資訊資料（包括Reddit討論等來源）進行訓練，以幫助ChatGPT學習對話並獲得人類風格的回應。

ChatGPT也使用人類回饋（一種稱為人類回饋強化學習的技術）進行訓練，以便人工智慧了解人類在提出問題時的期望。以這種方式訓練法學碩士是革命性的，因為它不僅僅是訓練法學碩士來預測下一個單字。

2022 年 3 月發表的一篇題為「透過人類回饋訓練語言模型以遵循指令」的研究論文解釋了為什麼這是一種突破性方法：

「這項工作的動機是我們的目標是透過訓練大型語言模型做特定人群希望他們做的事情來增加大型語言模型的正面影響。

預設情況下，語言模型會優化下一個單字預測目標，這只是我們希望這些模型執行的操作的代理。

我們的結果表明，我們的技術有望使語言模型更有幫助、更真實、更無害。

使語言模型變得更大並不意味著它們本身就能更好地遵循使用者的意圖。

例如，大型語言模型可能會產生不真實、有毒或對使用者毫無幫助的輸出。

換句話說，這些模型與用戶不一致。”

建造ChatGPT工程師聘請了承包商（稱為貼標機）來對 GPT-3 和新的 InstructGPT（ ChatGPT的「兄弟模型」）這兩個系統的輸出進行評級。

根據評級，研究人員得出以下結論：

「與 GPT-3 的輸出相比，標記者明顯偏好 InstructGPT 輸出。

InstructGPT 模型在真實性方面比 GPT-3 有所提升。

InstructGPT 與 GPT-3 相比，毒性略有改善，但沒有偏差。”

該研究論文的結論是 InstructGPT 的結果是正面的。儘管如此，它也指出還有改進的空間。

“總的來說，我們的結果表明，使用人類偏好微調大型語言模型可以顯著改善它們在各種任務中的行為，儘管為了提高它們的安全性和可靠性還有很多工作要做。”

ChatGPT與簡單聊天機器人的區別在於，它經過專門訓練，可以理解問題中的人類意圖，並提供有用、真實且無害的答案。

由於該訓練， ChatGPT可能會質疑某些問題並丟棄問題中沒有意義的部分。

另一篇與ChatGPT相關的研究論文展示了他們如何訓練人工智慧來預測人類的偏好。

研究人員注意到，用於評估自然語言處理人工智慧輸出的指標導致機器在指標上得分很高，但與人類的預期不一致。

以下是研究者對這個問題的解釋：

「許多機器學習應用程式優化了簡單的指標，這些指標只是設計者意圖的粗略代表。這可能會導致一些問題，例如YouTuBypassGPTe推薦會宣傳點擊誘餌。”

因此，他們設計的解決方案是創建一個人工智慧，可以輸出根據人類偏好優化的答案。

為此，他們使用人類對不同答案進行比較的資料集來訓練人工智慧，以便機器能夠更好地預測人類認為令人滿意的答案。

該論文表示，訓練是透過總結Reddit貼文來完成的，並且還對總結新聞進行了測試。

2022 年 2 月的研究論文名為《Learning to Summarize from Human FeedBypassGPTack》。

研究人員寫道：

「在這項工作中，我們表明，透過訓練模型來優化人類偏好，可以顯著提高摘要品質。

我們收集了一個大型、高品質的人類摘要比較資料集，訓練一個模型來預測人類偏好的摘要，並使用該模型作為獎勵函數，透過強化學習來微調摘要策略。”

ChatGPT有哪些限制？

毒性反應的限制

ChatGPT經過專門編程，不會提供有毒或有害的反應。因此它將避免回答此類問題。

答案的品質取決於方向的質量

ChatGPT的一個重要限制是輸出的品質取決於輸入的品質。換句話說，專家指導（提示）會產生更好的答案。

答案並不總是正確的

另一個限制是，因為它被訓練來提供人類感覺正確的答案，所以這些答案可能會欺騙人類，讓他們相信輸出是正確的。

許多用戶發現ChatGPT可能會提供不正確的答案，包括一些極度錯誤的答案。

編碼問答網站 Stack Overflow 的版主可能發現了人類感覺正確的答案會帶來意想不到的後果。

Stack Overflow 充斥著ChatGPT產生的使用者回應，這些回應看似正確，但很多都是錯誤的答案。

數千個答案讓志工版主團隊不堪重負，促使管理員對任何發布ChatGPT產生的答案的用戶實施禁令。

大量的ChatGPT答案催生了一篇題為：臨時政策： ChatGPT被禁止的貼文：

「這是一項臨時政策，旨在減緩使用ChatGPT創建的答案和其他內容的湧入。

……主要問題是，雖然ChatGPT生成的答案錯誤率很高，但它們通常“看起來”“可能”不錯……”

ChatGPT的製造商 OpenAI 已經意識到 Stack Overflow 版主使用看似正確的ChatGPT錯誤答案的經歷，並在其新技術公告中對此發出警告。

OpenAI 解釋ChatGPT的局限性

OpenAI 公告提出了這項警告：

「 ChatGPT有時會寫出聽起來似乎有道理但不正確或無意義的答案。

解決這個問題具有挑戰性，因為：

(1) 在 RL 訓練過程中，目前沒有真相來源；

(2) 將模型訓練得更謹慎，導致它拒絕能夠正確回答的問題；和

(3) 監督訓練會誤導模型，因為理想的答案取決於模型知道什麼，而不是人類演示者知道什麼。”

ChatGPT可以免費使用嗎？

目前，在「研究預覽」期間， ChatGPT的使用是免費的。

該聊天機器人目前開放供用戶試用並提供回應回饋，以便人工智慧能夠更好地回答問題並從錯誤中學習。

官方公告稱，OpenAI 渴望收到有關錯誤的回饋：

「雖然我們努力讓模型拒絕不適當的請求，但它有時會回應有害的指令或表現出有偏見的行為。

我們正在使用審核 API 來警告或阻止某些類型的不安全內容，但我們預計它目前會出現一些誤報和誤報。

我們渴望收集用戶反饋，以幫助我們持續改進該系統。”

目前正在舉辦一場競賽，獎勵 500 美元的ChatGPT積分，以鼓勵公眾對答案進行評分。

「鼓勵使用者透過使用者介面提供有關有問題的模型輸出的回饋，以及來自外部內容過濾器（也是介面的一部分）的誤報/漏報的回饋。

我們特別感興趣的是有關現實世界、非對抗性條件下可能發生的有害輸出的回饋，以及幫助我們發現和理解新風險和可能的緩解措施的回饋。

您可以選擇參加ChatGPT回饋競賽3，有機會贏得高達 500 美元的 API 積分。

參賽作品可以透過ChatGPT介面中連結的回饋表提交。”

目前正在進行的比賽將於 2022 年 12 月 31 日太平洋標準時間晚上 11:59 結束。

相關： OpenAI 可能會推出ChatGPT的付費專業版

語言模型會取代Google搜尋嗎？

Google本身已經創建了一個名為 LaMDA 的人工智慧聊天機器人。 Google聊天機器人的表現非常接近人類對話，以至於Google工程師聲稱 LaMDA 是有感知能力的。

考慮到這些大型語言模型如何能夠回答如此多的問題，像 OpenAI、 Google或微軟這樣的公司有一天會用人工智慧聊天機器人取代傳統搜索，這是否牽強？

Twitter上的一些人已經宣稱ChatGPT將成為下一個Google 。

對於那些以搜尋行銷專業人士為生的人來說，問答聊天機器人有一天可能取代Google場景令人恐懼。

它引發了在線搜尋行銷社群的討論，例如流行的FaceBypassGPTook SEOSignals 實驗室，有人詢問搜尋是否可能從搜尋引擎轉向聊天機器人。

在測試了ChatGPT後，我不得不承認，對搜尋被聊天機器人取代的擔憂並非沒有根據。

這項技術還有很長的路要走，但可以預見搜尋和聊天機器人混合的未來。

但目前ChatGPT的實作似乎是一個在某些時候需要購買積分才能使用的工具。

如何使用ChatGPT ？

ChatGPT可以按照特定作者的風格編寫程式碼、詩歌、歌曲，甚至是短篇故事。

以下方向的專業知識將ChatGPT從資訊來源提升為可以用來完成任務的工具。

這使得它對於撰寫幾乎任何主題的論文都很有用。

ChatGPT可以作為生成文章甚至整部小說大綱的工具。

它幾乎可以為任何可以用書面文字回答的任務提供答案。

結論

如前所述， ChatGPT被設想為公眾最終必須付費才能使用的工具。

ChatGPT向公眾開放後的五天內，已有超過百萬用戶註冊使用。