OpenAI的ChatGPT在回答問題時出現問題

OpenAIs-ChatGPT.jpg

現在已經過去了將近6個月,OpenAI的ChatGPT已經問世。事實上,該公司最近推出了ChatGPT 4,這項技術將世界帶到了一個新的水平。

ChatGPT 是一個由 AI 強力驅動的語言模型,經過訓練能夠進行多項活動,包括翻譯語言、概述信息以及回答問題。這款模型的卓越能力引起了廣泛關注,因此許多人開始懷疑自己的就業前景。

GPT-4 語言處理模型可以用來分析大量的數據,並根據分析結果生成內容。此外,新技術能夠分析大量的文本,以向消費者呈現特定數據點的相關信息。

毫無疑問,科技將長期存在。當然,它在許多方面都有助於使用者。在無數場合中,科技已經展示了它從撰寫腳本到解決最難的問題卷的能力。ChatGPT可以做到任何事情。然而,對於ChatGPT來說,有些事情更加困難。

1. 擁有人工智慧技術的 ChatGPT 在印度的統一入學考試 (JEE) 中遭遇挫折,未能通過這項備受矚目的考試。統一入學考試因其難度而聞名,在印度每年吸引著成千上萬有志於進入印度最頂尖工程學院的學生。這是一項非常嚴峻的量化考試,其中包括複雜的圖表和數字。

對於有興趣進入像印度理工學院(IITs)和國家級工程學院(NITs)這樣的頂尖教育機構的學生來說,必須首先通過聯合入學考試。根據報導,ChatGPT在JEE高級考試上表現不佳。

ChatGPT 在測試中的表現並不理想,因為它只能解答出試卷中總題數的11題。

2. ChatGPT在過去已經成功地通過了一系列顯著且困難的測試。令人印象深刻的是,ChatGPT曾嘗試並成功回答了全國醫學院校招生考試(NEET)中的全部200個問題,這項考試要求考生在總共200題中回答180題。

儘管如此,ChatGPT嘗試回答了所有200個問題,其表現結果為800分中的359分。具體而言,ChatGPT在NEET考試的生物組件中表現出色,在回答該部分問題時更準確。ChatGPT在NEET考試中的表現表明,儘管未通過JEE Advanced考試,它在其他領域也有出色的能力。

在 JEE Advanced 測試中遭受的挫敗展示了 ChatGPT 中存在的限制,這甚至包括了最先進的人工智能模型。即使人工智能有潛力在許多不同的產業中引發顛覆,但要在困難任務中與人類智慧相競爭,它仍然有很長的路要走。

OpenAI的聊天機器人ChatGPT在另一個競爭性考試中並不成功。

3. ChatGPT根據Analytics India Magazine (AIM)的要求,參加了聯合公共服務委員會(UPSC)的考試。UPSC考試被認為是世界上最難的競爭性考試之一。每年有超過100萬名有志者參加UPSC考試,但只有其中的5%能夠通過。

AIM 提供了 100 道2022年 UPSC 初試的問題給 ChatGPT。

聊天機器人在2022年UPSC初試中表現不佳,在第一份問卷(A套)中僅獲得54分,而所需分數為87.54分。這意味著ChatGPT未通過UPSC測試。

問題基於印度一般科學、歷史、地理、經濟、生態和時事的主題。聊天機器人在有關地點和經濟的問題上表現良好,但在被問及2021年之前發生的歷史事件時卻表現得非常糟糕。

聊天GPT的數據集僅限於2021年,這可能是AI機器人無法正確回答所有考試問題的關鍵因素。

4.此外,ChatGPT的CLAT考試成績也同樣高於平均水平。在CLAT UG考試期間,這個AI工具只能準確解答50.83%的問題。ChatGPT在邏輯和量化問題類別上並不成功。然而,它在英語和時事類別表現出色。當涉及到基於概念的問題時,這個工具遇到了很大的困難。

ChatGPT 於 2022 年 11 月面世後在美國取得了不錯的成績。這項人工智慧技術在美國通過了美國醫療師執照考試(USMLE)以及各種MBA考試。此外,它還通過了Google Level 3 工程師的編程面試。

最近,當 ChatGPT 能夠正確地診斷一隻狗的狀況並拯救該動物的生命時,獸醫專業人員感到驚訝。

然而,許多國家對ChatGPT持有截然不同的觀點,並準備針對這一新技術採取強力行動。最近,包括德國意大利在內的兩個重要國家已經對這項技術進行了禁止。這些國家聲稱OpenAI的ChatGPT缺乏相應的保護機制,以防止未成年人接觸到冒犯性材料,例如年齡驗證系統。

德國數據保護專員 Ulrich Kelber發出警告稱,由於對使用者數據安全的擔憂,Chat-GPT可能會在德國面臨潛在的禁令,類似於意大利的情況。

讓我們看看未來人工智慧技術將會如何表現。

謝謝閱讀!敬請期待更多這樣的資訊文章!

相關文章

查看更多 >>

透過 HIX.AI 釋放 AI 的力量!