作者:張樹仁
ChatGPT,美國人工智慧研究公司OpenAI開發的聊天機器人程式,于2022年11月30日發佈。
ChatGPT是人工智慧技術驅動的自然語言處理工具,它能夠通過學習和理解人類的語言來進行對話,還能根據聊天的上下文進行互動,甚至能完成撰寫郵件、撰寫論文、視頻腳本、文案、翻譯、代碼等任務。
ChatGPT擁有語言理解和文本生成能力,尤其是它會通過連接大量的語料庫來訓練模型,這些語料庫包含了真實世界中的對話,使得ChatGPT具備上知天文下知地理的能力,還能根據聊天的上下文進行互動的能力,做到與真正人類幾乎無異的聊天場景進行交流。這就是它在當下能夠火爆的主要原因。
ChatGPT作為優化對話的語言模型,是GPT-3.5架構的主力模型。它具有同類產品具備的一些特性,例如對話能力,能夠在同一個會話期間內回答上下文相關的後續問題。然而,其在短時間內引爆全球的原因在於,在網友們曬出的截圖中,ChatGPT不僅能流暢地與使用者對話,甚至能寫詩、撰文、編碼等。
ChatGPT還採用了注重道德水準的訓練方式,按照預先設計的道德準則,對不懷好意的提問和請求“說不”。一旦發現使用者給出的文字提示裡面含有惡意,包括但不限於暴力、歧視、犯罪等意圖,都會拒絕提供有效答案。所以當用戶交流時得到基本符合大眾認知的答案時,就愈加感歎其“聰明”了。
2022年11月底,人工智慧對話聊天機器人ChatGPT推出,迅速在社交媒體上走紅,短短5天,註冊用戶數就超過100萬。到2023年1月底,ChatGPT的用戶已突破1億,成為史上增長最快的消費者應用。目前ChatGPT的用戶還在繼續增加,估計到2月底將達2.3億。
ChatGPT受到關注的重要原因是引入新技術Reinforcement Learning with Human Feedback(RLHF),也就是基於人類回饋的強化學習。RLHF解決了生成模型的一個核心問題,即如何讓人工智慧模型的產出和人類的常識、認知、需求、價值觀保持一致。
這次RLHF技術得以在ChatGPT上應用,並取得了很好的效果。但RLHF實際上並不容易訓練,強化學習很容易遇到模式坍塌,回饋過於稀疏這類問題,訓練起來很困難。這可能也是為什麼論文在2022年3月初發表,ChatGPT在11月底才上線,中間需要大量的時間來調優。
ChatGPT在使用上還有一定的局限性,其模型仍有優化空間。例如,它可能會出現創造不存在的知識,或者主觀猜測提問者的意圖等問題,模型的優化將是一個持續的過程。若人工智慧技術反覆運算不及預期,自然語言處理模型優化受限,則相關產業發展進度會受到影響。
ChatGPT無疑是人工智慧發展歷程中的重大突破性進展,其意義超過了2016年問世的AlphaGo。雖然它不能取代人類的創造力和創新能力,而人類的未來和發展仍然需要人類自己的智慧和努力;不過,可以說,ChatGPT有著十分廣泛的應用價值。
ChatGPT的應用場景很多:主要用來開發聊天機器人,也可以編寫和調試電腦程式,還可以進行文學、媒體相關領域的創作,包括創作音樂、電視劇等。在某些測試情境下,ChatGPT在教育、考試、回答測試問題方面的表現甚至優於普通人類測試者。
國際知名學者周海中先生在20世紀90年代初曾經預言:“隨著科技進步,人工智慧時代即將到來;屆時,人工智慧技術將廣泛應用到各學科領域,會產生意想不到的效果。”如今,越來越多的事實證明了他的這一預言。完全可以相信,在人工智慧時代,ChatGPT的作用將會越來越大。
文/張樹仁(作者單位:西安交通大學人工智慧學院)