谷歌和OpenAI正在開發專有的人工智慧模型,但免費的開源模型也在激增。谷歌員工稱,公司面臨的壓力越來越大,如果不推出更多開源模型,就可能在這場人工智慧競賽中落後。此外,有傳言稱OpenAI正準備發布新的開源語言模型。那麽,開源模型的優勢到底在哪裡呢?
以下為翻譯全文:
今年2月,Meta向學術界提供了一批高級機器學習模型,它們能夠理解自然語言對話。這一舉止引發了人工智慧開發的熱潮。僅僅幾周時間,學者們就將這些模型轉化為開源軟體,並且推出了可以替代ChatGPT和其他專有人工智慧軟體(專有軟體在使用和修改上有限制)的免費產品。
免費模型不輸OpenAI、Google的專有模型
加州大學柏克萊分校電腦科學教授揚·斯托伊察(Ion Schmidt)表示,免費人工智慧模型目前在性能方面已經與谷歌和OpenAI的專有模型相當接近,大多數軟體開發人員最終將選擇使用免費模型。斯托伊察還使用了Meta的技術來開發一個關鍵的開源人工智慧模型。
如果斯托伊察的觀點是正確的,那麽開源人工智慧將會顛覆谷歌、OpenAI、微軟等公司的商業計劃。任何人都可以以很低的成本獲得強大的人工智慧工具,Meta也可以從中獲得回報。
斯托伊察等人利用Meta的研究成果開發了Vicuna,這是一個開源語言理解模型,已在今年3月發布。Vicuna使用了ChatGPT的數據,這些數據來自於某一網站上用戶與OpenAI聊天機器人的對話記錄。開源人工智慧的快速進步,以及Vicuna的出色表現,引起了谷歌高級工程師盧克·塞諾(Luke Sernau)的警告。他告誡同事們,如果公司繼續專注於專有軟體以追趕OpenAI,公司將面臨落後的風險。
塞諾在一份內部備忘錄中寫道:「如果有一個高質量的、沒有使用限制的免費替代品,誰還會願意購買我們有使用限制的產品呢?」他還稱開源人工智慧的發展已經「超越了我們」,因此「谷歌應該成為開源社區的領導者」,並「放棄對我們模型的某些控制」。(他沒有回應本文的評論請求。)
這份備忘錄引起了整個行業的共鳴,包括一些谷歌員工。雖然塞諾可能誇大了開源人工智慧的能力,低估了其成本和其他風險,但大多數人工智慧從業者都同意備忘錄的一個結論 — — Meta將從發布其模型中獲益。Meta在內部使用人工智慧模型進行內容推薦和廣告定位。隨著開發人員改進Meta發布的模型,Meta也將能夠將這些改進納入其內部人工智慧中。
4月份的一次分析師電話會議上,當被問及公司的人工智慧戰略時,Meta首席執行長馬克·祖克柏(Mark Zuckerberg)表示:「如果行業對我們正在使用的基本工具進行標準化,那就更好了,我們可以從其他人的改進中受益。」
UC柏克萊大學研究生鄭憐憫參與開發了Vicuna,他說,Meta發布的模型被統稱為LLaMA,不能直接用於商業用途。但Meta向研究人員提供了足夠的訊息,以便創建類似的模型,用於商業應用。
谷歌對其AI軟體並沒有完全專有。早在ChatGPT出現之前的2020年,谷歌就發布了開源語言模型T5,使開發人員能夠構建可以執行翻譯和編寫摘要等任務的軟體。隨後,谷歌又發布了更先進的版本Flan-T5。但根據斯托伊察和其他從業人員的說法,Meta發布的軟體帶來了顯著的改進,超越了谷歌模型所能達到的水平,這讓工程師更傾向於使用基於Meta軟體的模型。
開源替代方案湧現,OpenAI準備推出新開源模型
據知情人士透露,OpenAI正在準備公開發布一款新的開源語言模型,對於想在開源人工智慧領域發揮更大作用的谷歌來說,這可能會增大壓力。目前還不清楚OpenAI是否打算透過開源軟體搶回Vicuna或其他基於Meta模型開發的軟體的領先趨勢。但它不太可能發布與GPT相互競爭的模型。OpenAI估值達到了270億美元,這主要取決於其更有商業價值的專有模型而非開源模型,盡管GPT的前兩個版本是開源的。OpenAI的發言人未回覆評論請求。
像Vicuna這樣的開源模型,訓練成本可能只要幾百美元,用戶可以選擇避免向軟體開發商支付高昂的費用。與此相比,谷歌、OpenAI和微軟一直在銷售其專有模型,企業可以用它們來實現自動化客戶服務、概述醫學研究或生成行銷文案等各種用途。去年,微軟開始銷售其投資了數十億美元的OpenAI模型,而谷歌和亞馬遜今年開始向外部開發人員銷售其模型。
但是,最近幾週,越來越多的開源替代方案湧現。除了基於Meta軟體的Vicuna之外,工程師還可以選擇來自德國非營利組織LAION以及包括Databricks和Stability AI在內的新創公司的其他模型。斯托伊察創建了一個網站,試圖衡量這些開源模型與OpenAI的GPT-4等專有模型的質量。(斯托伊察共同創立了Databricks,該公司銷售可使數據科學家使用人工智慧的軟體。)
據斯托伊察表示,與開源軟體相比,谷歌仍然有兩大優勢。他說,如果谷歌利用其用戶數據庫,它的模型在某些專門用途上的表現可能會更好,比如內容推薦,而這些數據是外人無法訪問的。(不過谷歌發言人澄清說,該公司不會利用現有的用戶數據來培訓其基礎人工智慧模型。)
此外,斯托伊察指出,谷歌在管理大規模電腦基礎設施方面擁有豐富的專業知識,這意味著能夠以更低的成本運行人工智慧軟體模型,包括為其雲端客戶提供服務。上周,谷歌宣布了Bard模型一系列改進,這是谷歌回擊ChatGPT的解決方案。
同時,OpenAI從大量用戶與ChatGPT的互動中收集數據,搶占了改進人工智慧軟體的先機。此外,這家公司還與微軟達成了一項私下協議,可以使用微軟的運算基礎設施。
開源的人工智慧軟體可以讓更多公司使用專有數據來解決自己的問題。斯托伊察舉例稱,一家航空公司可以利用其數百萬客戶服務通話的記錄來創建自動響應。彭博社在三月份表示,他們使用自己的數據來訓練機器學習模型,以更好地理解金融訊息。此外,據Vicuna開發者在Discord伺服器上的消息,工程師一直在嘗試將其用於創意寫作和編程。
斯托伊察表示,他和同事們正在努力增加Vicuna模型中的運算次數,以提高它在推理任務中的能力,例如編寫代碼。Vicuna的開發團隊是天空運算實驗室的一個分支,該實驗室位於柏克萊,每年從微軟、谷歌和亞馬遜等上市公司那裡獲得數百萬美元的預算,每家公司大約提供50萬美元。
開源人工智慧軟體曾挫敗OpenAI的野心。去年4月,OpenAI發布了Dall-E 2,這是一款用文本描述生成原始圖像的人工智慧程式。然而,名為Stable Diffusion的開源替代方案迅速崛起,在人工智慧領域掀起了驚濤駭浪,甚至連OpenAI的員工也大吃一驚。最終,Dall-E-2並沒有成為這個領域的霸主。
「我有理由相信,大語言模型也將遵循同樣的模式。」斯托伊察說。
※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※※
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。各位也可以關注我的Facebook,按讚我的臉書並私訊「10」,送你十週入門數據分析電子書唷!期待你與我互動起來~
文章推薦
◆跟資料打交道的人都得會的這8種資料模型,滿足工作中95%的需求
回顧十週入門數據分析系列文:
關注數據君的臉書:
我是「數據分析那些事」。常年分享數據分析乾貨,不定期分享好用的職場技能工具。按贊我的臉書,會有豐富資料包贈送唷!