【人工智能大戰】內地新創公司DeepSeek爆紅 訓練成本比Meta一個主管薪水更低?OpenAI推網絡小助手Operator
人工智能開發戰一直是近年各地的熱話,而近期一間中國AI新創公司「深度求索(DeepSeek)」爆紅,其新推出的R1模型被指可媲美OpenAI的o1模型,惟成本卻極低,成為AI界一大黑馬。有自稱Meta員工的網民在匿名職場平台表示,DeepSeek為Meta內部帶來巨大壓力,訓練成本甚至比Meta一個主管薪水還要低,又指工程團隊正不惜代價拆解 DeepSeek技術。另一邊廂,OpenAI亦推出全新AI-Agent功能Operator,成為日常生活的網絡小助手。
「AI界拼多多」推R1模型同步開源 多方面推理能力媲美OpenAI o1
中國AI新創公司「深度求索(DeepSeek)」,在2023年成立,總部設於中國浙江省杭州市,專攻開發AI大型語言模型,更有「AI界的拼多多」之稱。在去年12月,DeepSeek先推出了DeepSeek V3模型。至本月20日,再度發佈DeepSeek-R1,並同步開源模型,宣稱效能與OpenAI o1正式版對齊。 消息一出,在全球AI界引起討論。
根據官方資料,R1模型在後訓練階段大規模使用強化學習技術,並在僅有極少標註資料的情況下,大幅提升模型推理能力。另外,官方公開數據顯示,R1模型在數學、程式碼、自然語言推理等任務上,效能均媲美OpenAI o1正式版。據報道指,DeepSeek的人工智能訓練預算僅為550萬美元(即港幣約4,283萬元),相較外國其他公司開發成本低得多。
官方更將R1模型訓練技術論文公開,表示希望可促進技術社群的交流及創新協作。開源倉庫更是完全開源,並不限於商用。
Meta內部壓力山大 Deepseek訓練成本比主管薪水還低
不過,這個橫空出世的黑馬卻為Meta帶來不少壓力。近日,匿名職場平台TeamBlind上,有自稱Meta員工的用戶發文抱怨,直指Deepseek 更早前發出的V3模型,令Meta內部陷入恐慌。他表示這一間「不知名(unknown)」、僅擁550萬訓練預算的中國公司,在V3模型的基準測試上讓Llama 4落後 ,並表示Meta內部工程師正瘋狂拆解Deepseek,試圖從中抄襲任何有價值的東西。
該員工又指,管理層正擔心如何解釋巨額開發成本,因為團隊內每一個主管的薪資均超過了訓練 V3所需的成本,又形容Deepseek讓事情變得可怕。
AI之戰未曾停 OpenAI推網絡小助手Operator
與此同時,人工智能的開發戰從未停止。昨日(23日),OpenAI推出全新AI代理Operator,目標是幫助人類自動完成網絡任務,成為你的網絡小助手。Operator由電腦使用代理程式 (CUA) 新模型提供支援,透過強化學習將GPT-4o視覺功能與高級推理相結合,經過訓練與按鈕、選單和文字欄位等圖形使用者介面(GUI)進行互動。
根據官方資料,目前功能可在美國多個地區使用。只要使用自己的瀏覽器,Operator就可以查看網頁,並透過鍵入、點擊和滾動等執行任務,例如可幫助人類填寫表格、訂購雜貨,甚至創建表情包等,為我們節省日常任務時間。不過官方亦表示,Operator目前是為研究預覽版,意味著其存在局限性。
近年科技巨頭對人工智能開發的競爭十分激烈,加上如DeepSeek一樣的不少新創「黑馬」追上,相信未來人工智能的進步和應用將推展得更快。