【人工智能大戰】內地新創公司DeepSeek爆紅訓練成本比Meta一個主管薪水更低？OpenAI推網絡小助手Operator

Startup Inspiration Business News Instant News

By Ella Wan on 24 Jan 2025

Feature Reporter

人工智能開發戰一直是近年各地的熱話，而近期一間中國AI新創公司「深度求索（DeepSeek）」爆紅，其新推出的R1模型被指可媲美OpenAI的o1模型，惟成本卻極低，成為AI界一大黑馬。有自稱Meta員工的網民在匿名職場平台表示，DeepSeek為Meta內部帶來巨大壓力，訓練成本甚至比Meta一個主管薪水還要低，又指工程團隊正不惜代價拆解 DeepSeek技術。另一邊廂，OpenAI亦推出全新AI-Agent功能Operator，成為日常生活的網絡小助手。

「AI界拼多多」推R1模型同步開源多方面推理能力媲美OpenAI o1

中國AI新創公司「深度求索（DeepSeek）」，在2023年成立，總部設於中國浙江省杭州市，專攻開發AI大型語言模型，更有「AI界的拼多多」之稱。在去年12月，DeepSeek先推出了DeepSeek V3模型。至本月20日，再度發佈DeepSeek-R1，並同步開源模型，宣稱效能與OpenAI o1正式版對齊。消息一出，在全球AI界引起討論。

根據官方資料，R1模型在後訓練階段大規模使用強化學習技術，並在僅有極少標註資料的情況下，大幅提升模型推理能力。另外，官方公開數據顯示，R1模型在數學、程式碼、自然語言推理等任務上，效能均媲美OpenAI o1正式版。據報道指，DeepSeek的人工智能訓練預算僅為550萬美元（即港幣約4,283萬元），相較外國其他公司開發成本低得多。

官方更將R1模型訓練技術論文公開，表示希望可促進技術社群的交流及創新協作。開源倉庫更是完全開源，並不限於商用。

Meta內部壓力山大 Deepseek訓練成本比主管薪水還低

不過，這個橫空出世的黑馬卻為Meta帶來不少壓力。近日，匿名職場平台TeamBlind上，有自稱Meta員工的用戶發文抱怨，直指Deepseek 更早前發出的V3模型，令Meta內部陷入恐慌。他表示這一間「不知名（unknown）」、僅擁550萬訓練預算的中國公司，在V3模型的基準測試上讓Llama 4落後，並表示Meta內部工程師正瘋狂拆解Deepseek，試圖從中抄襲任何有價值的東西。

該員工又指，管理層正擔心如何解釋巨額開發成本，因為團隊內每一個主管的薪資均超過了訓練 V3所需的成本，又形容Deepseek讓事情變得可怕。

AI之戰未曾停 OpenAI推網絡小助手Operator

與此同時，人工智能的開發戰從未停止。昨日（23日），OpenAI推出全新AI代理Operator，目標是幫助人類自動完成網絡任務，成為你的網絡小助手。Operator由電腦使用代理程式 (CUA) 新模型提供支援，透過強化學習將GPT-4o視覺功能與高級推理相結合，經過訓練與按鈕、選單和文字欄位等圖形使用者介面（GUI）進行互動。