9zxz.com首頁 導航導航
首頁 >  新聞 >  DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

DeepSeek的負擔能力是一個神話:革命性的AI實際上花費了16億美元

作者 : Bella 更新日期:Mar 21,2025

DeepSeek的新聊天機器人擁有令人印象深刻的介紹:“嗨,我被創建了,您可以問任何東西,並得到一個甚至可能讓您感到驚訝的答案。”這種AI是中國初創公司DeepSeek的產物,已迅速成為主要參與者,甚至導致NVIDIA的股價大幅下降。它的成功源於建築創新和培訓方法的獨特結合。

DeepSeek的模型通過幾個關鍵的技術進步來區分自己:

  • 多語預測(MTP):與傳統的單詞預測不同,MTP同時預測了多個單詞,從而提高了準確性和效率。
  • 專家的混合(MOE):該體系結構利用多個神經網絡來處理數據,加速培訓並改善整體性能。 DeepSeek V3使用256個神經網絡,為每個令牌處理任務激活8個。
  • 多頭潛在註意力(MLA):這種機制著重於最關鍵的句子元素,反复提取關鍵細節以最大程度地減少信息丟失並確保對輸入數據的細微理解。

DeepSeek測試

圖片:ensigame.com

DeepSeek最初僅使用2048 GPU,其強大的DeepSeek V3車型的培訓成本僅為600萬美元。但是,半分析顯示出更廣泛的基礎設施:大約50,000個NVIDIA HOPPER GPU,包括10,000 H800、10,000 H100和其他H20單元,分佈在多個數據中心。這代表了一筆總額約16億美元的服務器投資,運營費用估計為9.44億美元。

DeepSeek V3

圖片:ensigame.com

DeepSeek是中國對沖基金高級基金的子公司,擁有其數據中心,提供了對模型優化和更快創新實施的無與倫比的控制。它的自資助性質增強了敏捷性和決策。該公司還吸引了頂尖人才,一些研究人員每年收入超過130萬美元,主要是從中國大學招募的。

DeepSeek

圖片:ensigame.com

儘管DeepSeek最初的600萬美元培訓成本索賠似乎具有誤導性(僅涵蓋預培訓,不包括研究,改進,數據處理和基礎設施),但該公司已在AI開發方面投資了超過5億美元。與更大,更官僚的公司相比,其精益結構允許有效的創新。

DeepSeek

圖片:ensigame.com

DeepSeek的故事強調了一家資金充足,獨立的AI公司與行業巨頭競爭的潛力。但是,它的成功無疑與大量投資,技術突破和強大的團隊有關。雖然可以說革命預算效率的索賠被誇大了,但公司的成本仍然明顯低於競爭對手。例如,DeepSeek在R1上花費了500萬美元,而Chatgpt4的費用為1億美元。但是,它仍然比競爭對手便宜。

最新文章
  • 最佳的《星球大戰傳奇》書籍值得一讀2025年

    ​ 在迪斯尼巨大的40億美元收購盧卡斯電影的紀念意義,在前傳之前,甚至在原始《星球大戰》電影獲得了銀幕上,作家已經在遠遠超出了我們在電影中所看到的範圍。 《星球大戰》擴大了宇宙,後來更名

    作者 : Eric 看全部

  • 權力的遊戲:金斯射線在Steam上的早期進入

    ​ 《權力的遊戲:金斯羅》將於3月26日及早進入及早的訪問權限 - 目前在Steam上進行了策劃。這標誌著玩家體驗Netmarble對Westeros世界的第一個機會,這是一個吸引了全球觀眾的環境。首先在Steam上推出的決定是一個驚喜

    作者 : Zachary 看全部

  • 天空:燈光的孩子們開始了自己的奧運會,即勝利的比賽!

    ​ 準備在 *天空中進行一些友好的比賽:光明的孩子 *!勝利的比賽是在7月29日至8月18日舉行的,這為遊戲的迷人世界帶來了有趣的,以奧林匹克為主題的曲折。勝利比賽中發生了什麼?前往鳥舍村並進入C

    作者 : Amelia 看全部

專題
有史以來最好的冒險遊戲
有史以來最好的冒險遊戲TOP

我們策劃了有史以來最佳冒險遊戲的精選收藏,開始了難忘的冒險!在諸如Opus:Whispers的火箭之類的遊戲中,體驗令人興奮的遊戲玩法,您可以在這裡探索宇宙,並勇於噩夢(演示)的令人恐懼的氛圍。解決了Erinnern的難題。 Bullenhuser Damm。,在海洋之旅中發現隱藏的寶藏:隱藏的寶藏,在Elmwood小徑中逃脫可怕的情況,小學生逃生:邪惡的女巫,恐怖迷宮和恐怖故事2。在泳池房間中測試您的技能:隱藏的出口和征服無盡的城堡。潛入一個神秘,懸念和興奮世界 - 今天下載這些驚人的冒險遊戲!