Free性欧美Hd另类_精品亚洲欧美视频在线观看_freesex欧美喷水_字幕av在线_久久久久久国产免费_伊人5566

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 人工智能 > DeepSeek爆火,春節C位出道

DeepSeek爆火,春節C位出道

2025-02-05 17:14:44 | 來源:企業IT培訓
春節期間

DeepSeek 無疑是最火爆的話題之一

在 DeepSeek 旗下大模型

DeepSeek-R1 “爆火”后

多個云平臺宣布上線 DeepSeek 旗下模型

圖片

2025 年的春節無疑已被 DeepSeek 霸屏。

過去三年每年的春節都有一次重磅的 AI 討論:2023 年是 ChatGPT、2024 年是 Sora,這兩股風潮都是由 OpenAI 掀起,而 2025 年則是 DeepSeek 的 V3 與 R1。

除夕當天 1 月 28 日,DeepSeek 更是趁熱發布了文生圖模型 Janus-Pro,但后者沒有 V3 與 R1 吸引的關注大,原因在于其沒有像前者一樣動搖了過去基座大模型的「奇跡」來源:算力。

DeepSeek V3 的參數規模是 6710 億,訓練成本不到 560 萬美元,訓練時長在 280 萬 GPU 小時。相比之下,GPT-4o 的訓練成本約為 1 億美元,Llama 3 405B 訓練時長則為 3080 萬 GPU 小時。

Meta 的 Llama 3 是用 16000 張 H00 訓練,此前還計劃在 2024 年囤卡 60 萬張英偉達 GPU 去做模型升級;馬斯克創立的 XAI 甚至囤卡 10 萬張 H100 建數據中心。

根據媒體報道,DeepSeek V3 與 R1 發布后,Meta 在內的多家硅谷企業受到極大震撼,并開始質疑以往 OpenAI「大力出奇跡」的成功方法論,引起硅谷多家科技巨頭的暴跌,比如英偉達一夜之間被干掉 4.3 萬億市值,相當于騰訊與美團兩家中國互聯網巨頭加起來的市值。

對于 DeepSeek 帶來的震撼,業界不難聯想到「漂亮國將出臺一系列制裁政策」等等往日常規反應。

值得注意的是,在 DeepSeek 給硅谷帶來地震的不久前,1 月 15 日,美國才剛將中國最早的大模型創業公司「智譜 AI」列入實體清單。AI 1.0 時代,商湯、曠視等企業也被美國列入實體清單。被列入實體清單的一大掣肘就是難以購買海外英偉達生產制造的 GPU,其在短期內仍是基座大模型訓練升級的一個重要條件。但 DeepSeek 的崛起證明了:

根據相關消息,DeepSeek 至今仍未計劃對外融資,其主要依托幻方與梁文鋒個人輸血,但對中國其他大模型公司的融資與戰略也將帶來不小的震撼。據筆者觀察,春節期間不僅硅谷動蕩,國內其他幾家主流的大模型公司也在加班拆解 DeepSeek 的模型秘籍。

DeepSeek 的崛起,肉眼可見將從以下幾個角度影響中國大模型的競爭:

首先是技術創新的天花板被拉高。

DeepSeek 不是第一家提出「要在 OpenAI 以外創新」的大模型團隊,此前其他國產大模型團隊的創始人也提出過相似的觀點,但 DeepSeek 是第一家通過發布新技術、身體力行踐行了這一觀點的團隊。

V3 證明了訓練千億基座大模型的成本可以進一步將下降,R1 的獨創(如完全用強化學習替代 SFT)證明了 OpenAI 并不是唯一能夠提出 AGI 解法的公司。盡管 GPT-5 遲遲未發布、大模型一度被認為已停滯不前,但 DeepSeek 在近兩個月的研究突破表明:大模型的潛在技術空間仍然是非常大的。

放棄預訓練的團隊,或許是資源不足,也或許是技術創新力不夠。這也驗證了大模型的技術創新在短期內存在高壁壘,應心存敬畏。

其次是「高效訓練」的概念將得到重視。

在當前的第一梯隊大模型公司中,「高效訓練」并不占主流觀點。例如,MiniMax 的大模型雖然也是采用 MoE 架構,但在其他高效訓練的方法創新上不見明顯發力。反而是第二梯隊的面壁智能一度通過端側模型引起業內關注。但在 DeepSeek 受追捧前,即使面壁智能、乃至一切企圖顛覆 Transformer 架構的基座模型研究都不受重視。

此前大算力訓練是基座模型廠商融資與構建壁壘的競爭砝碼,但 DeepSeek V3 的參數規模為 6710 億、訓練成本卻不足 560 萬美金,過去大算力出奇跡的粗放方式也受到了質疑。接下來,高效模型不僅是 DeepSeek、面壁與通義等開源擁躉的追求,在其他模型團隊的優先級上也會更加靠前。

高效訓練的目標在于用更小的參數規模、更小的訓練成本來實現更高的性能。以面壁小鋼炮系列為例:MiniCPM 3.0 只有 4B 參數就能帶來超越 GPT-3.5 的性能,量化后的內存僅 2GB;MiniCPM-o 2.6 的參數規模僅 8B 就逼近了 GPT-4o,而且實現了實時流式的全模態看聽說,在“真視頻”等很多功能上達到了以端勝云的效果。

DeepSeek 有訓練條件,此前傳出有一萬張卡,其做法是先做大再做小,而面壁智能由于融資與算力所限,并沒有采取先做大再做小的方法,而是直接做端側小模型。蒸餾后的小模型更擅長特定任務,在部分任務上的表現或不如通用模型,但在個人移動設備的部署上已綽綽有余。未來或許可以結合定制化芯片開拓出新的市場。

降本三家企業同日宣布接入deepSeek

1 月 31 日,英偉達、亞馬遜和微軟這三家美國科技巨頭在同一天宣布接入由中國企業開發的先進大語言模型 DeepSeek-R1。

其中,英偉達宣布 NVIDIA NIM 已經可以使用 DeepSeek-R1 模型。同日,亞馬遜也表示 DeepSeek-R1 模型可以在 Amazon Web Services 上使用。微軟也在同一天宣布將 DeepSeek-R1 正式納入 Azure AI Foundry,成為該企業級 AI 服務平臺的一部分。

DeepSeek-R1 被公認為是目前最先進的大語言模型之一,能夠提供高質量的語言處理能力,這對于希望在其產品中集成最新 AI 功能的企業來說極具吸引力。

來源:應用觀察

圖片
標簽: DeepSeek
主站蜘蛛池模板: 美女脱18以下禁止看尿口 | 豪放女大兵在线播放 | 最新日韩欧美在线综合网 | 久久免费视老师机影片 | 精品国产一区二区亚洲人成毛片 | 偷自拍亚洲综合在线 | 亚洲AV无码兔费综合 | 中文字幕成人免费 | 绯色一区二区三区不卡少妇 | 青青草娱乐视频 | 成午夜精品一区二区三区 | 婷婷综合缴情亚洲AV | 99re在线视频免费观看 | 未发育成型小奶头毛片av | 天天躁夜夜躁狠狠躁婷婷 | www.欧美视频| 网上免费看毛片 | 春药刺激国产老富婆露脸 | 中文字幕在线网 | 欧美69精品久久久久久不卡 | 色拍拍在线精品视频 | 中文字幕制服丝袜一区二区三区 | 成人一道本在线 | 三级视频在线观看 | 欧美xxxx日本和非洲 | 99国内精品久久久久久久夜夜嗨 | 国内a∨免费播放 | 午夜成人毛片免费观看蜜桔视频 | 最新国产亚洲亚洲精品a | 国产美女视频网站免费 | 天天操天天操天天操天天操 | 800av凹凸视频在线观看 | 国产精品一区二三区 | 澳门av一区| 青青免费视频在线 | 久久成年人 | CHINESE国产AV巨作VIDEOS | 日本美国大片免费视频播放器 | 真人无码作爱免费视频 | 综合久久2019 | 99福利影院|