DeepSeek發布了新的AI模型V3.1

![deepseek](http://img-cdn.gateio.im/social/moments-413db9a42e58f3549a3a69d6960cb975019283746574839201# DeepSeek發布新的AI模型v3.1

中國AI初創公司DeepSeek更新了其旗艦AI模型V3,並在聊天機器人中刪除了推理神經網路R1的提及。有關此事的報道來自SCMP。

公司在 WeChat 上宣布發布 V3.1。此更新將模型的上下文窗口擴展到 128,000 個令牌,使其在與用戶交互時能夠存儲更多信息。這個容量相當於大約 300 頁的書。

也注意到代幣使用的高效性。

![])http://img-cdn.gateio.im/social/moments-a3b33244d5fce041d05b086bade7acf6(數據:X.In Aider Polyglot 基準測試中,DeepSeek V3.1 的性能優於 Claude 4 Opus。

DeepSeek V3.1 在 Aider Polyglot 上擊敗 Claude 4 Opus

這使它成爲最佳的非TTC編碼模型,所有這些只需 ~$1 pic.twitter.com/QyJZnVRdVK

— Lisan al Gaib )@scaling01( 2025 年 8 月 19 日

V3.1 保持了生成速度與質量之間的平衡。它包含 6850 億個參數,並基於混合架構,確保在對話、推理和編程任務中具有高性能。

DeepSeek 移除了深度思考功能中的 R1 提及。在 SCMP 中推測這可能表明在開發預期的 R2 版本時遇到了困難。

人工智能初創公司DeepSeek在1月發布了面向推理的R1模型,吸引了廣泛關注。該模型在低資本投入下展現了高效能,因此專家們對在人工智能領域進行數十億美元投資的必要性以及行業的泡沫性產生了懷疑。

提醒一下,今年六月,中國一家初創公司開始招聘實習生,以標記醫療數據,旨在改善人工智能在醫院的應用。

DEEPSEEK-0.21%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)