<center id="kgssg"></center>

<center id="kgssg"><wbr id="kgssg"></wbr></center>

<noscript id="kgssg"><option id="kgssg"></option></noscript><optgroup id="kgssg"><wbr id="kgssg"></wbr></optgroup><optgroup id="kgssg"></optgroup>

<optgroup id="kgssg"><div id="kgssg"></div></optgroup>

<center id="kgssg"><div id="kgssg"></div></center>

<center id="kgssg"></center>

搜索

萬億參數！元腦企智一體機率先支持Kimi K2大模型

浪潮信息

2025-07-21 16:12 9630

北京2025年7月21日 /美通社/ -- 浪潮信息宣布元腦企智一體機已率先完成對Kimi K2 萬億參數大模型的適配支持，并實現單用戶70 tokens/s的流暢輸出速度，為企業客戶高效部署應用大模型提供高處理性能和完善的軟件工具平臺支持。

Kimi K2是月之暗面推出的開源萬億參數大模型，創新使用了MuonClip優化器進行訓練，大幅提升了模型的學習效率。K2在代碼生成、數學推理、Agent多步驟任務上展現出領先能力，評測指標達到業界領先水平。自發布以來，K2在開發者和研究社區引起廣泛關注，迅速獲得在編碼輔助和Agent驅動自動化任務中的部署應用。

Kimi K2的模型總參數量達1萬億，激活參數為320億。K2使用混合專家（MoE）模型結構，較DeepSeek V3采用了更大的參數量和更多的專家數。K2模型1萬億的參數量對AI計算系統提出至少1TB的顯存容量需求，384個路由專家所帶來的專家負載不均衡性對推理速度有很大影響。目前業界可公開訪問的K2 API的輸出速度一般低于20 tokens/s，這樣較低的性能對于編程或Agent類場景很不友好，會嚴重影響用戶體驗。Kimi K2憑借其為智能體任務設計的架構和優秀的智能體驗，展現出巨大的應用潛力，但提升推理速度和輸出穩定性是其成為可信賴的生產力工具需要解決的核心挑戰。

元腦企智一體機采用元腦服務器NF5688G7作為算力底座，其搭載FP8計算引擎，配備1128GB HBM3e高速顯存，單臺服務器即可支持K2 萬億參數全量模型部署。NF5688G7服務器具備900GB/s的GPU P2P帶寬，為Kimi K2提供了專家間高速并行通信，最大化并行效率。該服務器可支持3200Gbps的RDMA擴展網絡，為預填充-解碼分離部署和大規模專家并行預留了充足的擴展空間。

浪潮信息已完成元腦企智一體機對K2的適配，支持64K上下文長度和多路用戶實時并發訪問。基于SGLang推理框架，通過減少MoE對齊塊大小內核的小批量模式開銷和fused_moe的內存消耗，并復用deepGEMM等高效算子，實現單用戶并發下輸出速度超過70 tokens/s，25用戶并發時每用戶輸出速度超過25 tokens/s。優化后的計算性能可保證用戶在進行復雜的代碼生成、長文本書寫或Agent調用時，能夠獲得流暢、低延遲的交互體驗。

SGLang啟動K2推理服務，用戶交互時的解碼速度

元腦企智一體機提供了元腦企智（EPAI）平臺與K2大模型的無縫集成，為企業用戶提供了一套軟硬件協同優化、開箱即用的端到端大模型私有化部署解決方案。通過元腦企智平臺，企業可利用低代碼、可視化界面，便捷地進行數據準備、模型微調、知識檢索（RAG）和智能體（Agent）構建。

元腦企智一體機已成功部署于金融、制造、能源、醫療等多個關鍵行業，幫助企業快速、安全、經濟地構建專屬大模型應用，加速產業智能化轉型步伐。

浪潮信息是全球領先的IT基礎設施產品、方案和服務提供商，通過發展新一代以系統為核心的計算架構，打造開放、多元、綠色的元腦智算產品和方案。浪潮信息致力于AI計算平臺、資源平臺和算法平臺的研發創新，并通過元腦生態攜手領先伙伴，加速人工智能的創新和應用落地。

消息來源：浪潮信息

全球TMT

微信公眾號“全球TMT”發布全球互聯網、科技、媒體、通訊企業的經營動態、財報信息、企業并購消息。掃描二維碼，立即訂閱！

關鍵詞：財經/金融電腦軟件電腦/電子互聯網技術電信業人工智能云計算/物聯網

企業新聞室更多

攜手元腦伙伴共創"伙伴主導"合作新模式！浪潮信息增值渠道精英俱樂部正式成立

2026-05-26 10:42

3098

智能體發布前不能遺漏的一步！元腦企智EPAI：用量化評估補齊上線前關鍵環節

2026-05-11 10:58

5417

浪潮信息AIStation推出企業Token服務平臺！

2026-04-28 17:11

4987

浪潮信息直播發布業界首個企業級OpenClaw方案"企千蝦"

2026-04-03 20:11

9378

浪潮信息AIStation 5.4發布：打造企業級Agent算力底座，已支持OpenClaw

2026-03-04 17:15

8890

跑通 "產研用" 閉環，佛山南海構建 "AI+ 醫療衛生" 新生態，加速基層實踐推廣

2026-01-29 16:09

8000

相關新聞

浪潮信息：元腦企智DeepSeek一體機將舉辦生態伙伴推介體驗會

2025-03-07 16:24

6626

詳解：本土AI超節點元腦SD200如何率先實現token生成速度8.9ms

2025-11-10 11:19

10025

浪潮信息發布"元腦SD200"超節點，面向萬億參數大模型創新設計

2025-08-08 21:07

9529

浪潮信息劉軍：速度就是金錢，AI超節點的商業價值核心是Token交互速度

2025-11-06 17:35

6324

浪潮信息首席AI戰略官劉軍

浪潮信息：推出CPU推理服務器支持DeepSeek和QwQ，元腦加速AI普及

2025-03-20 10:28

7538

浪潮信息元腦R1服務器支持開源框架SGLang，單機DeepSeek 671B并發過千

2025-02-26 18:53

6956

行業新聞

云尖沐曦號衛星成功入軌，國產智算產業鏈開啟太空計算新實踐

2026-07-25 08:30

868

"云尖沐曦号"卫星（吉天星A-04星）搭载力箭一号遥十五运载火箭成功发射入轨

大華股份榮膺浙江省標準創新重大貢獻獎

2026-07-24 17:52

975

AI正在重塑工作方式：Adecco Group白皮書揭示了混合型勞動力協調的必要性

2026-07-23 20:36

1613

COMSOL主題日系列活動生物醫療專場順利舉辦

2026-07-24 18:00

976

Quantinuum任命首席法務官和首席人才官

2026-07-24 04:57

667

神雲科技搭載第 6 代 AMD EPYC? 服務器處理器，推進智能體 AI (Agentic AI) 基礎設施

2026-07-24 02:30

973

神雲科技搭载第 6 代 AMD EPYC™ 服务器处理器，推进智能体 AI (Agentic AI) 基础设施

<center id="kgssg"></center>

<center id="kgssg"><wbr id="kgssg"></wbr></center>

<noscript id="kgssg"><option id="kgssg"></option></noscript><optgroup id="kgssg"><wbr id="kgssg"></wbr></optgroup><optgroup id="kgssg"></optgroup>

<optgroup id="kgssg"><div id="kgssg"></div></optgroup>

<center id="kgssg"><div id="kgssg"></div></center>

<center id="kgssg"></center>

久久久亚洲欧洲日产国码二区