強強聯手 華為昇騰全面支持DeepSeek-V4
【大公報訊】伴隨DeepSeek-V4發布,華為表示,昇騰(Ascend)一直同步支持DeepSeek系列模型,今次通過雙方芯模技術緊密協同,實現昇騰超節點全系列產品支持DeepSeek-V4系列模型。昇騰是華為自研的基於「達芬奇架構」的AI處理器系列(NPU),專注於高性能邊緣與雲端計算。
華為指出,昇騰950超節點重新定義長文本推理的性能天花板,實現DeepSeek V4-Pro 20ms和DeepSeek V4-Flash 10ms低時延推理。DeepSeek承認,現時V4-Pro版本的API訪問服務吞吐十分有限,直到下半年昇騰950超節點批量上市後,價格將會大幅下降。
寒武紀昨日亦宣布,已基於vLLM推理框架完成對DeepSeek最新開源模型的適配,模型發布當日即實現穩定運行,適配代碼已開源到GitHub社區。
針對DeepSeek-V4的新結構,寒武紀通過自研高性能融合算子庫Torch-MLU-Ops,對Compressor、mHC等模塊進行專項加速;利用BangC高性能編程語言,編寫稀疏/壓縮Attention、GroupGemm等熱點算子的極致優化Kernel,充分釋放硬件底層性能。

字號:

評論