騰訊新語言模型上線 增強與用家互動
【大公報訊】騰訊混元發布Hy3 preview語言模型,並直接開源,此模型總參數295B,活化參數21B。從體量來看,它算不上業界最大,但在複雜推理、上下文學習、程式碼、智能體等能力上均實現了大幅提升。同時,其賣點在於聚焦中等規模的模型最佳化,力求以更低成本實現高效AI應用。據悉,混元團隊為Hy3 preview明確立下了三條鐵則:能力體系化、評測真實性、追求性價比。總結下來,「一定要讓智能用得起、用得好。」
現時騰訊擁有微信、遊戲、廣告、雲端服務等極為複雜的業務場景,Hy3 preview自開發時便強調結合一線業務開展測評,其效果也有望更加貼近工作生活中真實的難點痛點。舉例說,混元團隊與元寶進行了深度的協同研發,由此產出的Hy3 preview能理解用戶在旅行過程中預算的突然變化、進而調整行程規劃,也能在提問者心情不好時不一味推出建議,而是重在寬慰,提供更智能且更具「活人感」的交互體驗。
Hy3 preview發布後,迅速在騰訊元寶、CodeBuddy、WorkBuddy首發上線,微信公眾號、QQ瀏覽器、QQ、騰訊新聞等十餘個主線產品也陸續接入。
花旗:定價具競爭力
花旗發表報告表示,騰訊的新模型Hy3預覽版,這是一款MoE(混合專家)架構語言模型,總參數量達2950億,上下文窗口256k,在複雜推理及代理能力方面有顯著提升。Hy3採取「務實」方針,專注於現實世界應用而非實驗室評分,並聲稱推理效率提升40%,定價具競爭力。
該行認為,儘管名為「預覽版」,但模型已立即整合至騰訊廣泛的產品線,包括元寶、ima、CodeBuddy、WorkBuddy、QQ、騰訊文檔、騰訊地圖、微信公眾賬號及和平精英等,顯示模型已準備好用於解決現實問題。模型專注於實用及具成本效益的部署,屬正面戰略方向。該行相信,隨着官方Hy3正式版或後續3.1/3.2版本推出,模型能力有望進一步提升。

字號:

評論