電子報詳情頁

AI模型開源VS閉源

開 源

開源指的是發布的模型源碼開源、論文或技術文章開源、預訓練的參數開源,可以供研究人員和開發人員訪問和修改。

DeepSeek(深度求索)

•中國AI初創公司深度求索(DeepSeek)發布的開源模型,其最新版本R1以低成本實現新效能,引發全球關注。

Qwen(阿里巴巴)

•阿里巴巴集團研發,最新版為Qwen2.5。去年,Qwen2.5在全球最大的AI模型社區Hugging Face上,超越美國Meta旗下的Llama系列,成為全球下載量最多的開源模型。

Llama(Meta)

•Meta於2023年2月發布,最新版為Llama 3.1。Facebook創辦人朱克伯格稱,開源是AI積極發展的必要條件。

Gemma(谷歌)

•谷歌於去年2月發布,據稱性能超過Meta的Llama 2。此前,谷歌的AI模型(Gemini系列)均為閉源。

閉 源

閉源只提供API接口或網絡頁面訪問服務,一般由公司運營優化,服務分為免費版和收費版。

ChatGPT系列(OpenAI)

•由美國AI巨頭OpenAI開發,從GPT-1至GPT-4均為閉源,不公開技術細節,只能通過應用程序接口(API)使用。馬斯克曾公開嘲諷OpenAI(開放AI)應改名為「CloseAI(閉源AI)」。

Claude(Ahthropic)

•由OpenAI前高管創立的Anthropic研發,最新版本為Claude 3.5 Sonnet,被視為ChatGPT的有力競爭者。Claude系列同樣均為閉源模型,其技術報告並不提供具體的模型結構、訓練方法。

大公報整理

友情鏈接