
最近這幾年是人工智能技術在全球範圍內前所未有的普及之年。曾經似乎離普通人很遙遠的人工智能技術,如今已經進入每一個人的生活、每一個人的手機。不管你是用它來消磨時間,還是用它來提升工作效率,全社會都已經漸漸接受了AI進入自己的生活。
而且,AI大模型技術的發展日新月異,不斷地有新的技術和新的AI相關的名詞出現。生活中,筆者也越來越多地被身邊的小朋友或長輩問到一些AI名詞的意思。從GPT到MCP,它們到底是什麼意思?我們老百姓如何簡單而又準確地理解它們呢?
這裏,筆者整理了一些目前比較常見的AI相關名詞術語,希望能用大多數人都能理解的方式解釋給大家聽。
AI(Artificial Intelligence,人工智能)
人工智能的定義是像人一樣能學習和思考的計算機程序。人工智能的概念最早在1950年代就被提出。隨着技術的發展,AI逐漸變得越來越聰明。2000年後,隨着計算機處理速度變快,AI也因此可以處理更多數據,比如人臉識別、語音翻譯。2010年代深度學習革命徹底改變了技術格局,2014年生成對抗網絡(GAN)讓AI具備創作能力,2015年AlphaGo攻破圍棋領域。如今的AI不僅能處理圖像識別、語音翻譯等任務,更在創作領域大放異彩。
LLM(Large Language Model,大語言模型)
「大型語言模型」是利用大量文本數據訓練出來的語言模型,能夠理解和生成自然語言文本。這些大模型企業往往使用龐大的知識庫來訓練AI,讓它能回答複雜問題或寫文章。
2017年,Google發明了「Transformer」(一種讓AI學語言的技術)大語言模型從此開始通過訓練讓AI變得聰明。2018年,我們耳熟能詳的美國Open AI公司的GPT-1誕生,在當時,它只能寫一些簡單句子。如今,我們時常能聽到的GPT-4、DeepSeek-R1、Gemini2.5、Claude3.7等都屬於大語言模型。
預訓練(Pre-training)
和後訓練(Fine-tuning)
•預訓練是指使用一個大規模的、通用的數據集訓練AI大模型,使得模型能夠學習到一些通用的知識(如語言理解、圖像特徵等),這些知識可以在之後的不同任務中被進一步利用。
•後訓練(也叫微調)是在預訓練模型的基礎上,使用一個特定領域或任務相關的數據集對模型進行進一步訓練的過程。後訓練的目的是使得模型能夠適應目標任務,並在該任務上達到最佳的性能。
預訓練就像我們在小學初高中學習通用的基礎知識,而後訓練就像是我們在讀大學時,選擇一個專業,深度攻讀這個專業領域的知識。
(AI-Generated Content,AI生成內容)AIGC
AIGC是指由AI自動生成的文字、圖片、音樂、視頻等內容。比如輸入提示詞「畫一隻戴墨鏡的熊貓彈結他」,AI就能生成一張酷炫插畫;輸入「寫一篇關於月亮的童話」,它立刻編出有情節的故事。目前,這種技術是AI大模型被應用最為廣泛的領域之一,正逐漸改變人們的內容創作方式,從寫作業到做設計,甚至製作電影都能用到它。
1957年,計算機創作了第一首音樂《伊利亞克組曲》,雖然聽起來像隨機音符,但邁出了第一步。1966年,聊天機器人Eliza誕生,這時期的AI主要靠人類編寫的固定規則運行,像照着說明書搭積木,生成的內容簡單且不自然。隨着電腦性能提升,AI開始「自學成才」。2006年深度學習技術突破,讓AI能通過分析海量數據(比如十萬張照片)總結規律。2014年,科學家發明了「生成對抗網絡」(GAN):兩個AI互相比賽,一個負責生成假圖片,另一個負責抓假,直到假圖逼真到以假亂真。這種技術讓AI繪畫開始接近真人水平。2017年,谷歌推出的﹁Transformer﹂模型讓AI具備了理解長篇文章的上下文關係的能力,從此聊天機器人不再答非所問。2022年ChatGPT能流暢對話寫詩,DALL-E 2可根據文字生成高清圖像,Midjourney的AI繪畫甚至在國際美術比賽獲獎。最新的AI已經能「跨界創作」:輸入一段文字,同時生成配套的插畫、背景音樂和講解視頻。比如用AI製作科普動畫,只需描述內容,系統能夠自動完成分鏡、配音和剪輯。
AI Agent(AI代理/智能體)
「AI Agent」是指一種能夠自主執行任務、作出決策並與環境進行交互的人工智能系統或程序。簡而言之,它就是一個可以自己動腦自主完成工作的「數字員工」,不僅能聽懂你的需求,還能主動規劃、執行任務。比如你告訴它:「五一想帶家人去迪士尼玩」,它會自動查天氣、訂機票、推薦景點,甚至幫你生成一份帶地圖的旅行攻略。
AI Agent通常能夠在沒有人類干預的情況下執行任務,作出決策。這種自主性使得它們能夠在複雜和動態的環境中工作。它可以分析用戶的需求,並把它拆解成一個任務清單,然後一個個去嘗試完成任務,甚至時不時進行回顧和調整任務內容。它能夠感知其環境,獲取信息。這可以通過傳感器、數據輸入或其他方式實現,以便理解當前的狀態和情境。
AI Agent最大的一個特點就是:會使用工具。它能夠自主操作其他的軟件或工具去獲得它想要的信息或完成它設立的目標。最近備受矚目的Manus就是一個典型的AI Agent。
Prompt(提示詞)
所謂「提示詞」就是我們給AI的指令,告訴它我們想要什麼。過去我們給AI下達指令必須輸入嚴格的代碼(比如「翻譯:蘋果→apple」)。現在,我們可以直接以通過自然語言(比如「把這句話翻譯成英文」)的方式說出我們的要求,AI就能聽懂。
為了能夠向AI更好地下達指令,讓AI更清晰地理解我們的意圖以得到更接近甚至超越我們預期的結果,誕生了一個新的領域─Prompt Engineering(提示詞工程)。它的核心就是研究怎麼問AI問題,才能讓它給出最好的答案。如果你問「畫一隻貓」,AI可能畫得很簡單,大概率不會讓你滿意;但如果你說「畫一隻戴着蝴蝶結的橘色貓,在花園裏玩耍」,AI就能畫得更準確,甚至能夠給出讓你驚喜的結果。
MCP(Model Context Protocol,多模態大模型)
「Model Context Protocol」,即模型上下文協議,是由Anthropic公司於2024年底開源發布的,被譽為是AI大模型的標準化工具箱。我們可以把它理解為一種通信協議,就像互聯網時代的TCP / IP協議一樣,用於在不同的軟件,組件之間傳遞信息。
想像一下,你在網上購物,賣家需要將商品從倉庫發送到買家的地址。在這個過程中,快遞公司負責將商品從一個地點安全、準確地運送到另一個地點。同樣,MCP在軟件組件之間傳遞信息時,也扮演着類似的角色。
MCP負責在軟件組件之間傳遞信息。這些信息可以是數據、指令或其他任何需要在組件之間共享的內容。快遞公司有一套標準化的流程,以確保商品能夠安全、準確地送達。同樣,MCP也有一套標準化的規則和格式,以確保信息在軟件組件之間正確、高效地傳遞。快遞公司可以根據不同的客戶需求提供不同的服務,如加急、保價等。MCP同樣具有靈活性,可以根據不同的應用場景和需求進行調整和優化。隨着業務的發展,快遞公司可以擴展其服務範圍,覆蓋更多的地區和客戶。MCP也可以根據需要擴展其功能和應用範圍,以適應不斷變化的技術環境。通過MCP,可以實現軟件組件之間的協同工作,提高整個系統的效率和可靠性。(Artificial General Intelligence,通用人工智能)
AGI(Artificial General Intelligence,通用人工智能)
AGI是指一種能夠理解、學習和應用知識的人工智能系統(目前還沒有實現),其智能水平與人類相當或更高。與當前的人工智能不同,AGI具備更廣泛的認知能力,能夠在多種任務和領域中表現出靈活性和適應性。可以說,AGI就是我們目前使用的AI的終極形態─「無所不能」的人工智能。
AGI能夠處理各種類型的任務,而不僅僅是特定的、明確的任務。它可以在不同的領域中學習和應用知識,比如語言理解、邏輯推理、問題解決等。它具備自主學習的能力,能夠從經驗中學習並適應新的環境和挑戰,而不需要大量的人工干預或特定的訓練數據。
雖然AGI的主要目標是智能和認知能力,但一些研究者認為,AGI還可能具備一定的情感理解和社交智能,能夠與人類進行自然的互動。可能還具備一定程度的自我意識和反思能力,能夠理解自身的存在和狀態。它的發展在一定程度上引發了在倫理、安全和社會影響等方面的廣泛討論,因為它可能對社會、經濟和文化產生深遠的影響。
結 語
回望這幾年,人工智能技術如同春潮般湧進我們的生活,它已經從曾經遙不可及的科幻概念,變成如今在手機裏、工作中、創作中隨處可見的夥伴。AI正以驚人的速度重塑着世界的面貌,而我們需要牢牢跟上時代發展的節奏。希望今天給大家整理的這些AI相關的名詞解釋能夠幫助大家更清晰、更準確地理解人工智能技術。讓我們期待,隨着技術的不斷發展,人工智能將如何繼續改變我們的世界,以及我們如何在這場變革中找到自己的位置。
Vibe Coding(氛圍編程)
Vibe Coding是由前OpenAI研究員Andrej Karpathy於2025年提出的新型編程範式。其核心是通過自然語言與大型語言模型交互,讓AI生成代碼,使用者僅需專注於需求描述與創意實現,而非手動編寫代碼細節。它旨在讓編程變得更加直觀和有趣,尤其是對於那些沒有編程經驗的人。
曾經,編程是一種對於普通人而言門檻很高的技術,但Vibe Coding真正實現了讓「人人都是程序員」的轉變。如果你有一個想法,如今,你可以通過跟AI的對話快速把你的想法轉變成一個可用的應用程序。
Vibe Coding是一種具有創新性和潛力的編程方式,它為開發者提供一種更高效、便捷的開發體驗,尤其適合快速原型開發和非專業開發者。