前言
你以為 ChatGPT 在「思考」,其實它每次只是在預測下一個最可能出現的字。這個看似簡單的機制,卻是所有大型語言模型(LLM)的核心運作原理。這篇文章會用三個概念,帶你從零開始看懂 LLM 到底在做什麼。
1. LLM 在做什麼:它在玩文字接龍
其實 LLM 並不「理解」人類的語言,它只是在預測我們想要什麼答案,並把最有可能的結果提供給我們。換句話說,LLM 做的事情就像文字接龍,根據你給的文字,猜出後面最可能接的內容。這個能力來自於 LLM 在訓練階段學習了大量的文字資料,從中歸納出語言的規律與模式。

舉例來說,當你輸入「我想訂餐廳」,LLM 不會真的「懂」你的需求,而是預測出「你可能想要的回應」,像是詢問你的偏好、地點或時間。這個預測的過程,就是 LLM 運作的核心。換句話說,你講得越清楚,它就越容易給你正確答案。
由於 LLM 的回答本質上是機率預測,它的輸出並不是固定的。你問它同一個問題,每次得到的答案可能都會有些不同,像是用詞、舉例、甚至結論都可能出現差異。

這代表 LLM 給你的答案不一定是「正確答案」,而是這一次「預測出來的答案」。因此,在使用 LLM 時,保持一定的懷疑態度很重要。它的回覆值得參考,但不應直接照單全收,尤其是涉及事實、數據或專業判斷的情境。
2. LLM 的記憶:每次對話都是新的開始
不知道大家有沒有看過《即使,這份戀情今晚就會從世界上消失》這部電影,電影中的女主角在每天睡醒後,都會失去前一天的記憶,她完全不記得昨天發生的事情,只能依賴她手寫的「筆記本」來回憶事情。而 LLM 也是如此,每次對話結束後,它完全不記得你們上次聊了什麼,只能靠它的「筆記本」——也就是 context——來知道你們之前說過什麼。
這也是為什麼每次開啟新對話視窗,你都必須重新說明背景,它才能給出符合你需求的回應。

實際上,context 是由四個部分組成:system prompt(給 LLM 的背景設定,例如告訴它扮演什麼角色)、user prompt(你這次輸入的問題)、history(你們之前的對話紀錄)、以及 LLM reply(它之前的回覆)。這四個部分共同決定了,LLM 在每次回覆時所能參考的全部資訊。理解這個組成,能幫助你更有意識地控制 LLM 的輸出品質。

舉例來說,你告訴 LLM 它是一位旅遊專家,這其實就是在設定 system prompt;接著你輸入「幫我規劃三天日本京都自由行」,這部分是 user prompt;你們之前討論過的地點、預算和偏好,這些則是 history;而 LLM 上一輪給的建議則是 LLM reply。這四個部分合在一起,就是 LLM 所能「記得」的全部內容。
3. 通用 LLM 與專業 LLM:從小狗到導盲犬
要理解通用 LLM 和專業 LLM 的差別,可以用小狗來比喻。通用 LLM 就像一隻剛出生的小狗,經過基本訓練後學會握手、坐下、上廁所等各種技能。它接觸的資料範圍很廣,能夠處理寫作、問答、程式、數學等各種任務。GPT-5 和 Claude 就是典型的通用 LLM,你可以問它們幾乎任何問題。

專業 LLM 則像是朝特定領域訓練的小狗。導盲犬、搜救犬、緝毒犬都是從小狗開始培養,但牠們的訓練目標非常明確,專注在某一項任務上。同樣的道理,GPT-5.2-Codex 是專為程式任務優化的 LLM,Med-PaLM 2 專注在醫療問答,BloombergGPT 則是針對金融資料訓練,在各自的領域表現都比通用 LLM 更精準。

選擇通用 LLM,還是專業 LLM,取決於你的需求。如果你需要處理各種不同的任務,通用 LLM 是更靈活的選擇;如果你的工作高度集中在某個領域,專業 LLM 往往能給你更準確、更可靠的結果。對大多數初學者來說,從通用 LLM 開始是最務實的選擇,等熟悉了使用方式,再根據需求評估是否換用專業工具。
結論
LLM 不是神燈精靈,而是一個有規則且有限制的工具人。
掌握這些基本概念,最直接的收穫是學會「怎麼問」。給出清楚的指令、提供足夠的 context、選對合適的工具,這三件事決定了你能從 LLM 身上得到多少。LLM 本身不會變聰明,但你的使用方式可以。
本次分享就到這邊,希望你喜歡這次的內容! 如果有任何關於 LLM 的想法,歡迎留言跟我們一起討論! 我是Pablo,我們下次見👋
參考文獻
-
IMDb. (2022). Even If This Love Disappears from the World Tonight. https://www.imdb.com/title/tt21115444/
-
OpenAI. (2025). Introducing GPT-5. https://openai.com/index/introducing-gpt-5/
-
OpenAI. (2025). Introducing GPT-5.2-Codex. https://openai.com/index/introducing-gpt-5-2-codex/
-
Singhal, K., Azizi, S., Tu, T., et al. (2023). Towards expert-level medical question answering with large language models. arXiv. https://arxiv.org/abs/2305.09617
-
Wu, S., Irsoy, O., Lu, S., Dabravolski, V., Dredze, M., Gehrmann, S., Kambadur, P., Rosenberg, D., & Mann, G. (2023). BloombergGPT: A large language model for finance. arXiv. https://arxiv.org/abs/2303.17564
-
今天比昨天厲害(2023)。什麼是大型語言模型?LLM 是什麼?| AI 基礎觀念-2。https://www.youtube.com/watch?v=ERr6J1bDXUI
-
Justin Tsai(2025)。LLM 與生成式 AI 一次看懂:原理、差異與應用懶人包。https://www.awoo.ai/zh-hant/blog/llm-genai/
-
鬍子 Jack(2024)。LLM(Large Language Model)是什麼?揭秘 AI 智慧背後的技術!。https://www.youtube.com/watch?v=iMFjDYmC36U
-
Hung-yi Lee(2026)。解剖小龍蝦 — 以 OpenClaw 為例介紹 AI Agent 的運作原理。https://www.youtube.com/watch?v=2rcJdFuNbZQ