LLM 其實在做文字接龍：三個概念帶你看懂大型語言模型

前言

你以為 ChatGPT 在「思考」，其實它每次只是在預測下一個最可能出現的字。這個看似簡單的機制，卻是所有大型語言模型（LLM）的核心運作原理。這篇文章會用三個概念，帶你從零開始看懂 LLM 到底在做什麼。

1. LLM 在做什麼：它在玩文字接龍

其實 LLM 並不「理解」人類的語言，它只是在預測我們想要什麼答案，並把最有可能的結果提供給我們。換句話說，LLM 做的事情就像文字接龍，根據你給的文字，猜出後面最可能接的內容。這個能力來自於 LLM 在訓練階段學習了大量的文字資料，從中歸納出語言的規律與模式。

文字接龍示意圖（Google Nano Banana 2）

舉例來說，當你輸入「我想訂餐廳」，LLM 不會真的「懂」你的需求，而是預測出「你可能想要的回應」，像是詢問你的偏好、地點或時間。這個預測的過程，就是 LLM 運作的核心。換句話說，你講得越清楚，它就越容易給你正確答案。

由於 LLM 的回答本質上是機率預測，它的輸出並不是固定的。你問它同一個問題，每次得到的答案可能都會有些不同，像是用詞、舉例、甚至結論都可能出現差異。

向 LLM 重複提問的示意圖（Google Nano Banana 2）

這代表 LLM 給你的答案不一定是「正確答案」，而是這一次「預測出來的答案」。因此，在使用 LLM 時，保持一定的懷疑態度很重要。它的回覆值得參考，但不應直接照單全收，尤其是涉及事實、數據或專業判斷的情境。

2. LLM 的記憶：每次對話都是新的開始

不知道大家有沒有看過《即使，這份戀情今晚就會從世界上消失》這部電影，電影中的女主角在每天睡醒後，都會失去前一天的記憶，她完全不記得昨天發生的事情，只能依賴她手寫的「筆記本」來回憶事情。而 LLM 也是如此，每次對話結束後，它完全不記得你們上次聊了什麼，只能靠它的「筆記本」——也就是 context——來知道你們之前說過什麼。

這也是為什麼每次開啟新對話視窗，你都必須重新說明背景，它才能給出符合你需求的回應。

筆記本示意圖（Google Nano Banana 2）

實際上，context 是由四個部分組成：system prompt（給 LLM 的背景設定，例如告訴它扮演什麼角色）、user prompt（你這次輸入的問題）、history（你們之前的對話紀錄）、以及 LLM reply（它之前的回覆）。這四個部分共同決定了，LLM 在每次回覆時所能參考的全部資訊。理解這個組成，能幫助你更有意識地控制 LLM 的輸出品質。

context 組成示意圖（Google Nano Banana 2）

舉例來說，你告訴 LLM 它是一位旅遊專家，這其實就是在設定 system prompt；接著你輸入「幫我規劃三天日本京都自由行」，這部分是 user prompt；你們之前討論過的地點、預算和偏好，這些則是 history；而 LLM 上一輪給的建議則是 LLM reply。這四個部分合在一起，就是 LLM 所能「記得」的全部內容。

3. 通用 LLM 與專業 LLM：從小狗到導盲犬

要理解通用 LLM 和專業 LLM 的差別，可以用小狗來比喻。通用 LLM 就像一隻剛出生的小狗，經過基本訓練後學會握手、坐下、上廁所等各種技能。它接觸的資料範圍很廣，能夠處理寫作、問答、程式、數學等各種任務。GPT-5 和 Claude 就是典型的通用 LLM，你可以問它們幾乎任何問題。

通用 LLM 示意圖（聯合報）

專業 LLM 則像是朝特定領域訓練的小狗。導盲犬、搜救犬、緝毒犬都是從小狗開始培養，但牠們的訓練目標非常明確，專注在某一項任務上。同樣的道理，GPT-5.2-Codex 是專為程式任務優化的 LLM，Med-PaLM 2 專注在醫療問答，BloombergGPT 則是針對金融資料訓練，在各自的領域表現都比通用 LLM 更精準。

專業 LLM 示意圖（中國時報）

選擇通用 LLM，還是專業 LLM，取決於你的需求。如果你需要處理各種不同的任務，通用 LLM 是更靈活的選擇；如果你的工作高度集中在某個領域，專業 LLM 往往能給你更準確、更可靠的結果。對大多數初學者來說，從通用 LLM 開始是最務實的選擇，等熟悉了使用方式，再根據需求評估是否換用專業工具。

結論

LLM 不是神燈精靈，而是一個有規則且有限制的工具人。

掌握這些基本概念，最直接的收穫是學會「怎麼問」。給出清楚的指令、提供足夠的 context、選對合適的工具，這三件事決定了你能從 LLM 身上得到多少。LLM 本身不會變聰明，但你的使用方式可以。

本次分享就到這邊，希望你喜歡這次的內容！如果有任何關於 LLM 的想法，歡迎留言跟我們一起討論！我是Pablo，我們下次見👋

參考文獻

IMDb. (2022). Even If This Love Disappears from the World Tonight. https://www.imdb.com/title/tt21115444/
OpenAI. (2025). Introducing GPT-5. https://openai.com/index/introducing-gpt-5/
OpenAI. (2025). Introducing GPT-5.2-Codex. https://openai.com/index/introducing-gpt-5-2-codex/
Singhal, K., Azizi, S., Tu, T., et al. (2023). Towards expert-level medical question answering with large language models. arXiv. https://arxiv.org/abs/2305.09617
Wu, S., Irsoy, O., Lu, S., Dabravolski, V., Dredze, M., Gehrmann, S., Kambadur, P., Rosenberg, D., & Mann, G. (2023). BloombergGPT: A large language model for finance. arXiv. https://arxiv.org/abs/2303.17564
今天比昨天厲害（2023）。什麼是大型語言模型？LLM 是什麼？| AI 基礎觀念-2。https://www.youtube.com/watch?v=ERr6J1bDXUI
Justin Tsai（2025）。LLM 與生成式 AI 一次看懂：原理、差異與應用懶人包。https://www.awoo.ai/zh-hant/blog/llm-genai/
鬍子 Jack（2024）。LLM（Large Language Model）是什麼？揭秘 AI 智慧背後的技術！。https://www.youtube.com/watch?v=iMFjDYmC36U
Hung-yi Lee（2026）。解剖小龍蝦 — 以 OpenClaw 為例介紹 AI Agent 的運作原理。https://www.youtube.com/watch?v=2rcJdFuNbZQ