Hero Image
RAG

RAG Retrieval-Augmented Generation RAG(檢索增強生成)是一種架構模式。 在 LLM 生成答案前,先從外部知識庫檢索相關資料,再將檢索結果提供給模型作為上下文,提升回答的正確性、可控性與即時性。 LLM 的本質:條件機率模型(Conditional Probability Model) 定義 大型語言模型(LLM)的核心任務只有一個:在給定前文條件下,預測下一個 token 的機率分佈。 數學形式為: P(token_t | token_1 … token_{t-1}) 表示在給定前文 token 的情況下,模型預測下一個 token 的機率。 這個機率分佈是由模型內部的所有參數(weights)共同決定的。 這些參數並不儲存任何可直接查詢的知識內容,而是隱式地編碼了大量語言片段之間的統計關聯與結構模式。 LLM 並不具備「查詢」、「記憶文件」或「事實驗證」能力。 LLM「知識」從何而來 X LLM 沒有文件 X LLM 沒有資料表 X LLM 沒有條目式知識 O 參數空間中所編碼的統計關聯結構 壓縮後的語言世界模型 訓練階段:把世界「壓縮」成參數,訓練資料(書籍、文件、程式碼、維基百科)僅用於不斷調整模型參數,強化 token 與 token 之間的關聯機率 資料不會被儲存,僅留下統計痕跡。 小模型仍「看起來懂很多」 多數人類知識是低熵、可高度壓縮的 技術文件與教科書高度模板化 (token 關聯穩定) 常識與基礎知識在語料中反覆出現 因此:只需要很少參數就能學到這種穩定規律,LLM 並非記住內容,而是學會「怎樣說才像懂」。 Transformer 擅長「關聯建模」 世界不是隨機的,而是高度可壓縮: 長距離 token 關聯 抽象語義空間 結構對齊(Structure Alignment) Transformer 等於一個超強壓縮器,這讓它可以: 將問題對齊到「已見過的語言模式」 再生成對應回應 回答不是「查到」,而是「生成」,不是回憶,是重建 類比

Hero Image
Typora

Typora a nice .md file editor IDE 撰寫者:Amanda Chou 日期:2025/04/17 .md ? md 是什麼? Markdown 文件的副檔名 Markdown 又是什麼? Markdown ? **Markdown **是一種輕量級標記式語言,創始人為約翰·格魯伯。 使用易讀易寫的純文字格式編寫文件,然後轉換成有效的XHTML(或者HTML)文件。 這種語言吸收了很多在電子郵件中已有的純文字標記的特性。 輕量化、易讀易寫特性,並且對於圖片,圖表、數學式都有支援 Markdown 用途廣泛 目前許多網站都廣泛使用Markdown來撰寫說明文件或是用於論壇上發表訊息。如GitHub、Reddit、Discord、Diaspora、Stack Exchange、OpenStreetMap 、SourceForge、簡書等,甚至還能被用來撰寫電子書。 之前介紹的 Vue 文件 重新認識 Vue.js | Kuro Hsu git book 也是 深入淺出 GitBook 寫作與自助出版,電子書也能多人協作 HackMD 也是 小題大作的30個 HackMD 技巧 現在演示的這個投影片也是 md fille 怎麼變 slide? 後面針對匯出章節會提到 Why Markdown 輕量易用:Markdown 語法簡單直觀,幾乎無學習成本。(幾乎沒有,但還是有一點,語法還是需要熟悉一下) 高度可移植:Markdown 文件是純文字格式,可以在任何平台上查看或編輯,方便與版本控制工具,適合開發者和團隊協作。 多用途輸出:支援導出為 PDF、HTML、Word、Slides 等多種格式。特別適合技術文件、筆記、部落格文章等用途。 多輸出主要是依賴 Pandoc 工具支援,後面針對匯出章節會提到 強大的生態系統:可擴展性強,支持 LaTeX(數學公式)、圖表(如 mermaid.js)、代碼高亮等功能。 開放性標準:Markdown 是一種開放格式,無專屬軟體依賴,確保文件長期可讀。 參考: 寫作&筆記神器 MarkDown 真希望我學生時期就懂 分享了 dillinger, Typora 還有影片介紹 Why Markdown 只要可以版控,就會好找很多 如果有要找,版控,就會好找很多