同一篇 3,000 字的長文,丟進 ChatGPT 問問題,被引用的機率比 800 字短文高了將近六成;可是同樣這篇文章,在 Google 的 AI 概覽(AI Overviews)裡,長度跟被引用的關聯幾乎是零——超過一半被引用的頁面,字數還不到 1,000 字。
兩個數字都是真的。這就是為什麼「SEO 文章字數該寫多少」這個老問題,到了 AI 搜尋時代會讓人愈想愈混亂。過去大家爭的是「越長越好,還是精簡就好」,答案頂多影響你在第幾名;現在真正的戰場已經換了——AI 引擎不是讀完你整篇再決定排名,它是把你的文章切成一塊塊「答案塊」,挑其中最能回答當下問題的那一塊抓出來重組。
所以SEO 文章字數這件事,重點早就不在總字數的大小,而在每一個區塊的資訊密度夠不夠、答案給得夠不夠快。先從「越長越好」這個迷思為什麼會崩掉講起,再一層層拆到你該怎麼把字數分配到每一個答案塊。
為什麼「文章越長排名越好」這個說法正在失效
越長越好從來不是排名規則,只是一個被誤讀的相關性。
很多人觀察到搜尋結果前幾名大多是長文,就反過來推論「我把文章寫長就能排上去」。但長文之所以容易排前面,不是因為它字數多,而是因為它通常涵蓋了更多面向、回答了更多讀者的疑問。字數只是「內容夠完整」的副產品,不是原因本身。Google 官方很早就講過,字數不是排名因素,他們要的是「為網頁提供適量的內容」,是適量,而不是越多越好。
台灣的實測數據也支持這個方向。有 SEO 團隊抽樣了超過 300 個台灣中文網頁的真實排名資料,發現對流量較大的網站來說,前三名文章的平均字數落在 3,500 到 4,500 字之間,看起來確實是長文佔優;可是對中小型網站來說,字數跟排名「沒有明顯規律」,並不是越長就越前面。換句話說,同一個指標,在不同情境下會給你完全相反的結論。
更關鍵的是,這套「長文邏輯」是建立在傳統搜尋的運作方式上——一條藍色連結,整頁被當成一個單位去評分。一旦使用者改用 AI 來問問題,遊戲規則就整個換掉了。AI 不在乎你整篇有多厚,它只在乎能不能從你這裡,乾淨俐落地抽出一段話來回答眼前這個問題。
AI 引擎是怎麼讀你的文章的
AI 引擎不是讀者,它更像一個資料分揀員——把你的長文拆碎,只挑用得上的那一塊。
大多數 AI 搜尋背後用的是一種叫 RAG(檢索增強生成,Retrieval-Augmented Generation)的技術。它的運作可以這樣理解,系統會先把你整篇文章切成一個個「資訊塊」(chunking),把每一塊轉成可比對的格式存起來;當有人提問時,它不是把你整篇拿去讀,而是去這一堆碎塊裡,撈出跟問題最相關的幾塊,再用這幾塊重新組一段答案出來。
這代表什麼?代表你文章真正被「使用」的單位,不是整篇,而是一個個段落、一個個小節。一篇 5,000 字的文章,可能只有其中一個 150 字的段落被抓進 AI 的答案裡;旁邊那 4,850 字寫得再用心,這一次提問都用不上。
切塊大小是有講究的。業界在實作 RAG 時,常見的切塊長度落在 128 到 1,024 個 token 之間(中文大約對應幾十字到幾百字一塊)。塊切太大,一段話塞了三四個重點,向量會被稀釋,AI 抓出來反而不精準;塊切太小,又裝不下一個完整的答案,等於浪費了一個檢索名額。這個拉扯,正好對應到你寫作時「一個小節該講多滿」的問題。
所以 AI 引擎獎勵的不是篇幅,是密度——一段話能不能在不靠上下文的情況下,自己把一個問題講清楚。這也是為什麼接下來談字數,不能只看一個總數,得拆開來看每一塊。
不同 AI 引擎,對長度的胃口差很多
沒有一個「AI 通用的理想字數」,因為 ChatGPT、Google AI 概覽、AI Mode 三者的檢索機制根本不一樣。
這是整件事最容易被混為一談的地方。大家常把「AI 搜尋」當成一個東西,但實際上你面對的是三套脾氣不同的系統,它們對長文的偏好差距大到,任何「一律寫長」或「一律寫短」的策略,至少會在其中一個平台上踩空。把公開研究裡最一致的幾個數據攤開來看,會清楚很多。
| AI 引擎 | 長文是否吃香 | 理想小節長度 | 為什麼會這樣 |
|---|---|---|---|
| ChatGPT | 2,900 字以上比 800 字以下多約 59% 被引用 | 每節約 120–180 字 | 長度訊號最強,偏好深度完整的頁面 |
| Google AI Mode | 2,300 字以上比 500 字以下多約 25–30% | 每節約 100–150 字 | 長度有中等加分,但結構比長度更重要 |
| Google AI 概覽 | 長度相關性僅約 0.04,幾乎無關 | 約 100–300 字一塊 | 用查詢拆分檢索,短頁也能精準命中 |
| 跨各家 LLM(通則) | 2,000 字以上約 3 倍引用量 | 60–180 字自足答案塊 | 真正帶來加分的是長文裡的資料密度 |
差異的根源在檢索方式。ChatGPT 在你提問時會去做網路搜尋,它傾向找一篇把主題講得夠深、夠完整的頁面當主要來源——一篇有多個數據、有比較表、有細分小節的長指南,能被它抽用的素材就多,被引用的機率自然高。
Google AI 概覽走的是完全不同的路。它用一種「查詢拆分」(query fan-out)的做法,把一個搜尋拆成好幾個子問題,再分別從各自答得最好的頁面湊出引用。一個 500 字的頁面只要把某一個子問題答得乾淨,被引用的機會跟一篇 5,000 字的支柱文是一樣的。研究裡 AI 概覽的字數與引用相關性只有約 0.04(趨近於零),而且超過五成被引用的頁面字數在 1,000 字以下,講的就是這件事。AI Mode 則夾在中間,同樣會拆分查詢,但合成得更深,所以對長文有中等程度的偏好。
答案塊才是比總字數更該盯的那個單位
對 AI 引用來說,小節的長度往往比整篇字數還關鍵。
這裡有一組很能說明問題的數字。在針對 ChatGPT 的觀察裡,把內容切成 120 到 180 字小節的頁面,被引用的次數比那些小節短於 50 字的頁面多了約 70%——而且就算把整篇總字數控制成一樣,這個差距還是在。也就是說,不是「整篇寫多長」在決定引用,而是「每一塊切多大」在決定。
道理跟前面講的切塊機制是同一套。一段 120 到 180 字的內容,剛好長到足以裝下一個自足的答案加上一兩個佐證,又短到讓模型能乾淨地解析、清楚地標注來源。一旦一個小節超過 300 字又沒有小標切開,模型就得在一大片文字裡自己去找哪一段才是重點,命中率就掉下來了。
位置也很要命。有一份分析超過百萬筆 ChatGPT 引用的資料發現,接近 44% 的引用,來自頁面前 30% 的內容。一篇 4,000 字的文章,如果把最關鍵的數據埋在第十五段,表現會輸給一篇 1,500 字、開頭第一句就把答案講掉的文章。把好料藏到後面,對人類讀者是考驗耐心,對 AI 來說幾乎等於不存在。
至於 Google AI 概覽偏好的答案塊長度,有一份橫跨百萬筆查詢的分析給出了相當集中的區間——62% 的 AI 概覽落在 100 到 300 字之間,其中最常見的是 150 到 200 字這一段。低於 50 字的極短答案只佔約 3.7%,通常是換算、日期這種一翻兩瞪眼的查詢;超過 500 字的長答案也只佔約 8%,留給步驟教學、多項比較這類複雜題。換句話說,你每一個小節寫成一則 150 到 200 字的「簡報摘要」,就正好落在它最愛抓的甜蜜點上。
一個 150 字答案塊該裝進什麼內容
理想的答案塊不是把字數塞滿,而是按「結論先講、證據跟上」的順序鋪好。
知道 150 到 200 字是甜蜜點還不夠,關鍵是這 150 字怎麼排。把每一個 H2、H3 底下的開頭段,都當成一張獨立的「答案卡」來寫,結構大致是這樣:
- 第一句:直接回答這個小標問的問題,不繞圈、不鋪陳。
- 第二到第四句:給支撐——一個數據、一個具體例子,或一個有公信力的說法。
- 視情況補一個短清單,只有在真的讓答案更清楚時才加,不是為了排版而加。
這個順序之所以重要,是因為它同時討好兩種讀者。對 AI 來說,它撈到這一塊就能直接組答案,不必再去別處補上下文;對真人來說,他掃第一句就拿到結論,要深入再往下看。一塊內容能不能脫離前後文獨立成立,是它能不能被乾淨引用的分水嶺。
舉個做法上的對照。假設你的小標是「網站要多久更新一次內容」,差的寫法是先講一堆「內容更新很重要,因為搜尋引擎喜歡新鮮的資訊……」鋪陳半天才講到頻率;好的寫法是第一句就給「多數內容型網站維持每季更新一輪舊文,是性價比較高的節奏」,後面再補為什麼、補例外狀況。前者把答案埋在第三句,後者第一句就交卷——對 AI 而言,後者才是那個能被乾淨抓走的塊。
還有一個常被忽略的細節,那就是內容的新鮮度本身也是引用訊號。資料顯示,三個月內更新過的頁面,被 ChatGPT 引用的機率大約是舊頁面的兩倍。所以答案塊不只要寫得好,還得記得回頭更新,尤其是那些放了具體數字、年份的塊。
依文章類型,字數該怎麼抓
與其追一個固定字數,不如先看你寫的是哪種題目,再決定總長與答案塊的搭配。
總字數不是憑感覺定的,也不是「對手寫多少我就多寫一點」。它應該由題目的自然範圍決定——一個單點知識題,硬撐到四五千字只會稀釋密度;一個多面向的統整題,硬壓到一千字又會答不完整。下面這張表把常見的題型、合理的總字數區間,跟「該切成幾塊答案塊」對應起來,給你一個起手的框架。
| 文章類型 | 搜尋意圖 | 合理總字數區間 | 答案塊配置 |
|---|---|---|---|
| 單點知識型(某名詞是什麼) | 想快速搞懂一件事 | 約 1,200–2,000 字 | 每個小節一塊 150–200 字,開頭直接定義 |
| 操作教學型(怎麼做某事) | 想照著步驟做 | 約 2,000–3,000 字 | 每個步驟一塊,步驟內 100–180 字 |
| 統整清單型(N 個工具/方法) | 想一次看完選項 | 約 2,500–4,000 字 | 每個項目一塊,名稱+定位+適合誰 |
| 比較抉擇型(X 和 Y 怎麼選) | 想做決定 | 約 2,000–3,000 字 | 對照表+逐項小節,每塊聚焦一個差異 |
| 觀點趨勢型(某現象的走向) | 想理解脈絡與判斷 | 約 2,500–3,500 字 | 每個論點一塊,先給立場再給理由 |
這張表的用法不是把數字當硬指標,而是當「合理範圍」。如果你寫一個單點知識題卻發現自己寫到五千字,多半是塞了不該塞的東西;如果你寫一個統整型題目只擠得出一千字,那很可能是面向沒涵蓋完整。先用題型抓一個區間,再用「每個小節都是一塊自足答案」去填,總字數會自己長到它該有的樣子,而不是你硬湊出來的。
要特別提醒的是,不同 AI 引擎的偏好也會微調這個區間。如果你的讀者主要透過 ChatGPT 找你,整份內容偏向區間上緣、把資料堆厚一點會更吃香;如果你更在意 Google AI 概覽帶來的曝光,那麼把每一塊答案磨乾淨、比硬把文章拉長更划算。一份想三邊通吃的內容,安全的做法是維持模組化的小節,每塊 100 到 180 字,把答案放在前面,該有比較表就放比較表,並維持定期更新。
結構鬆掉,再多字數也救不回引用
真正讓內容被 AI 抓走的,從來不是字數,而是藏在字數裡的那些結構元素。
長文之所以「看起來」比較容易被引用,往往不是長度本身的功勞,而是長文裡通常順帶塞了更多資料表、比較矩陣、清楚的標題層級和有出處的數據——這些才是真正的引用磁鐵。一篇 5,000 字的純抒發,常常會輸給一篇 2,500 字、塞滿數據與對照的紮實指南,而且輸得不少。
有一份學界研究把這件事量化得很清楚。在內容裡加上可信來源的引述,AI 引用度約提升 40%;加入具體統計數字約提升 37%;放入專家說法約提升 30%;用上精準的專業術語也有約 18% 的提升。同一份研究還發現一個有意思的現象——對原本排在搜尋結果第五名的頁面來說,光是補上來源引用這一個動作,AI 可見度的相對提升幅度可以超過一倍。這些動作沒有一個跟「把文章寫長」有關,全都是在「把每一塊寫紮實」。
所以與其問「我這篇該補到幾千字」,不如逐塊去檢查,看這一塊的開頭有沒有直接給答案?有沒有至少一個數字或具體說法撐著?標題層級清不清楚,AI 能不能靠 H2、H3 看懂你整篇的骨架?有沒有一張比較表,把該並排的東西並排好?這些問題的答案,比你的字數計數器誠實得多。
字數從來不是你該優化的那個變數,它只是結構做對之後,自然長出來的結果。把每一個小節都寫成一塊能獨立站住的答案,讓最關鍵的內容待在頁面前段,該給數據就給數據、該放表格就放表格——當你開始用「答案塊」而不是「總字數」來思考一篇文章,AI 要不要引用你,這個問題就已經回答了一大半。
