7個你可能不知道,卻正在默默燒掉額度的地方。 先說一個底層原理: AI沒有記憶體。 每次你問他一件事, 他都會把你們整段對話歷史重新讀一遍。 對話越長,每次回覆燒的token就越多。 而且是複利式成長。 這份攻略整理了7個, 最常見的浪費來源,以及怎麼修。 -- 第1點:對話太長不結束 大多數人都是一個對話從頭聊到尾, 中間主題跳了好幾個。 沒發現的是,每次AI回覆都要重讀一遍, 從頭到尾的所有訊息。 對話到了50輪,每次消耗的token, 可能是第1輪的10倍以上。 怎麼修: 不同任務開新對話。完成一件事就重開。 可以省下 30% 以上的消耗。 -- 第2點:System Prompt 沒有精簡 每次對話 System Prompt 都會被完整讀入。 你每加一個字,就是每次對話都多燒一點。 500字的Prompt,100次對話,就是5萬 token。 怎麼修: 把System Prompt 壓到200字以內。 每多100字,就是10%的持續消耗。 -- 第3點:把整份文件丟進去 「幫我看這份 500 頁的合約」 AI確實讀得懂。但你每次問一個問題, 那500頁,AI都會再重讀一遍。 怎麼修: 只貼你要問的那幾頁。 或者先讓AI做目錄,再針對章節問。 可以省下 60-80% 的上下文消耗。 -- 第4點:用「高階」模型做「低階」任務 Opus 回答「幫我寫一個道歉文」 Haiku 回答「幫我寫一個道歉文」 結果差不多。費用差了12倍。 怎麼修: 分類任務再選模型。 格式化、摘要、翻譯、簡單問答用 Haiku 複雜分析、架構設計、寫程式用 Sonnet 或 Opus 這一項優化好,可以省下 50% 以上費用。 -- 第5點:沒有用結構化 Prompt 「幫我寫一篇關於AI的文章,要很好,要有重點,要讓人看得懂,最好加點例子,台灣讀者看的那種」 模糊指令讓 AI 猜意圖。 猜錯了再補,又是一輪token。 通常要 3-4 輪才能達標,每輪都在燒。 怎麼修: 一開始就說清楚:格式、字數、受眾、目的。 精準指令省掉 2-3 輪往返。 等於同樣費用可以多做3件事。 -- 第6點:沒有善用 Cache 問同樣的問題,付同樣的錢。 很多AI工具有 Prompt Cache 功能, 相同內容只需要付一次讀取費。 怎麼修: 把固定內容(角色、規則、背景) 放在Prompt前段,讓 Cache 生效。 重複執行的任務可以省下 70-90% 的 input token 費用。 -- 第7點:沒有及時終止錯誤方向 AI走錯方向了,但繼續讓他跑完。 跑完之後發現不對,再重來一次。 錯誤的方向一輪可能 2,000-5,000 token。 跑了 3 輪才停,就是1萬多token白燒。 怎麼修: 看到方向不對,立刻停。 告訴 AI 哪裡錯了,重新給指令。 這個習慣養好,省的是時間,也是額度。 -- 如果只做 2 件事: 第一,不同任務開新對話。 第七,看到方向錯了立刻叫停。 這兩件事最簡單,效果最直接。 -- 底層邏輯只有一個: AI是按量計費的工具。 不是用越多越好,是用得越精準越好。 -- 想知道用AI寫出流量貼文的眉角嗎? 我是週末哥,75天從0粉到破1萬粉, 寫出百萬流量貼文,8篇破10萬。 把所有方法整理成一堂課, 包含5分鐘產貼文的Claude指令,與44組Hook, 被忽略的演算法細節,還有一個壓箱底秘技。 早鳥333,輸入【6429】, 4/21截止,之後漲回666。 👉 課程資訊:https://portaly.cc/wk.rich/product/H1y1wyD3MDCGTlA23glc -- 我邊洗臉刷牙,用一個小時做了提案網頁 讓我成功接到2個3萬元的案子 時間:5/9 (六) 13:00-15:30 地點:台中市 (詳細地點群組通知) 期待5/9,一起Vibe出你的第一個作品! https://wk-claude-vibe.vercel.app/