7個你可能不知道,卻正在默默燒掉額度的地方。
先說一個底層原理:
AI沒有記憶體。
每次你問他一件事,
他都會把你們整段對話歷史重新讀一遍。
對話越長,每次回覆燒的token就越多。
而且是複利式成長。
這份攻略整理了7個,
最常見的浪費來源,以及怎麼修。
--
第1點:對話太長不結束
大多數人都是一個對話從頭聊到尾,
中間主題跳了好幾個。
沒發現的是,每次AI回覆都要重讀一遍,
從頭到尾的所有訊息。
對話到了50輪,每次消耗的token,
可能是第1輪的10倍以上。
怎麼修:
不同任務開新對話。完成一件事就重開。
可以省下 30% 以上的消耗。
--
第2點:System Prompt 沒有精簡
每次對話 System Prompt 都會被完整讀入。
你每加一個字,就是每次對話都多燒一點。
500字的Prompt,100次對話,就是5萬 token。
怎麼修:
把System Prompt 壓到200字以內。
每多100字,就是10%的持續消耗。
--
第3點:把整份文件丟進去
「幫我看這份 500 頁的合約」
AI確實讀得懂。但你每次問一個問題,
那500頁,AI都會再重讀一遍。
怎麼修:
只貼你要問的那幾頁。
或者先讓AI做目錄,再針對章節問。
可以省下 60-80% 的上下文消耗。
--
第4點:用「高階」模型做「低階」任務
Opus 回答「幫我寫一個道歉文」
Haiku 回答「幫我寫一個道歉文」
結果差不多。費用差了12倍。
怎麼修:
分類任務再選模型。
格式化、摘要、翻譯、簡單問答用 Haiku
複雜分析、架構設計、寫程式用 Sonnet 或 Opus
這一項優化好,可以省下 50% 以上費用。
--
第5點:沒有用結構化 Prompt
「幫我寫一篇關於AI的文章,要很好,要有重點,要讓人看得懂,最好加點例子,台灣讀者看的那種」
模糊指令讓 AI 猜意圖。
猜錯了再補,又是一輪token。
通常要 3-4 輪才能達標,每輪都在燒。
怎麼修:
一開始就說清楚:格式、字數、受眾、目的。
精準指令省掉 2-3 輪往返。
等於同樣費用可以多做3件事。
--
第6點:沒有善用 Cache
問同樣的問題,付同樣的錢。
很多AI工具有 Prompt Cache 功能,
相同內容只需要付一次讀取費。
怎麼修:
把固定內容(角色、規則、背景)
放在Prompt前段,讓 Cache 生效。
重複執行的任務可以省下
70-90% 的 input token 費用。
--
第7點:沒有及時終止錯誤方向
AI走錯方向了,但繼續讓他跑完。
跑完之後發現不對,再重來一次。
錯誤的方向一輪可能 2,000-5,000 token。
跑了 3 輪才停,就是1萬多token白燒。
怎麼修:
看到方向不對,立刻停。
告訴 AI 哪裡錯了,重新給指令。
這個習慣養好,省的是時間,也是額度。
--
如果只做 2 件事:
第一,不同任務開新對話。
第七,看到方向錯了立刻叫停。
這兩件事最簡單,效果最直接。
--
底層邏輯只有一個:
AI是按量計費的工具。
不是用越多越好,是用得越精準越好。
--
想知道用AI寫出流量貼文的眉角嗎?
我是週末哥,75天從0粉到破1萬粉,
寫出百萬流量貼文,8篇破10萬。
把所有方法整理成一堂課,
包含5分鐘產貼文的Claude指令,與44組Hook,
被忽略的演算法細節,還有一個壓箱底秘技。
早鳥333,輸入【6429】,
4/21截止,之後漲回666。
--
我邊洗臉刷牙,用一個小時做了提案網頁
讓我成功接到2個3萬元的案子
時間:5/9 (六) 13:00-15:30
地點:台中市 (詳細地點群組通知)
期待5/9,一起Vibe出你的第一個作品!