User
Write something
AI 除了聽你指令,還能自己做研究,自我優化了
你有沒有想過,AI 除了聽你指令做事,還能自己決定要試什麼? Karpathy(前 OpenAI 共同創辦人)上週開源了 AutoResearch,一週拿了 3 萬顆星,成為 GitHub 史上增長最快的專案之一 它做的事聽起來很簡單:你給 AI 一個目標,它自己想方法、自己測試、5 分鐘看結果。進步了就留,退步了就丟,換一個新假設再來。一小時 12 輪,一晚 100 輪 但這件事的意義遠超過「跑得快」 今天拆解為什麼這個東西能在一週內讓整個開發者社群炸開,以及這對你的工作意味著什麼 👇 📊 先說為什麼 3 萬顆星:AutoResearch 做對了什麼? 還記得 2023 年的 AutoGPT 嗎?當時也是爆紅,說要讓 AI 自主完成任務。結果大部分人實際用了之後發現:它什麼都想做,什麼都做不好 AutoResearch 走了完全相反的路 AutoGPT 問的是:「AI 能不能什麼都做?」 AutoResearch 問的是:「AI 能不能只做一件事,但做到極致?」 答案是第二個問題才值得問 AutoResearch 的設計刻意加了很強的約束:一個 GPU、一個檔案、一個指標、5 分鐘一輪、有效就留沒效就丟。規則越簡單,AI 越強 Karpathy 自己跑了兩天,AI 自動嘗試了 700 次修改,從中篩選出 20 個有效改進,GPT-2 訓練效率提升 11% Shopify CEO 拿去跑一晚,用一個 0.8B 的小模型打贏了 1.6B 的大模型。小的比大的強,因為 AI 自動找到了更好的配置 🔧 核心邏輯:從「你指揮 AI」到「AI 自己搞定」 之前我們用 AI 的方式是這樣:你想好要做什麼,告訴 AI,它幫你執行。本質上你是腦,它是手 AutoResearch 反過來:你只告訴它「我要這個數字變好」,AI 自己去想要改什麼、怎麼改、改了有沒有用 而且它會累積經驗。第 1 次是亂猜,到第 50 次它已經知道什麼方向有效、什麼是死路。你睡一覺起來,它比昨天聰明了 這才是真正讓開發者興奮的地方。不是「AI 跑得更快」,是「AI 開始自己想了」 📈 這跟你的工作有什麼關係? AutoResearch 原版是拿來優化 AI 模型訓練的,需要 GPU。但它背後的邏輯適用於任何有明確數字可以衡量的事 Eric Siu(廣告公司 Single Grain 的創辦人)已經把同樣的模式搬到行銷上:把「訓練腳本」換成「cold email」,把「模型效能」換成「回覆率」。大部分行銷團隊一年跑 30 個實驗,用這個模式可以一天跑 30 個 配合 Claude Code,你不需要 GPU,不需要懂程式。用中文告訴它「幫我優化 cold email 的回覆率」,它就幫你建一個自動測試的系統:自動生成不同版本、自動發送、自動比較結果、自動留下最好的 cold email 回覆率、廣告點擊率、landing page 轉換率 — 只要你能量化,就能讓 AI 用同樣的方式去跑 💡 這件事的本質 以前是你告訴 AI 做什麼,現在是你告訴 AI 要什麼結果,它自己去搞定 這不是「AI 幫你做得更快」的故事。這是「AI 開始自己提假設、自己驗證、自己學習」的故事 值得想一下:你現在花最多時間反覆調整的是什麼?那個東西有沒有一個明確的數字可以衡量?如果有,為什麼還要自己猜哪個版本比較好? 寫文案是手藝,測文案是系統。手藝有天花板,系統沒有 加入 AI自動化學習中心PLUS 教你直接用 Claude Code 把這個思維變成你自己的東西
3
0
AI 除了聽你指令,還能自己做研究,自我優化了
Antigravity 偷砍限額,你的 AI 寫程式工具選對了嗎?2026 完整比較
你有沒有發現,最近用 Antigravity 寫程式的時候,額度突然少了很多? 不是你的問題。Google 這幾天悄悄改了限額規則,Pro 計劃($20/月)本來說好「每 5 小時刷新」,結果現在用 Gemini 3 Pro 模型碰到 weekly limit,直接鎖你 7 天。開發者論壇有人被鎖了 167 小時,有人兩天沒用額度也顯示耗盡。 Google 的解法?升級到 $250 的 Ultra,或者買 AI Credits — $25 買 2,500 credits,但每個任務花多少 credits?不告訴你。 $250/月寫程式?2026 年選擇這麼多,真的不用被一家綁死。我把市面上主流 AI coding 工具都比較了一遍,今天分享各家的真實優缺點、最合理的價格階梯、以及怎麼選不踩坑 👇 1️⃣ 為什麼 Antigravity 要砍限額? 原因很直接:免費版太受歡迎了,compute 成本撐不住 Google 選擇的方式不是優化成本,而是砍免費和低價用戶的限額,把大家推向 $250 的 Ultra。開發者論壇上投訴不斷,但 Google 的態度一直是「你可以升級 Ultra」或「買 credits」 問題是,credits 的消耗完全不透明。你花了 $25 買了 2,500 credits,但跑一個任務要花多少?沒有公開文檔。跟其他家比,這是最不透明的定價模式 2️⃣ 🛠️ 六大 AI Coding 工具真實優缺點 我自己都用過,以下是我的觀察加上開發者社群的反饋: ⚡ Antigravity(Google) ✅ 免費版目前最慷慨,Flash 模型零成本入門 ✅ Mission Control 視覺化介面很直覺,內建瀏覽器方便測試 ❌ Pro $20/月的限額是同價位最差的,被鎖 7 天不是個案 ❌ 不支援 MCP 協議,擴展性受限 ❌ AI Credits 定價不透明 🧠 Claude Code(Anthropic) ✅ 公認程式碼品質最好,邏輯推理能力強 ✅ Claude Pro $20/月就包含 Claude Code CLI,性價比高 ✅ Max 5x($100/月)限額最透明,超出按 API 費率算 ❌ 最近社群有品質下降的反饋,Anthropic 已確認修復了兩個 bug ❌ 有開發者反映偶爾「忽略自己的計劃然後改亂代碼」 💬 ChatGPT Codex(OpenAI) ✅ 雲端沙盒隔離,安全性好 ✅ 能抓到 Claude 有時候漏掉的邊際情況和邏輯錯誤 ✅ 終端除錯能力特別強,GPT-5.3 在這方面表現突出 ❌ 原始程式碼生成速度比 Claude 慢 ❌ $20 Plus 方案訊息量有限(30-150 條/5 小時) 🎯 Cursor ✅ 2026 年功能最全面 — Agent Mode、MCP 支援、多檔案編輯 ✅ 可以自選模型(Claude、GPT、Gemini 都能用),彈性最大 ✅ 多行預測編輯,寫 code 效率高 ❌ $20 起跳,Pro+ $60,Ultra $200,價格不算低 ❌ 適合在 IDE 裡工作的人,CLI 偏好者不太適合 🌊 Windsurf ✅ $15/月是目前性價比最高的付費方案 ✅ 混合 Copilot + Agent 模式,體驗流暢 ✅ Chat 介面和文件引用體驗做得很好 ❌ 在主流評測中討論度較低,社群資源相對少 🤖 GitHub Copilot ✅ $10/月最便宜,學生免費 ✅ 新手最友善,跟 GitHub 生態深度整合 ✅ 單行補全速度最快 ❌ Agent 能力最弱,其他工具一個 prompt 搞定的事,它要 3-4 個 ❌ 整體程式碼生成速度是六家裡最慢的 3️⃣ 💰 2026 年價格階梯一覽 免費:Antigravity 免費版、GitHub Copilot Free、Cursor Free 其中 Antigravity 的 Flash 模型零成本入門最慷慨 $10-20/月(競爭最激烈的價位): GitHub Copilot $10、Windsurf $15 Cursor $20、ChatGPT Plus $20(含 Codex)、Claude Pro $20(含 Claude Code) 同樣是 $20,Antigravity Pro 的限額現在反而是最差的 $100/月:Claude Code Max 5x 225+ 條/5 小時,限額最透明 超出額度按 API 費率計算,不像 Antigravity 那種 credits 黑盒 $200+/月: Antigravity Ultra $250、ChatGPT Pro $200、Claude Max 20x $200、Cursor Ultra $200 這個級別差異不大,看你需要什麼獨家功能
3
0
Antigravity 偷砍限額,你的 AI 寫程式工具選對了嗎?2026 完整比較
Google Gemini Embedding 2:AI 搜索進入多模態時代
你公司裡面最值錢的知識,AI 搜不到。 不是因為你沒有用 AI,而是因為那些知識根本不是文字。 維修師傅拍的幾百張漏水照片、設計師存了三年的素材庫、銷售團隊錄的客戶訪談影片⋯⋯這些東西藏著大量經驗,但 AI 一直都碰不到。 Google 剛發佈的 Gemini Embedding 2,第一次讓 AI 真正「看懂」這些東西。今天我用最白話的方式講清楚:這個技術到底改變了什麼、能怎麼用、以及什麼時候不該用。 --- 🔍 先講一個大家可能不知道的事 AI 不是早就能看圖片了嗎?沒錯,但那是「一對一」的——你丟一張圖,AI 回答你。 但如果你有 100 份 PDF、300 張產品照、50 段培訓影片,你想問「哪張圖跟這個案例最像?」 這時候 AI 就幫不了你了。 為什麼?因為以前 AI 搜索圖片和影片的辦法,是先把它們全部變成文字。 圖片?先把裡面的字抽出來 影片?先轉成逐字稿 音訊?先跑語音辨識 全部變文字之後,AI 才能搜。 但你想想:一張設計圖變成文字描述之後,意思還一樣嗎? 顏色、佈局、比例、那些視覺上的細節,文字根本沒辦法完整表達。資訊不是消失了,是變質了。AI 搜到的是「文字版的圖片」,不是圖片本身的意思。 --- 💡 Gemini Embedding 2 改變了什麼? 這個模型做的事情很簡單但很根本:它直接理解圖片、影片、音訊的「意思」,然後把所有東西放進同一個搜索空間。 不用先轉文字,不用間接翻譯,直接懂。 用圖搜圖、用文字搜影片、用影片搜相關文件——全部都可以。 幾個數字讓你感受一下: ✅ 嵌入模型排行榜第一名,1605 Elo,贏過 OpenAI 所有同類模型 ✅ 文字一次處理 8,192 tokens ✅ 圖片一次 6 張 ✅ 影片最長 120 秒 ✅ 音訊直接搜,不用先轉文字 定價 $0.20/MTok,比 OpenAI 同級的 $0.13 貴了一半。但 OpenAI 那個只能處理文字,這個什麼都吃。 --- 🏢 實際能怎麼用?三個場景 1️⃣ 物業管理:用照片搜維修紀錄 你是物業管理公司,累積了幾百張漏水、牆壁裂縫的維修照片,每張都標了維修方法和費用。 住戶傳了一張新的漏水照片過來,直接上傳問:「以前類似的案例怎麼處理的?」 AI 回你三個最相似的過去案例,附維修方式和報價區間。 以前這件事要打電話問老師傅,現在秒搜。 2️⃣ 電商:用競品圖搜自家產品 你有幾千張產品圖,客戶傳了一張競爭對手的產品照片問:「你們有沒有類似的?」 以前要人工一張張翻,現在上傳就找到了。 3️⃣ 設計 / 製造:用圖搜靈感和品質紀錄 設計師存了三年的靈感素材,以前只能靠資料夾名稱找。現在可以丟一張參考圖,直接搜出風格最接近的素材。 工廠裡每次品質異常拍的照片,以前存了就忘。現在新的異常出現,上傳照片就能找到過去類似的案例和處理方式。 做設計的、做維修的、做零售的、任何需要「看圖比對」的工作,這個功能直接省掉大量人工翻找的時間。 --- ⚠️ 但先別急著全面導入,三個坑要知道 ❌ 搜物件很強,搜關係很弱 研究顯示,多模態嵌入模型分辨「手機放在地圖上」和「地圖放在手機上」的準確率只有 30-40%。如果你的搜索需要理解物件之間的位置、大小、先後關係,現階段還不夠可靠。 ❌ 多模態不是免費的升級 Google 上一代純文字嵌入模型在法律文件搜索達到 87% 準確率,換成多模態之後,文字搜索精準度可能反而下降。你多了搜圖片的能力,但原本最強的文字搜索可能變弱了。 ❌ 一旦用了就很難換 你把所有資料都用 Gemini 嵌入之後,想換 OpenAI 或其他模型?全部要重新跑一次,因為不同模型的嵌入空間完全不相容。鎖定效應很明顯。 --- 🧠 我自己的觀點 這個技術真正重要的不是它多快多準,而是它代表的方向:我們正在從「AI 只懂文字」進入「AI 懂所有媒體」的時代。 過去幾年大家一直在教 AI 搜文字資料,但企業裡面最有價值的知識,往往不是文字。是那些照片、影片、錄音——以前全部搜不到,只能靠「問對的人」。 現在 AI 第一次能真正理解這些東西的意思。不是間接翻譯,是真的懂。 方向絕對是對的。但現階段我的建議是:拿來做實驗,找一個小場景跑通,而不是直接替換你現有的搜索系統。 先跑通一個場景 → 驗證效果 → 再決定要不要擴大。 --- 你的工作裡有哪些知識是「藏在圖片和影片裡」的?如果 AI 能直接搜到,你覺得最大的改變會是什麼?留言聊聊 👇
Google Gemini Embedding 2:AI 搜索進入多模態時代
你的 Claude Code 裝了幾個插件?幾十個插件,真的需要那麼多嗎?
老實說,插件裝越多,Claude 不一定越強。 我自己就踩過這個坑。之前用了幾個月的 Supabase MCP,後來才發現 Supabase 有原生 CLI,效果完全碾壓 MCP。測完 10 個工具後的結論:能力越多不代表表現越好,有一個甜蜜點(increased capability ≠ increased performance)。 今天分享我的核心原則、10 個推薦工具、以及很多人忽略的安全防護建議 👇 --- ⚡ 核心原則:能用 CLI 就不要裝 MCP 為什麼?Context Window 是公共資源。每多啟用一個 MCP Server,Claude 就要多讀一堆工具描述,留給真正工作的空間被壓縮。 CLI 是終端機原生的東西,Claude 本來就會用,不佔額外 context。MCP 是多出來的抽象層,每多一個就多吃一份空間。 ❌ 什麼都裝 MCP:Context 被壓縮,Claude 變慢,回答品質下降 ✅ 優先用 CLI:原生高效,不佔額外空間,Claude 保持最佳狀態 我自己用了幾個月 Supabase MCP 才發現原生 CLI 一直都在,而且速度更快、穩定性更高。這個經驗很有代表性:很多工具都有 CLI 版本,只是大家習慣先去 Marketplace 找 MCP。 --- 🛠️ 10 個推薦工具 開發與部署: 1️⃣ Supabase CLI — 資料庫 + 用戶驗證,終端機直接操作,不用開 Dashboard。這是我用過差距最大的一組:CLI 版本比 MCP 快很多。 2️⃣ Vercel CLI — 一行指令部署到線上,不用手動進 Vercel 後台。配合 Claude Code 可以做到改完程式碼直接部署。 3️⃣ GitHub CLI — 在終端機管 repo、PR、Issue,不用切到瀏覽器。Claude 可以直接幫你開 PR、合併分支。 4️⃣ Playwright CLI — 瀏覽器自動化 + UI 測試。讓 Claude 幫你跑測試、截圖、驗證功能,省掉手動測試的時間。 5️⃣ Firecrawl CLI — AI 專用爬蟲,scrape、crawl、search 一條指令搞定。做研究或抓資料特別好用。 研究與生產力: 6️⃣ Skill Creator — Anthropic 官方工具,把你的常用流程做成可重用的 Skill。做一次,以後 Claude 自動按你的 SOP 執行。 7️⃣ GSD Framework — spec 驅動的專案管理框架。解決 Claude 做到一半忘記目標的問題,先寫 spec 再讓它執行。 8️⃣ NotebookLM-PI — 在終端機裡直接用 NotebookLM 做研究,還能生成簡報、Podcast、閃卡。不用開瀏覽器切來切去。 9️⃣ Obsidian — 接上你的 Obsidian 筆記庫,Claude 變成你的個人知識助理。問它問題,它直接從你的筆記裡找答案。 🔟 Excalidraw Diagram Skill — 用自然語言畫架構圖和流程圖。說「畫一個用戶登入流程圖」,它就直接生成。 💡 我自己的黃金組合:Supabase CLI + Skill Creator + GSD + GitHub CLI,這 4 個就覆蓋 80% 的開發需求。 --- 🔒 安全提醒:工具越強,權限越大 這一段很多人會跳過,但其實最重要。 GitHub CLI 可以直接 push 程式碼到 production,Vercel CLI 可以一鍵部署到線上,Playwright 可以操作你的瀏覽器。你等於把鑰匙交給 AI,如果沒有做好權限控管,風險很大。 📌 日常測試用唯讀(Read-only)API Key,到最後部署階段才授權寫入。這樣就算 Claude 判斷失誤,也不會改到你的線上環境。 📌 用 Docker 容器或沙盒環境跑 Claude Code,把 AI 的操作範圍限制在隔離環境裡,不碰你的本機檔案系統。 📌 Playwright 自動化要設網域白名單。你讓它測你的網站沒問題,但別讓它亂跑到外部網站,避免觸發不必要的操作或洩露資料。 📌 今年初已經有 CVE-2026-21852(API Key 外洩漏洞,CVSS 5.3),PromptArmor 也揭露了 Marketplace 插件注入攻擊。插件安全不是理論問題,是已經發生的事。 ❌ 直接用最高權限的 API Key 開發測試 ✅ 日常用唯讀 Key,部署時才切換到寫入權限 --- 🎯 結論:從「裝最多」升級為「選最對」 舊思維:Marketplace 有什麼就裝什麼,越多越好 新思維:先查有沒有 CLI,選精準的工具組合,做好權限控管
你的 Claude Code 裝了幾個插件?幾十個插件,真的需要那麼多嗎?
🚀 NotebookLM + AI IDE:你的知識庫不只能查,還能直接建東西出來
昨天跟大家分享了 NotebookLM 和 AntiGravity 透過 MCP 串聯的概念,很多人有興趣。 今日就更詳細介紹,聚焦一個最直接的用法。 先問你一個問題:你的 NotebookLM 裡有多少份資料? PDF、網頁、文件、研究筆記,可能幾十份都有了。但你用它們做什麼?查完資料,關掉,然後自己慢慢整理、規劃、動手建。 研究歸研究,做東西歸做東西。中間隔著一大堆手動工作。 現在有一個方法可以跳過這些:讓 AI IDE 直接連上你的 NotebookLM,讀取你的知識庫,然後一個指令就把東西建出來。 --- 什麼是 AI IDE?AntiGravity、Claude Code、Cursor 這些都是。它們本來就能幫你寫程式、建網頁、做工具。 但以前它們不認識你的資料。你要手動把研究結果複製貼上,告訴 AI「我的情況是這樣」「我的數據是那樣」。 現在透過 MCP 連接 NotebookLM 之後,AI 可以直接存取你的所有研究。不用複製貼上,不用重新解釋,它直接從你的知識庫裡抓。 --- 舉一個具體的場景: 假設你在做電商,NotebookLM 裡有 3 個 Notebook:電商增長策略、轉化率優化、客戶留存研究。每個都用 Deep Research 填了十幾個高品質來源。 你跟 AntiGravity 說一句話:「根據我的研究,幫我建一個 90 天電商增長追蹤 Dashboard。」 它建出來的東西: 📊 收入和流量的視覺化圖表,有滑桿可以即時調整參數,看不同情境下的預測結果 ✅ 每日任務勾選清單,勾完之後進度條自動更新 📈 轉化率預測計算器,輸入你的數據,自動算出預期結果 💰 廣告預算規劃工具,根據你的研究資料推算最佳分配 重點:所有數據和建議都來自你自己的 Notebook 研究,不是 AI 憑空編的。因為 NotebookLM 的核心機制是 RAG,它只從你上傳的資料中提取,不會用訓練數據亂塞東西。 不滿意?直接說「圖表改柱狀圖」「加一個日期篩選器」「把顏色換成深色主題」,AI 即時重新生成。 以前這種互動式 Dashboard 要請開發團隊才做得出來。現在一個對話搞定。 --- 怎麼連接?比你想的簡單。 核心就是一個叫 NotebookLM MCP Server 的東西。你可以把它理解成一個翻譯器,讓你的 AI IDE 能直接操作 NotebookLM。 安裝?直接叫 AI 幫你裝 notebooklm-mcp 就搞定。一行指令,不需要自己寫任何 code。支援 AntiGravity、Claude Code、Cursor、Windsurf、Gemini CLI 等主流 IDE。 裝好後,用 Google 帳號驗證一次,之後 token 自動刷新,不用重複登入。31 個工具直接可用,建 Notebook、加來源、查詢、生成摘要、做簡報,全部在 IDE 裡完成。 詳情了解:github.com/jacob-bd/notebooklm-mcp-cli 這只是其中一個用法。NotebookLM + AI IDE 的組合還能做很多事,外掛記憶體、即時知識調用、客製化策略生成、簡報自動化⋯⋯ 想知道具體怎麼設定、怎麼寫 Prompt 讓 AI 幫你建東西?付費群有完整的 step-by-step 教學 + 可複製的 Prompt 👉 加入付費群
3
0
🚀 NotebookLM + AI IDE:你的知識庫不只能查,還能直接建東西出來
1-6 of 6
powered by
AI 自動化中心
skool.com/hei-ai-8196
這是一個幫助你掌握AI自動化工作以及AI Agent (AI代理) 的中心。讓我們一起利用AI令你的人生更精彩!
升級至VIP:
skool.com/ai-plus-8477
Build your own community
Bring people together around your passion and get paid.
Powered by