我做了 AI 工作流,把每週剪片時間從 2 小時壓到 30 分鐘,用了 8 個步驟
一直以來,拍片就是我比較難跨越的領域。 因為我沒有系統性地學習過該如何拍片,也不知道要如何剪輯影片,所以一直在調整方向。 本來我買了 Filmora 來做影片剪輯,它算是市場上相對比較簡單好用的軟體,價格上也不太貴,一年大約花了一千八百多塊。 當然,雖然說它的功能很強大,但就是要花時間去學習。 對於我們這種把經營自媒體當作副業的人來說,平常下班之後要做研究,然後還要拍片,實在沒有辦法撥出更多時間來學習剪片。 可是我發現,可以使用 Claude 當作核心,並結合一些開源工具建立 AI 工作流,讓整個流程都能交由 AI 來完成最繁雜的剪片工作。 全程幾乎沒有任何技術難度。你只要知道怎麼樣下載 Claude Desktop,然後讓它去幫你操作就可以了。 --- ■ 整套 AI 剪片工作流:八步驟拆解 這套流程串了三個開源工具,加上一個 API。 先看角色分工: - ElevenLabs Scribe:把語音轉成有字級時間戳的逐字稿:雲端 API(scribe (https://elevenlabs.io/speech-to-text)) - video-use:讀逐字稿、決定剪輯點、輸出剪好的影片:github.com/browser-use/video-use (https://github.com/browser-use/video-use) - Remotion:用 React 寫程式碼產生片頭片尾動畫:github.com/remotion-dev/remotion (https://github.com/remotion-dev/remotion) - ffmpeg-full:影片合併、字幕燒入:`brew install ffmpeg-full` video-use (https://github.com/browser-use/video-use) 是 browser-use 團隊出的「**用 Claude Code 剪片**」開源工具。讓 AI 做剪輯、剪贅詞、調色、嵌入字幕,每個剪接點還會自跑一次自我檢查抓跳接和爆音。 Remotion (https://github.com/remotion-dev/remotion) 是「**用 React 寫程式碼做動畫影片**」的開源框架。它給你一個 frame 編號和一張空白畫布,然後去畫每一幀畫面,最後渲染成 MP4。 ffmpeg-full (https://formulae.brew.sh/formula/ffmpeg-full) 是這套流程最後的「組裝工」,負責兩件事:把 cold open、片頭動畫、主體影片、片尾這四段串成一支完整的 mp4;以及把中文字幕嵌進社群短片版本(IG/FB/Threads/Shorts)。 要裝前面三個開源工具,你就直接把 Github 的網址跟 Claude 說,跟它講你要裝這些開源專案,他就會幫你裝好。 但是 ElevenLabs Scribe API 你要自己申請。 ElevenLabs Scribe (https://elevenlabs.io/speech-to-text) 是 ElevenLabs 推出的語音轉文字模型,支援 90 多種語言(含中文)。它會回傳**字級時間戳**和聲音事件標籤(笑聲、停頓),這是後面 video-use 開源專案能精準刪除贅詞的基礎。 價格的話,從每月訂閱費 $6 到 $11 美金,其實也不算太貴。詳情大家可以自己去官網看。 整個流程分八步: ■ 1. 錄影 我用 Filmora 做螢幕錄影,錄完輸出成 mp4 丟到專案目錄。Filmora 在這一步只負責「按下錄影鍵到輸出檔案」這件事。當然也有可能會做一些聲音上的調整,以及稍微加一點素材。 ■ 2. 轉錄 video-use 把音訊抽出來送進 ElevenLabs Scribe,回傳 JSON 含每個漢字的起訖時間、speaker_id、音訊事件標籤(笑聲、停頓)。