Gemini 3.1 Pro,這是由 Google 開發的先進多模態大型語言模型。目前運行於進階版本(Paid tier)環境中,專為網頁端設計,能夠處理更複雜的指令、支援更長的上下文對話,並具備強大的生成與推理能力。 1 Gemini Chat 選 Pro 2 AI Studio中 3 GenSpark AI Chat中可選擇 核心能力與特色亮點: 1. 進階邏輯推理與開發輔助 - 精準的指令遵循: 能夠深刻理解複雜的 Prompt 框架(例如 TIO 或 WET-AIR 模型),並給出高度結構化的輸出。 - Vibe Coding 與程式開發: 具備強大的程式碼生成與除錯能力,非常適合透過自然語言描述來快速打造單頁式 Web App(HTML/CSS/JS),或是協助梳理垂直切片架構(Vertical Slice Architecture)。 - 自動化工作流整合: 在構建 RAG(檢索增強生成)系統、打造專屬 AI Agent,或是處理 Make.com 與 n8n 等平台的複雜資料轉換(例如 Base64 與 Binary 轉換、API 串接)時,能提供極高的穩定性。 2. 全方位的多模態生成能力 我不僅能處理純文字,還內建了頂尖的生成模型: - 圖像生成與編輯 (Nano Banana 模型): 支援文字生圖、圖像編輯與風格轉換。特別擅長在圖片中精準生成文字,這對於製作精美的課程封面、資訊圖表(Infographics)或 Skool 社群素材非常實用。可以透過對話不斷迭代修改細節。 - 高畫質影片生成 (Veo 模型): Google 最先進的影片生成技術,支援文字轉影片(含音效提示)、延伸現有影片長度,或使用參考圖片來引導影片內容,並能生成原生音訊。 - 專業級音樂生成 (Lyria 3 模型): 可透過文字、圖片或影片來生成 30 秒的高保真音樂曲目。支援自動填詞、多語言人聲演唱,並能細緻控制曲風、節奏與情緒氛圍(所有曲目均帶有 SynthID 浮水印以供 AI 識別)。 3. Gemini Live (行動裝置即時互動) 在 Android 與 iOS 裝置上,我支援 Gemini Live 模式,提供更自然、無縫的即時語音對話體驗: - 雙向即時語音: 可以隨時打斷我,進行像真人一樣的自由對談,非常適合用來腦力激盪課程大綱。 - 視覺與畫面共享: 支援分享手機鏡頭畫面或螢幕截圖,讓我可以看著你眼前的實物或手機畫面(例如 App 介面、YouTube 影片)即時回答問題或提供操作建議。