23d (edited) • 📰 AI News
Gemini 3.1 Pro 來了~
Gemini 3.1 Pro,這是由 Google 開發的先進多模態大型語言模型。目前運行於進階版本(Paid tier)環境中,專為網頁端設計,能夠處理更複雜的指令、支援更長的上下文對話,並具備強大的生成與推理能力。
1 Gemini Chat 選 Pro
2 AI Studio中
3 GenSpark AI Chat中可選擇
核心能力與特色亮點:
1. 進階邏輯推理與開發輔助
  • 精準的指令遵循: 能夠深刻理解複雜的 Prompt 框架(例如 TIO 或 WET-AIR 模型),並給出高度結構化的輸出。
  • Vibe Coding 與程式開發: 具備強大的程式碼生成與除錯能力,非常適合透過自然語言描述來快速打造單頁式 Web App(HTML/CSS/JS),或是協助梳理垂直切片架構(Vertical Slice Architecture)。
  • 自動化工作流整合: 在構建 RAG(檢索增強生成)系統、打造專屬 AI Agent,或是處理 Make.com 與 n8n 等平台的複雜資料轉換(例如 Base64 與 Binary 轉換、API 串接)時,能提供極高的穩定性。
2. 全方位的多模態生成能力
我不僅能處理純文字,還內建了頂尖的生成模型:
  • 圖像生成與編輯 (Nano Banana 模型): 支援文字生圖、圖像編輯與風格轉換。特別擅長在圖片中精準生成文字,這對於製作精美的課程封面、資訊圖表(Infographics)或 Skool 社群素材非常實用。可以透過對話不斷迭代修改細節。
  • 高畫質影片生成 (Veo 模型): Google 最先進的影片生成技術,支援文字轉影片(含音效提示)、延伸現有影片長度,或使用參考圖片來引導影片內容,並能生成原生音訊。
  • 專業級音樂生成 (Lyria 3 模型): 可透過文字、圖片或影片來生成 30 秒的高保真音樂曲目。支援自動填詞、多語言人聲演唱,並能細緻控制曲風、節奏與情緒氛圍(所有曲目均帶有 SynthID 浮水印以供 AI 識別)。
3. Gemini Live (行動裝置即時互動)
在 Android 與 iOS 裝置上,我支援 Gemini Live 模式,提供更自然、無縫的即時語音對話體驗:
  • 雙向即時語音: 可以隨時打斷我,進行像真人一樣的自由對談,非常適合用來腦力激盪課程大綱。
  • 視覺與畫面共享: 支援分享手機鏡頭畫面或螢幕截圖,讓我可以看著你眼前的實物或手機畫面(例如 App 介面、YouTube 影片)即時回答問題或提供操作建議。
11
3 comments
Jelord Chien
8
Gemini 3.1 Pro 來了~
AI x 自動化 x 創業 Skool
skool.com/ai-playground
AI x 自動化 Skool 是專為使用者打造的學習與交流社群
✔️結合生成式 AI 與工作流程自動化的實戰經驗
✔️幫助個人與企業輕鬆掌握最新技術
✔️實現效率提升與創新突破。
Leaderboard (30-day)
Powered by