語音輸入(STT)
- 新功能三引擎語音辨識系統:Deepgram 線上串流、Whisper 離線辨識、Sherpa-onnx 離線串流 / 非串流
- Deepgram Nova-3 即時串流辨識,延遲約 200ms,支援自訂詞彙(Keywords Boosting)
- Whisper large-v3-turbo 離線辨識,Metal GPU 加速,支援 99 種語言
- Sherpa-onnx 串流模式(Zipformer 中英雙語)與非串流模式(SenseVoice 中英日韓粵 5 語言)
- 音訊輸入裝置選擇器、辨識語言選擇、模型管理面板
- 離線引擎 OpenCC 繁簡自動轉換(含台灣慣用詞彙)
操作改進
- 改進語音辨識啟動時,Enter / Esc 全域有效,無需先點擊輸入框
- 改進文檔視窗 ← → 方向鍵切換分頁
NDI 輸出優化
- 改進自訂原生 C++ NDI 模組,效能提升至 60fps
- 事件驅動 + 心跳混合模式,閒置時 CPU 使用率 < 1%
NDI 視訊輸出
- 新功能NDI 區網廣播輸出,同一網路內的裝置皆可接收
- 支援 BGRA 視訊流、透明通道(Alpha Channel)
- 相容 OBS Studio、Resolume Arena、vMix 等軟體
字幕轉場效果
- 新功能淡入淡出轉場效果,可自訂轉場秒數(0.0 - 3.0 秒)
- 每個螢幕可設定獨立的轉場效果時間
國際化
- 新功能完整三語介面:繁體中文、簡體中文、English
- 選單語言切換(重啟生效)、系統語言自動偵測
樣式系統
- 改進垂直位置與左右位置完全獨立,直式/橫式文字行為一致
- 新功能字體選擇器(推薦字體 + 系統字體)、粗體/斜體切換、字距控制
- 自訂文字尺寸記憶功能
功能新增
- 新功能背景顏色下拉選單(黑、白、紅、綠、藍、自訂)
- 新功能自動隱藏字幕(3秒 / 5秒 / 10秒)
- 開啟/儲存時記憶最後使用的資料夾路徑
初始版本
- 即時字幕輸入與顯示,支援單行/多行模式(1-5 行)
- 多螢幕獨立輸出,每個螢幕可獨立設定樣式與解析度
- 繁簡中文自動轉換
- 虛擬輸出視窗即時預覽
- 文檔管理:開啟 .txt / .docx、逐行送出、多分頁、編輯模式
- .sub 專案格式,完整保存所有設定與狀態
- RTL 文字方向支援(阿拉伯文、希伯來文)
- 直式文字左右同時顯示