语音输入(STT)
- 新功能三引擎语音识别系统:Deepgram 在线串流、Whisper 离线识别、Sherpa-onnx 离线串流 / 非串流
- Deepgram Nova-3 实时串流识别,延迟约 200ms,支持自定义词汇(Keywords Boosting)
- Whisper large-v3-turbo 离线识别,Metal GPU 加速,支持 99 种语言
- Sherpa-onnx 串流模式(Zipformer 中英双语)与非串流模式(SenseVoice 中英日韩粤 5 语言)
- 音频输入设备选择器、识别语言选择、模型管理面板
- 离线引擎 OpenCC 繁简自动转换(含台湾惯用词汇)
操作改进
- 改进语音识别启动时,Enter / Esc 全局有效,无需先点击输入框
- 改进文档窗口 ← → 方向键切换分页
NDI 输出优化
- 改进自定义原生 C++ NDI 模块,性能提升至 60fps
- 事件驱动 + 心跳混合模式,空闲时 CPU 使用率 < 1%
NDI 视频输出
- 新功能NDI 局域网广播输出,同一网络内的设备均可接收
- 支持 BGRA 视频流、透明通道(Alpha Channel)
- 兼容 OBS Studio、Resolume Arena、vMix 等软件
字幕转场效果
- 新功能淡入淡出转场效果,可自定义转场秒数(0.0 - 3.0 秒)
- 每个屏幕可设置独立的转场效果时间
国际化
- 新功能完整三语界面:繁体中文、简体中文、English
- 菜单语言切换(重启生效)、系统语言自动检测
样式系统
- 改进垂直位置与左右位置完全独立,竖式/横式文字行为一致
- 新功能字体选择器(推荐字体 + 系统字体)、粗体/斜体切换、字距控制
- 自定义文字尺寸记忆功能
功能新增
- 新功能背景颜色下拉菜单(黑、白、红、绿、蓝、自定义)
- 新功能自动隐藏字幕(3秒 / 5秒 / 10秒)
- 打开/保存时记忆最后使用的文件夹路径
初始版本
- 实时字幕输入与显示,支持单行/多行模式(1-5 行)
- 多屏幕独立输出,每个屏幕可独立设置样式与分辨率
- 繁简中文自动转换
- 虚拟输出窗口实时预览
- 文档管理:打开 .txt / .docx、逐行发送、多分页、编辑模式
- .sub 项目格式,完整保存所有设置与状态
- RTL 文字方向支持(阿拉伯文、希伯来文)
- 竖式文字左右同时显示