Merge pull request #1130 from WEIFENG2333/codex/default-edge-tts-dubbing [codex] make Edge TTS the default dubbing provider
Merge pull request #1130 from WEIFENG2333/codex/default-edge-tts-dubbing
[codex] make Edge TTS the default dubbing provider
基于大语言模型的视频字幕处理工具 — 语音识别、字幕优化、翻译、视频合成一站式处理
在线文档 · CLI 使用 · GUI 桌面版 · Claude Code Skill
pip install videocaptioner # 安装 CLI + GUI 桌面版
免费功能(必剪语音识别、必应/谷歌翻译)无需任何配置,安装即用。
# 语音转录(免费,无需 API Key) videocaptioner transcribe video.mp4 --asr bijian # 字幕翻译(免费必应翻译) videocaptioner subtitle input.srt --translator bing --target-language en # 全流程:转录 → 优化 → 翻译 → 合成 videocaptioner process video.mp4 --target-language ja # 字幕烧录到视频 videocaptioner synthesize video.mp4 -s subtitle.srt # 下载在线视频 videocaptioner download "https://youtube.com/watch?v=xxx"
需要 LLM 功能(字幕优化、大模型翻译)时,配置 API Key:
videocaptioner config set llm.api_key <your-key> videocaptioner config set llm.api_base https://api.openai.com/v1 videocaptioner config set llm.model gpt-4o-mini
配置优先级:命令行参数 > 环境变量 (VIDEOCAPTIONER_*) > 配置文件 > 默认值。运行 videocaptioner config show 查看当前配置。
命令行参数 > 环境变量 (VIDEOCAPTIONER_*) > 配置文件 > 默认值
videocaptioner config show
gui
videocaptioner-gui
transcribe
faster-whisper
whisper-api
bijian
jianying
whisper-cpp
subtitle
llm
bing
google
dub
synthesize
process
download
config
show
set
get
path
init
运行 videocaptioner <命令> --help 查看完整参数。完整 CLI 文档见 docs/cli.md。
videocaptioner <命令> --help
pip install videocaptioner videocaptioner-gui # 显式打开桌面版 videocaptioner gui # 等价命令 videocaptioner # 无参数时也会打开桌面版
Windows:从 Release 下载安装包
macOS:
curl -fsSL https://raw.githubusercontent.com/WEIFENG2333/VideoCaptioner/master/scripts/run.sh | bash
LLM 仅用于字幕优化和大模型翻译,免费功能(必剪识别、必应翻译)无需配置。
支持所有 OpenAI 兼容接口的服务商:
在软件设置或 CLI 中填入 API Base URL 和 API Key 即可。详细配置教程
本项目提供了 Claude Code Skill,让 AI 编程助手可以直接调用 VideoCaptioner 处理视频。
安装到 Claude Code:
mkdir -p ~/.claude/skills/videocaptioner cp skills/SKILL.md ~/.claude/skills/videocaptioner/SKILL.md
然后在 Claude Code 中输入 /videocaptioner transcribe video.mp4 --asr bijian 即可使用。
/videocaptioner transcribe video.mp4 --asr bijian
音视频输入 → 语音识别 → 字幕断句 → LLM 优化 → 翻译 → 视频合成
git clone https://github.com/WEIFENG2333/VideoCaptioner.git cd VideoCaptioner uv sync && uv run videocaptioner # 运行 GUI uv run videocaptioner --help # 运行 CLI uv run pyright # 类型检查 uv run pytest tests/test_cli/ -q # 运行测试
GPL-3.0
版权所有:中国计算机学会技术支持:开源发展技术委员会 京ICP备13000930号-9 京公网安备 11010802047560号
VideoCaptioner
基于大语言模型的视频字幕处理工具 — 语音识别、字幕优化、翻译、视频合成一站式处理
在线文档 · CLI 使用 · GUI 桌面版 · Claude Code Skill
安装
免费功能(必剪语音识别、必应/谷歌翻译)无需任何配置,安装即用。
CLI 命令行
需要 LLM 功能(字幕优化、大模型翻译)时,配置 API Key:
配置优先级:
命令行参数 > 环境变量 (VIDEOCAPTIONER_*) > 配置文件 > 默认值。运行videocaptioner config show查看当前配置。所有 CLI 命令一览
guivideocaptioner-guitranscribefaster-whisper、whisper-api、bijian(免费)、jianying(免费)、whisper-cppsubtitlellm、bing(免费)、google(免费)dubsynthesizeprocessdownloadconfigshow、set、get、path、init)运行
videocaptioner <命令> --help查看完整参数。完整 CLI 文档见 docs/cli.md。GUI 桌面版
其他安装方式:Windows 安装包 / macOS 一键脚本
Windows:从 Release 下载安装包
macOS:
LLM API 配置
LLM 仅用于字幕优化和大模型翻译,免费功能(必剪识别、必应翻译)无需配置。
支持所有 OpenAI 兼容接口的服务商:
在软件设置或 CLI 中填入 API Base URL 和 API Key 即可。详细配置教程
Claude Code Skill
本项目提供了 Claude Code Skill,让 AI 编程助手可以直接调用 VideoCaptioner 处理视频。
安装到 Claude Code:
然后在 Claude Code 中输入
/videocaptioner transcribe video.mp4 --asr bijian即可使用。工作原理
开发
许可证
GPL-3.0