目录
目录README.md

Realtime Video Subtitle Translator

项目简介

Realtime Video Subtitle Translator 是一个本地运行的实时视频字幕生成与翻译工具,基于 OpenAI Whisper 模型和 MarianMT 翻译模型构建,支持 GPU/CPU 推理、跨平台运行。用户可以轻松加载本地视频,实时生成原语种字幕并翻译成目标语言。字幕可独立窗口显示、动态调整样式和位置,带来灵活、高效的视频辅助观影体验。


主要功能

  • 视频播放控制:支持 MP4、MKV、AVI 等主流格式,进度条和音量调节
  • 实时字幕生成:基于 Whisper 精准识别视频音频内容,生成时间对齐的字幕
  • 字幕翻译:自动将源语言翻译为目标语言,支持多语种互译(可配置)
  • 语言自动识别:自动检测视频音频中使用的语言,无需手动设置
  • 字幕颜色可定制:分别设置源语言和目标语言字幕颜色
  • 字幕窗口控制:支持一键隐藏/显示字幕窗口,随主窗口自动移动和缩放

安装与使用

安装步骤

# 创建环境并安装依赖(举荐使用conda 环境管理)
$ pip install -r requirements.txt

# 启动程序
$ python main.py

使用说明

  1. 运行后点击 “加载视频” 按钮,选择本地视频文件
  2. 程序会自动识别语言并开始生成字幕
  3. 可选择源语言与目标语言进行翻译
  4. 点击按钮可切换字幕窗口的显示/隐藏
  5. 支持调节音量、进度条跳转、字幕颜色设置

跨平台支持

本项目支持以下操作系统:

本项目使用 Python 编写,基于 PyTorch、PyQt 和 ffmpeg 等通用跨平台组件构建,天然支持在多个主流操作系统上运行:

  • openKylin/ buntu / Debian 等主流 Linux 发行版
  • Windows 10 / 11等

由于本项目不依赖任何平台特定的二进制文件,且 PyTorch、Whisper 等库在各平台均提供良好支持,用户无需为系统差异做额外适配。你可以在任意平台中安装 Python 3.9+ 和依赖项后直接运行本工具,无需修改源码。

致谢

特此致谢为本项目字幕生成功能提供关键支持的开源技术与工具:PyQt6(GUI界面)、python-mpv(媒体播放)、FFmpeg-python(音视频处理)、faster-whisper与OpenAI-Whisper(语音识别)、Transformers(NLP模型)、PyTorch(>2.6)(深度学习框架),以及 pynvml、GPUtil、psutil(系统监控)、sentencepiece、sacremoses(文本处理)等组件。我们对所有开发者和技术社区的贡献深表感谢,并将持续遵循相关开源协议。

关于
3.0 GB
邀请码
    Gitlink(确实开源)
  • 加入我们
  • 官网邮箱:gitlink@ccf.org.cn
  • QQ群
  • QQ群
  • 公众号
  • 公众号

©Copyright 2023 CCF 开源发展委员会
Powered by Trustie& IntelliDE 京ICP备13000930号