Whisper-WebUI是一个基于Whisper模型的Gradio 的浏览器界面,可以轻松地将其用作字幕生成器!
一、Whisper-WebUI的开源地址:
https://github.com/jhj0517/Whisper-WebUI
二、Whisper-WebUI的功能特点:
- 从多种来源生成字幕,包括:
- 从音视频文件自动识别字幕
- 从Youtube链接自动识别字幕
- 从麦克风输入实时识别字幕
- 目前支持的字幕格式:
- SRT
- WebVTT
- txt(仅文本文件,不含时间线)
- 语音到文本翻译
- 将其他语言翻译成英语。(这是Whisper的端到端语音到文本翻译功能)
- 文本到文本翻译
- 使用Facebook NLLB模型翻译字幕文件
三、如何使用Whisper-WebUI?
为了让更多用户能够轻松体验这一技术,我们将Whisper-WebUI打包成了一键启动包。现在,您无需繁琐地配置Python环境,只需简单点击即可启动程序,从而避免了潜在的环境配置问题。
1、下载压缩包,解压到电脑D盘,最好不要有中文路径;
2、解压后点击启动.bat文件即可运行(文件可能会被误杀,请添加为);
3、浏览器访问:http://127.0.0.1:7860/,即可正常使用。