ASR - 视频/语音自动生成字幕工具，本地整合包，AI视频剪辑必备神器~

AI视频
24年3月18日
编辑

一、ASR是什么？

ASR全称Automatic Speech Recognition，自动语音识别也称为语音转文本 (STT)，是将给定音频转录为文本的任务。它有很多应用，例如语音用户界面。

二、ASR的项目地址：

https://huggingface.co/tasks/automatic-speech-recognition

三、ASR的使用场景：

1、虚拟语音助手

许多边缘设备都有嵌入式虚拟助手，可以更好地与最终用户交互。这些帮助依靠 ASR 模型来识别不同的语音命令来执行各种任务。例如，您可以要求手机拨打电话号码、询问一般性问题或安排会议。

2、字幕生成

字幕生成模型将音频作为来自源的输入，通过转录为直播或录制的视频生成自动字幕。这有助于内容的可访问性。例如，观看包含非母语的视频的观众可以依靠字幕来解释内容。它还可以帮助在线课程环境中的信息保留，提高知识同化，同时更快地阅读和做笔记。

四、如何使用ASR？

为了让更多用户能够轻松体验这一技术，我们将ASR打包成了一键启动包。现在，您无需繁琐地配置Python环境，只需简单点击即可启动程序，从而避免了潜在的环境配置问题。

下载压缩包，解压到电脑D盘，最好不要有中文路径；
解压后点击启动.bat文件即可运行（文件可能会被误杀，请添加为信任）；
浏览器访问：http://127.0.0.1:7860/，即可正常使用。

下载权限

查看

￥

免费下载

评论并刷新后下载

登录后下载

查看演示

{{attr.name}}：

您当前的等级为

登录后免费下载登录小黑屋反思中，不准下载！评论后刷新页面下载评论支付以后下载请先登录您今天的下载次数（次）用完了，请明天再来支付积分以后下载立即支付支付以后下载立即支付您当前的用户组不允许下载升级会员

您已获得下载权限您可以每天下载资源次，今日剩余次

1、CNBE.CC所有文章，如无特殊说明或标注，均为本站作者原创发布。
2、任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。
3、如若此作者内容侵犯了原著者的合法权益，可联系客服或提交工单进行处理。
4、CNBE.CC内用户所发表的所有内容及言论仅代表其本人，并不反映任何CNBE.CC之意见及观点。

{{userData.name}}已认证

ASR - 视频/语音自动生成字幕工具，本地整合包，AI视频剪辑必备神器~

一、ASR是什么？

二、ASR的项目地址：

三、ASR的使用场景：

1、虚拟语音助手

2、字幕生成

四、如何使用ASR？

创意无界 · 设计无限

设计神器

AIGC

精选软件

微信公众号

联系客服

商务合作

法律声明

动态

公告

{{userData.name}}已认证

一、ASR是什么？

二、ASR的项目地址：

三、ASR的使用场景：

1、虚拟语音助手

2、字幕生成

四、如何使用ASR？

Whisper-WebUI - 音视频字幕AI生成翻译工具，免部署，免安装，一键使用

Vid2Densepose + MagicAnimate - 一键AI本地整合包，视频生成骨骼动画，一张照片就能生成跳舞视频，抖音小姐姐要失业？

VideoReTalking - 虚拟数字人视频AI工具整合包，同步音频嘴型/面部表情，腾讯出品~

SadTalker - 图片配合音频秒变声音视频，头部、嘴型超自然，中英双语全能，还会唱歌~

创意无界 · 设计无限

设计神器

AIGC

精选软件

微信公众号

联系客服

商务合作

法律声明

动态

公告