找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 436|回复: 0

本地语音转文字 STT Powered by Faster Whisper CPU可用

[复制链接]

238

主题

11

回帖

1568

积分

管理员

积分
1568
发表于 2024-8-14 14:21:56 | 显示全部楼层 |阅读模式
本地语音转文字 STT Powered by Faster Whisper CPU可用

最近接到一个需求,需要把录音转换为文字,一看网上几款常用的工具,想不到都是收费的;论坛里面找了找,发现基本上都需要云端api,仅有的几个本地的都需要使用GPU中的cuda计算。因此,开发了这么一款语言转文字的小工具,基于Faster Whisper模型,在cpu上也能达到不错的效果。
使用方式
双击文件打开,在左上角选择模型,左下角选择推理方式与精度(cpu推荐int8,速度更快)。
若没有支持cuda的GPU请不要选择GPU,否则会崩溃(原本想导入pytorch库判断cuda_is_available的,但是这样打出来的包会把一整个pytorch一起打包进去,太大了,后来就没这么处理)
首次使用需要下载模型,进度在console中可见,请耐心等待。
本地语音转文字 STT Powered by Faster Whisper CPU可用-1.png
下载地址技术栈
使用了PyQt5开发界面,使用Faster Whisper中的ctranslate2进行推理,使用opencc对提取出的繁体中文进行翻译。
End
希望大家多多测试长音频,看看会不会出bug(bushi

懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|共享世间美好--个人小众交流圈 ( 鲁ICP备17021911号-1 )

GMT+8, 2024-11-21 18:07 , Processed in 0.116552 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表