本地语音转文字 STT Powered by Faster Whisper CPU可用

源帅 · 发表于 2024-8-14 14:21:56

本地语音转文字 STT Powered by Faster Whisper CPU可用

景

最近接到一个需求，需要把录音转换为文字，一看网上几款常用的工具，想不到都是收费的；论坛里面找了找，发现基本上都需要云端api，仅有的几个本地的都需要使用GPU中的cuda计算。因此，开发了这么一款语言转文字的小工具，基于Faster Whisper模型，在cpu上也能达到不错的效果。

使用方式

双击文件打开，在左上角选择模型，左下角选择推理方式与精度（cpu推荐int8，速度更快）。
若没有支持cuda的GPU请不要选择GPU，否则会崩溃（原本想导入pytorch库判断cuda_is_available的，但是这样打出来的包会把一整个pytorch一起打包进去，太大了，后来就没这么处理）
首次使用需要下载模型，进度在console中可见，请耐心等待。

本地语音转文字 STT Powered by Faster Whisper CPU可用-1.png

下载地址

百度: https://pan.baidu.com/s/1m6AnY2F5zO8JDW6nWhoPiQ?pwd=kmyf 提取码: kmyf
123: https://www.123pan.com/s/ZSlSjv-VE8C3.html

技术栈

使用了PyQt5开发界面，使用Faster Whisper中的ctranslate2进行推理，使用opencc对提取出的繁体中文进行翻译。

End

希望大家多多测试长音频，看看会不会出bug（bushi

		自动登录	找回密码
密码			立即注册

本地语音转文字 STT Powered by Faster Whisper CPU可用

最佳新人

活跃会员

热心会员

推广达人

宣传达人

灌水之王

突出贡献

优秀版主

荣誉管理

论坛元老