可实现本地电脑的音频转文字软件!完全免费开源!支持 Windows、macOS、Linux
(目前界面只有英文的,但支持中文的转换)
特征
- 基于 DirectCompute 的供应商不可知的 GPGPU;该技术的另一个名称是“Direct3D 11 中的计算着色器”
- 纯 C++ 实现,除了基本的 OS 组件外没有运行时依赖性
- 比 OpenAI 的实现快得多。
- 混合 F16 / F32 精度:自 D3D 版本 10.0 起,Windows [color=var(–color-accent-fg)]需要缓冲区 的支持R16_FLOAT
- 内置性能分析器,可测量单个计算着色器的执行时间
- 内存使用率低
- 用于音频处理的媒体基础,支持大多数音频和视频格式(Ogg Vorbis 除外),以及大多数在 Windows 上运行的音频捕获设备(除了一些专业的,它们只实现 ASIO API [color=var(–color-accent-fg)]。
- 用于音频捕获的语音活动检测。
使用步骤:
下载 WhisperDesktop.zip、ggml-medium 语音模型(官方那里有好多规格如图一,作者推荐1.42G这个模型,下面百度云盘下载链接)解压WhisperDesktop.zip,打开WhisperDesktop.exe,首先选择要加载的语音模型
加载完成后,就可以进行语音转文字了
夸克网盘: https://pan.quark.cn/s/6a7dc6288637
123云盘: https://www.123pan.com/s/RiyA-qSS03.html
百度网盘: https://pan.baidu.com/s/1MXHevSF_RuUOOGk6AToX6w?pwd=hjhj 提取码: hjhj
Github链接 Buzz: https://github.com/chidiwilliams/buzz
ggml-medium 语音模型(官方):
ggerganov/whisper.cpp at main
作者推荐ggml-medium.bin(大小为 1.42GB)
链接:pan.baidu.com/s/1vszwzT
提取码: xnbc
感谢您的来访,获取更多精彩文章请收藏本站。
© 版权声明
1. 资源都是经过站长或作者收集测试修改后发布分享。转载请在文内以超链形式注明出处,谢谢合作!
2. 本站除原创内容,其余所有内容均收集自互联网,仅限用于学习和研究目的,本站不对其内容的合法性承担任何责任。如有版权内容,请通知我们或作者删除,其版权均归原作者所有,本站虽力求保存原有版权信息,但因众多资源经多次转载,已无法确定其真实来源,或已将原有信息丢失,所以敬请原作者谅解!
3. 本站用户所发布的一切资源内容不代表本站立场,并不代表本站赞同其观点和对其真实性负责,若您对本站所载资源作品版权归属存有异议,请留言附说明联系邮箱,我们将在第一时间予以处理 ,同时向您表示歉意!为尊重作者版权,请购买原版作品,支持您喜欢的作者,谢谢!
4. 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客如有发现请立即向站长举报;本站资源文件大多存储在云盘,如发现链接或图片失效,请联系作者或站长及时更新。
THE END
暂无评论内容