RealtimeSTT

RealtimeSTT RealtimeSTT

2024-01-01 2 分钟阅读

RealtimeSTT是一个易于使用、低延迟的实时语音转文本库。它通过监听麦克风并将语音转录为文本，是语音助手和需要快速且精准的语音转文本应用的理想选择。其主要特点包括：

pip install RealtimeSTT

pip uninstall torch pip install torch==2.0.1+cu118 torchaudio==2.0.2 –index-url https://download.pytorch.org/whl/cu118

pip install -r requirements.txt

近期的更新包括增加了唤醒词配置、新增了OpenAI接口的接入和Edge-TTS的接入，以及改进了WebUI和GPT-Sovits新API的兼容。

基本用法可以通过手动和自动两种录音方式实现，以及支持回调函数以异步处理转录结果。

recorder.start() recorder.stop() print(recorder.text())

with AudioToTextRecorder() as recorder: print(recorder.text())

AudioToTextRecorder类的初始化参数中提供了多种配置选项，如模型大小、语言编码、输入设备索引、GPU设备索引等。此外，还支持各种回调函数，以便在录音开始、停止和转录过程中执行特定操作。

可以启用实时转录，并指定唤醒词以激活录音功能。唤醒词可以选择如"Alexa"，“Hey Google"等常见的命令词。

欢迎贡献，并且该项目采用MIT许可证。

项目作者：Kolja Beigel，详细信息参见GitHub。

本指南使用到的工具