Przegląd
Revol obsługuje interakcje głosowe poprzez integracje zamiany mowy na tekst (STT) i tekstu na mowę (TTS).
Zamiana mowy na tekst (STT)
Konwertuj wejście głosowe użytkownika na tekst:
| Dostawca | Model | Jakość |
|---|
| OpenAI | Whisper-1 | Wysoka dokładność, 99+ języków |
| Google | Google STT | Obsługa strumieniowania w czasie rzeczywistym |
Zamiana tekstu na mowę (TTS)
Konwertuj odpowiedzi agenta na głos:
| Dostawca | Model | Opis |
|---|
| OpenAI | tts-1 | Standardowa jakość, niskie opóźnienie |
| OpenAI | tts-1-hd | Wysoka rozdzielczość, naturalny głos |
Włączanie głosu
- Przejdź do ustawień agenta
- Włącz przełącznik Głos
- Wybierz dostawców STT i TTS
- Wybierz głos (alloy, echo, fable, onyx, nova, shimmer)
Funkcje głosowe wymagają planu Premium lub wyższego.
Tryb głosowy widżetu
Gdy głos jest włączony, widżet wyświetla przycisk mikrofonu. Użytkownicy mogą:
- Przytrzymać, aby nagrać wiadomość głosową
- Otrzymywać odpowiedzi audio od agenta
- Przełączać się między trybem tekstowym i głosowym