Complementary: FunASR/SenseVoice — ASR for voice cloning pipelines

## Summary

OpenVoice does voice cloning/synthesis. FunASR provides the complementary ASR front-end:

- **170x faster transcription** — RTF 0.006-0.007
- **50+ languages** (SenseVoice)
- **Speaker diarization** (CAM++) — useful for multi-speaker voice cloning
- **OpenAI-compatible API** — easy to chain ASR → voice cloning

In a voice pipeline: FunASR transcribes → OpenVoice clones voice → TTS generates. Both are Apache 2.0.

```bash
pip install funasr
funasr speaker_audio.wav --spk -f json  # Identify speakers
# → feed speaker audio to OpenVoice for cloning
```

GitHub: https://github.com/modelscope/FunASR (17.8K+ stars)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Complementary: FunASR/SenseVoice — ASR for voice cloning pipelines #482

Summary

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Complementary: FunASR/SenseVoice — ASR for voice cloning pipelines #482

Description

Summary

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions