Вернуться на главную
Документация
Полное руководство по использованию ConeTTS
Начало работы
TTS-движки
Клонирование голоса
Словари произношения
Голосовой ввод
🚀 Быстрый старт
1. Системные требования
- Windows 10/11 (64-bit)
- 16 GB RAM (минимум 8 GB)
- 10+ GB свободного места на диске
GPU с 6+ GB VRAM (рекомендуется для быстрого синтеза)
2. Установка
- Скачайте установщик ConeTTS_Setup.exe
- Запустите установщик и следуйте инструкциям
- При первом запуске программа скачает модель Chatterbox (~2 GB)
3. Первый синтез
- Введите или вставьте текст в редактор
- Выберите голос из библиотеки (панель справа)
- Нажмите кнопку «Озвучить» или Ctrl+Enter
- Дождитесь завершения синтеза и наслаждайтесь результатом!
🎙️ TTS-движки
Chatterbox TTS (Основной) — MIT License ✅
- 23 языка включая русский, английский, китайский, японский
- Zero-shot клонирование голоса с одного образца
- Параметр CFG (0.0-1.0) для точности клонирования
- Коммерческое использование полностью разрешено
F5-TTS (Дополнительный) — CC-BY-NC-4.0 ⚠️
- Высокое качество для русского и китайского языков
- DiT архитектура (Diffusion Transformer)
- Только для некоммерческого использования
- Доступен через Менеджер моделей
Выбор движка
| Сценарий | Рекомендация |
|---|---|
| Коммерческий проект | Chatterbox (MIT) |
| Мультиязычный контент | Chatterbox (23 языка) |
| Максимальное качество RU | F5-TTS (личное использование) |