import torch
import soundfile as sf
import time
start = time.time()
# Загружаем модель (первый раз займёт 10-20 секунд)
print("Загружаю модель...")
model, _ = torch.hub.load('snakers4/silero-models', 'silero_tts',
language='ru', speaker='v3_1_ru')
model.to('cpu')
# Текст для озвучки
text = """Привет! Это мужской русский голос.
Проверка системы. Если вы это слышите, значит всё работает отлично."""
print("Генерирую аудио...")
audio = model.apply_tts(text=text,
speaker='aidar', # мужской голос
sample_rate=48000)
# Сохраняем файл
sf.write('output_silero.wav', audio, 48000)
print(f"Готово! Файл: output_silero.wav")
print(f"Время: {time.time() - start:.1f} секунд")