Загрузка данных


import torch
import soundfile as sf
import time

start = time.time()

# Загружаем модель (первый раз займёт 10-20 секунд)
print("Загружаю модель...")
model, _ = torch.hub.load('snakers4/silero-models', 'silero_tts',
                          language='ru', speaker='v3_1_ru')
model.to('cpu')

# Текст для озвучки
text = """Привет! Это мужской русский голос. 
Проверка системы. Если вы это слышите, значит всё работает отлично."""

print("Генерирую аудио...")
audio = model.apply_tts(text=text, 
                        speaker='aidar',  # мужской голос
                        sample_rate=48000)

# Сохраняем файл
sf.write('output_silero.wav', audio, 48000)

print(f"Готово! Файл: output_silero.wav")
print(f"Время: {time.time() - start:.1f} секунд")