Microsoft представила новую модель для синтеза речи VibeVoice-Realtime-0,5B
Microsoft представила VibeVoice Realtime — новую нейросетевую модель для генерации речи, которая поражает сочетанием компактности и выразительности. Несмотря на скромные размеры — всего 0,5 миллиарда параметров, — система работает практически без задержек, создавая естественную живую речь, способную выражать эмоции вроде удивления, гнева, радости или волнения.