
Microsofts VibeVoice erhält mächtige Spracherkennung
Microsoft stattet seine KI-Sprachmodelle mit einem leistungsstarken Transkriptionswerkzeug aus. Mit VibeVoice-ASR veröffentlicht der Konzern eine Open-Source-Software, die bis zu 60 Minuten Audio in strukturierten Text verwandelt – inklusive Sprechererkennung und Zeitstempel.Die neue automatische Spracherkennung (ASR) ergänzt die bereits bestehenden Text-zu-Sprache-Modelle…









