xAI właśnie wypuściło API do przekształcania tekstu na mowę! 5 głosów (eve, ara, rex, sal, leo), tagi mowy w linii, strumieniowanie WebSocket i wsparcie dla formatów od wysokiej jakości WAV aż po telefony mulaw. Możesz pisać rzeczy takie jak: "Więc wszedłem i [pauza] tam to było. [śmiech] Szczerze mówiąc, nie mogłem w to uwierzyć!" Lub owinąć sekcje: <whisper>To jest sekret.</whisper> Pauzy, śmiechy, chichoty, westchnienia, oddech, ton, prędkość, głośność. Rzeczywista kontrola ekspresyjna wbudowana w sam tekst. Trzy linijki curl, aby zacząć. Nie potrzebujesz SDK. To współpracuje z API xAI Realtime. Głos w, głos out, Grok pośrodku. Cały stos jest już dostępny. Ceny beta. Idź się z tym pobawić.