波塞冬需要語音數據和可靠的真實數據,以便在低資源語言中進行基準測試。 為了確保大型語言模型的轉錄準確性,我們與語言學家合作,對孟加拉語的輸出進行審核。 對於一種有2.8億人使用的語言,我們發現的差距指向了一個更深層次的問題:數據 ↓