波塞冬需要低资源语言的语音数据和可靠的真实数据进行基准测试。 为了确保大型语言模型的转录准确性,我们与语言学家合作审核孟加拉语的输出。 对于一种有2.8亿人使用的语言,我们发现的差距指向了一个更深层次的问题:数据 ↓