NVIDIA 据称直接联系了 Anna's Archive,以获取约 500 TB 的 "盗版" 书籍和论文,用于预训练他们的 LLM。 Anna's 警告他们这些收藏是非法和受版权保护的。 NVIDIA 的数据战略团队仍然推动;根据诉讼中引用的内部文件,管理层在几天内就批准了。