solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2025年04月02日 15时42分 星期三
来自机械人生
AI Disclosures Project 发表的一篇论文认为,OpenAI 很可能未经授权使用 O'Reilly 书籍训练 GPT-4o 模型。AI Disclosures Project 由 O'Reilly Media CEO Tim O'Reilly 联合创办,它使用了名叫 DE-COP 的方法检测大语言模型训练数据中的版权内容。研究人员分析了 34 本 O'Reilly 书籍中的 13,962 个段落摘录,发现 GPT-4o “识别”的付费内容比 GPT-3.5 Turbo 等旧模型多得多。这项技术也被称为“成员推理攻击(membership inference attack)”,用于测试模型是否能可靠区分人类创作的文本和转述版本。