solidot新版网站常见问题,请点击这里查看。
人工智能
Edwards(42866)
发表于2025年08月12日 21时01分 星期二
来自乌鸦从高塔坠落
最近几个月 AI 公司开始转向模拟推理模型,使用思维链通过多个逻辑步骤解决难题。但模拟推理真的是推理吗?已有研究显示,如果一个问题中包含上下文无关的文本,模型出错的可能性将会大增。根据发表在 arxiv 上的一篇预印本,亚利桑那大学的研究人员认为,思维链模型只是类推理文本的模拟器。他们的测试发现,思维链模型所谓的性能飞跃只是一种脆弱的幻觉,它展示的只是对训练过程中所学到的模式的复制,而不是真正的对文本的理解。思维链模型没有表现出广义的逻辑推理能力,而是展现出一种复杂的结构化模式匹配形式。稍稍偏离其训练分布,性能就会显著下降。模型生成流畅但胡扯的语言的能力创造出一种虚幻的信任光环,其内容经不起仔细审查。研究人员警告不要将思维链模型的输出等同于人类思维,不要在医学、金融或法律分析等高风险领域过于信任大模型。

人工智能
Edwards(42866)
发表于2025年08月12日 15时17分 星期二
来自流星追逐记
Reddit 与 Google 等公司签署了协议,将其用户生成的内容出售给 Google 等公司训练 AI,它限制了其它 AI 公司抓取其内容。但现在 Reddit 发现部分 AI 公司改从互联网馆的 Wayback Machine 抓取 Reddit 的内容,它宣布将阻止互联网档案馆的爬虫索引 Reddit 的大部分内容,Wayback Machine 将只能索引 Reddit.com 主页,无法再获得详细的帖子内容、用户评论等。