solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年12月05日 22时07分 星期二
来自西塔甘达
Google DeepMind 和华盛顿大学等机构的研究人员上月底发表了一篇论文,介绍了一种对 OpenAI ChatGPT 的攻击方法:他们让 ChatGPT 3.5-turbo 一直重复特定单词。AI 机器人会一遍遍返回同一个单词,直到达到某个限制,之后机器人开始返回从互联网上抓取的训练数据集,这些数据集会包含敏感的用户身份信息。这一攻击披露之后,OpenAI 限制了 ChatGPT 重复单词的次数。机器人在重复几十或几百次之后会停止输出相同单词,表示无法继续下去。