奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: 研究人员评估大模型识别假新闻的能力

Wilson(42865)

发表于2023年07月17日 23时01分星期一
来自遥远地球之歌

威斯康星大学斯托特分校的研究员 Kevin Matthe Caramancion 评估了流行大语言模型识别假新闻的能力。他评估了四个大模型，包括 Open AI 的 Chat GPT-3.0 和 Chat GPT-4.0，Google 的 Bard/LaMDA 以及微软的 Bing AI。他向这些模式输入了已经过人类事实核查的新闻。结果显示，OpenAI 的 GPT-4.0 表现最出色。但所有四种大模型都落后于人类事实核查人员，突出了人类认知的不可替代价值。研究报告发表在预印本平台 arxiv 上。

科技: ChatGPT 用户抱怨输出质量下降

Wilson(42865)

发表于2023年07月17日 15时34分星期一
来自时空折叠

一方面 ChatGPT 的流量在下降，另一方面用户抱怨 ChatGPT 的回答质量变差了。根据 SimilarWeb 的数据，上个月 ChatGPT 的流量下降了近 10%。ChatGPT 的 iOS 应用的下载量也在下降。GPT-4 的付费用户同时在抱怨 OpenAI 的聊天机器人最近输出速度变快了，但代价是输出质量下降了。一位用户打了一个比喻说，前一个月 GPT-4 的使用体验就像是驾驶一辆法拉利，但这个月它变成了像是驾驶一辆破旧皮卡。AI 社区猜测 OpenAI 设计理念发生了改变，它将大模型分解成几个在特定领域训练的小模型，此举旨在降低成本。还有一种可能性是互联网开始充斥着 AI 生成内容，而如果用 AI 使用 AI 生成的数据集进行训练，它的质量会下降。