solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2023年07月17日 23时01分 星期一
来自遥远地球之歌
威斯康星大学斯托特分校的研究员 Kevin Matthe Caramancion 评估了流行大语言模型识别假新闻的能力。他评估了四个大模型,包括 Open AI 的 Chat GPT-3.0 和 Chat GPT-4.0,Google 的 Bard/LaMDA 以及微软的 Bing AI。他向这些模式输入了已经过人类事实核查的新闻。结果显示,OpenAI 的 GPT-4.0 表现最出色。但所有四种大模型都落后于人类事实核查人员,突出了人类认知的不可替代价值。研究报告发表在预印本平台 arxiv 上。

人工智能
Wilson(42865)
发表于2023年07月17日 15时34分 星期一
来自时空折叠
一方面 ChatGPT 的流量在下降,另一方面用户抱怨 ChatGPT 的回答质量变差了。根据 SimilarWeb 的数据,上个月 ChatGPT 的流量下降了近 10%。ChatGPT 的 iOS 应用的下载量也在下降。GPT-4 的付费用户同时在抱怨 OpenAI 的聊天机器人最近输出速度变快了,但代价是输出质量下降了。一位用户打了一个比喻说,前一个月 GPT-4 的使用体验就像是驾驶一辆法拉利,但这个月它变成了像是驾驶一辆破旧皮卡。AI 社区猜测 OpenAI 设计理念发生了改变,它将大模型分解成几个在特定领域训练的小模型,此举旨在降低成本。还有一种可能性是互联网开始充斥着 AI 生成内容,而如果用 AI 使用 AI 生成的数据集进行训练,它的质量会下降。