文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门文章
-
- 伊朗断网三天 (0)
- 马来西亚印尼屏蔽 Grok (0)
- 合法化逆向工程有助于终结平台垃圾化 (0)
- 因 GitHub 强行推销使用 Copilot Gentoo 考虑迁移出去 (0)
- 喜马拉雅山冬季降雪量大幅减少 (0)
- AI 伴侣应用聊黄案本周二审 (0)
- Linus Torvalds 的个人项目使用 AI 辅助编程完成 (0)
- 中国测试商用超临界二氧化碳发电机 (0)
- 伊朗断网四天 (0)
- Windows 资源管理器可能集成 Copilot 侧边栏 (0)
热门评论
- BaD kEyBoArd: TyPo (1 points, 一般) by lot 在 2025年12月07日14时54分 星期日 评论到 斯巴鲁车主抱怨驾车过程中弹出全屏广告
- (1 points, 一般) by solidot1763918667 在 2025年11月24日01时25分 星期一 评论到 英国陆军将用《使命召唤》训练士兵
- 所以意识是什么?他怎么敢肯定他的意思就不是幻觉? (1 points, 一般) by cutpigsrollaroundint 在 2025年11月05日18时14分 星期三 评论到 微软 AI 负责人认为 AI 有意识是无稽之谈
- 不完备定理无法证明不是模拟 (1 points, 一般) by scottcgi 在 2025年11月01日11时26分 星期六 评论到 数学证明否定宇宙是模拟的
- 样本数太少 没有参考意义 (1 points, 一般) by Craynic 在 2025年09月22日13时13分 星期一 评论到 梵蒂冈的 Flathub 软件包人均安装量最高
- 杞人忧天 (1 points, 一般) by cnma_001 在 2025年08月15日12时04分 星期五 评论到 你一生中被小行星砸到的概率
- 垃圾Paypal... (1 points, 一般) by devfsdvyui 在 2025年07月17日20时13分 星期四 评论到 Valve 在支付公司压力下移除部分成人游戏
- 建议下次不要用动漫这种容易误解的词 (1 points, 一般) by solidot1550041775 在 2025年07月09日15时24分 星期三 评论到 Netflix 称其全球订户有五成看动漫
- 所以应该吃生肉吗 (1 points, 一般) by Craynic 在 2025年07月09日13时25分 星期三 评论到 研究称加工肉没有食用的安全量
- 居然只有95% (1 points, 一般) by Craynic 在 2025年06月30日13时03分 星期一 评论到 日本争议夫妇别姓法案
语言生成是 AI 领域的大热门,从改进 Google 搜索引擎到创建基于文本的幻想游戏,被称为“大型语言模型”(或 LLM)系统的应用包罗万象。但是这些程序存在严重问题,包括反刍性别歧视和种族主义语言以及不能通过逻辑推理测试等。一大问题是:简单增加数据和计算能力是否能改善这些弱点,还是已到达技术范式的极限?这是 Alphabet 的 AI 实验室 DeepMind 发表的三篇研究论文探讨的主题之一。该公司的结论是,进一步扩大系统会带来很多改进。DeepMind 研究科学家 Jack Rae 在简报电话会议中告诉记者:“论文的一个关键发现是,大型语言模型的能力仍然在提高,它们在不断进步。这个领域并没有停滞不前。”
定期将工作成果馈送给 Google 产品的 DeepMind 构建了一个名为 Gopher 的语言模型研究此类 LLM,该模型具有 2800 亿个参数。参数可以快速衡量语言模型的规模和复杂程度,这意味着 Gopher 比 OpenAI 的 GPT-3(1750 亿个参数)更大,但却比不上一些更具实验性的系统,例如微软和 Nvidia 的 Megatron 模型(5300 亿个参数)。在 AI 世界中,越大越好,通常是正确的,更大的模型通常能提供更好的性能。DeepMind 的研究证实了这一趋势,并表明在最常见的基准测试(如情感分析和总结)上,扩大 LLM 的规模确实可提高性能。研究人员也提醒说,要想解决语言模型固有的一些问题,需要的不仅仅是数据和计算。
定期将工作成果馈送给 Google 产品的 DeepMind 构建了一个名为 Gopher 的语言模型研究此类 LLM,该模型具有 2800 亿个参数。参数可以快速衡量语言模型的规模和复杂程度,这意味着 Gopher 比 OpenAI 的 GPT-3(1750 亿个参数)更大,但却比不上一些更具实验性的系统,例如微软和 Nvidia 的 Megatron 模型(5300 亿个参数)。在 AI 世界中,越大越好,通常是正确的,更大的模型通常能提供更好的性能。DeepMind 的研究证实了这一趋势,并表明在最常见的基准测试(如情感分析和总结)上,扩大 LLM 的规模确实可提高性能。研究人员也提醒说,要想解决语言模型固有的一些问题,需要的不仅仅是数据和计算。