奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: DeepMind 认为增强学习足以实现通用 AI

WinterIsComing(31822)

发表于2021年06月12日 22时43分星期六
来自其主之声

过去几十年计算机科学家创造的 AI 系统只能在受限环境下解决特定问题，离通用 AI 还有一段距离。DeepMind 的科学家现在认为，通用 AI 能通过一个简单而强有力的原则去实现：奖励最大化。他们发表了论文《Reward is Enough》，认为奖励最大化和试错足以发展出与智能相关的行为。AI 的一个分支强化学习（reinforcement learning）是基于奖励最大化，能引领通用 AI 的发展。DeepMind 的研究人员提出一个假说：奖励最大化的通用目标足以驱动大部分如果不是全部的智能行为。大自然就是如此运作的，复杂有机物不存在自上而下的智能设计，数十亿年的自然选择和随机突变过滤出适合生存和繁殖的生命形式。能更好处理挑战和适应环境的生命生存和繁衍，其余则销声匿迹。这种简单而有效的机制演化出生命的各种能力和技能。