文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
ken:feigaobox@gmail.com
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门文章
-
- 肯·福莱特认为读者仍然爱史诗作品 (0)
- 研究显示对长新冠进行血液测试是可能的 (0)
- 微软发布代码允许开发者用 Rust 开发 Windows 驱动 (0)
- 印度采取行动控制致命病毒爆发 (0)
- 智能手机平板的蓝光与青春期提前相关 (0)
- ChatGPT 支持图像和语音命令 (0)
- 因以色列不配合西班牙搁置 Pegasus 间谍软件调查 (0)
- Firefox 118 释出 (0)
- 币安帝国面临瓦解 (0)
- 微软释出 Windows 11 v23H2 (0)
热门评论
- 我不同意 (1 points, 一般) by Craynic 在 2023年09月05日10时33分 星期二 评论到 为什么说加密货币是史上最大的庞氏骗局
- 非常河里 (1 points, 一般) by Craynic 在 2023年09月04日14时35分 星期一 评论到 Valve 封杀 Dota 玩家小号
- Googleverse (1 points, 一般) by Reinhardt 在 2023年09月04日10时24分 星期一 评论到 我们正目睹 Googe 宇宙的终结
- 这是致歉? (1 points, 一般) by Craynic 在 2023年08月31日16时40分 星期四 评论到 数字广东网络公司承认其软件是基于微软开源的 VSCode
- re: (1 points, 一般) by spiiiiky 在 2023年08月25日09时12分 星期五 评论到 阿尔茨海默治病基因可能帮助祖先繁育更多后代
- (1 points, 一般) by Craynic 在 2023年08月14日18时53分 星期一 评论到 阿尔茨海默治病基因可能帮助祖先繁育更多后代
- 开倒车 (1 points, 一般) by kokerkov 在 2023年08月12日12时00分 星期六 评论到 Firefox 桌面扩展将扩大支持 Android 版本
- (1 points, 一般) by 7086945 在 2023年08月11日16时15分 星期五 评论到 研究称中国对未成年人游戏时间限制没有减少游戏沉迷
- re:智人并不需要真相 (1 points, 一般) by devfsdvyui 在 2023年08月10日11时19分 星期四 评论到 人类尚未在精神上做好准备迎接 AI 渗透的后真相世界
- 广州泳池男泳客游泳途中脱裤屙屎:) (1 points, 一般) by zagfai 在 2023年08月08日14时06分 星期二 评论到 研究发现在同伴身后游泳可减少 40% 阻力
OpenAI 宣布 ChatGPT 的新版本能通过图像和语音与用户交流。举例来说,上传冰箱内部的照片,ChatGPT 能列出根据现有食材可制作的菜肴清单。对于语音交流,用户可选择五种不同的 ChatGPT 的合成声音,其中包括男性和女性声音。新版本将通过 ChatGPT Plus 付费服务提供给客户,该服务月费为 20 美元。语音交流则需要使用 iPhone、iPad 和 Android 设备。ChatGPT 自去年 11 月推出后吸引了数亿用户,新功能将使得 ChatGPT 能挑战 Alexa 和 Siri 等传统语音助手。
盖蒂与英伟达合作发布了 Generative AI by Getty Images,完全使用盖蒂图库的授权图像训练的生成式 AI,将该工具生产的图像商业化会受到法律保护。该工具使用了英伟达的 Edify 模型。测试显示,盖蒂 AI 工具的图像质量与 OpenAI 的 DALL-E 3 相近,优于开源图像模型 Stable Diffusion。Getty 工具对用户生成图片的类型有限制,不允许生成任何真实人名的图像。盖蒂对此表示,它无意操纵或再现现实生活的事件。
Meta 最快将于本周在其各社交媒体应用中发布具有鲜明个性的 AI 聊天机器人,以此吸引年轻用户。AI 机器人正在内部测试,Meta 预计会在周三开始的 Meta Connect 会议上宣布首批 AI 智能体(AI agent)。这些机器人将用来推动用户的参与,不过其中一些机器人也可能拥有与生产力相关的技能,比如帮助完成编码或其他任务的能力。Meta 正计划开发几十个 AI 个性聊天机器人。该公司还在开发一款产品,让名人和创作者可以使用自己的 AI 聊天机器人与粉丝和追随者互动。
亚马逊宣布向 AI 创业公司 Anthropic 投资至多 40 亿美元,推动 AI 军备竞赛升级。此前微软向 OpenAI 投资数十亿美元。作为交易的一部分,Anthropic 将用亚马逊的定制芯片构建 AI 软件,并使用亚马逊的 AWS 云计算服务。亚马逊则将整合 Anthropic 的 AI 技术。Anthropic 开发了 ChatGPT 之外另一个备受瞩目的 AI 聊天机器人 Claude 2,支持最高 100k 上下文。
AI 模型需要大量“点击工人”对数据进行训练,比如教 AI 区分行人和棕榈树,或者组合描述暴力或性虐待的词语。“点击工人”通常来自低工资的南半球国家。比如 OpenAI 雇佣的一家外包公司在肯尼亚、乌干达和印度招募“点击工人”。但南半球国家懂芬兰语的很少。因此芬兰 AI 创业公司 Metroc 找到了监狱劳工帮助它训练大模型。40 多岁的女囚 Marmalade 就成为了一名“点击工人”,她的时薪为 1.54 欧元,轮班时间为 3 小时。芬兰以其开放式监狱闻名——囚犯可以在附近城镇工作或学习。但还有部分监狱是封闭式的,关押重刑犯。Marmalade 被判了 6 年,在一个终身监禁囚犯关押 12 年后可申请释放的国家,6 年是一个重刑。
Google 旗下的 AI 子公司 DeepMind 研发的蛋白质结构预测模型 AlphaFold 获得了拉斯克奖的基础医学研究奖,拉斯克奖颁发三个奖项,另外两个是临床医学研究奖和医学科学特殊成就奖。Demis Hassabis 博士和 John Jumper 博士领导 AlphaFold 团队借助 AI 系统成功解决了蛋白质结构预测难题,实现了准确性和速度的巨大突破。James Fujimoto、David Huang和Eric Swanson 发明的光学相干断层扫描(OCT)技术赢得了临床医学研究奖,OCT 使医生能够迅速检测并治疗影响视力的视网膜疾病,从而拯救了数百万人的视力。医学科学特殊成就奖授予了 Piet Borst。
微软将于 9 月 26 日释出 Windows 11 的下一个重大更新 v23H2。Windows 11 23H2 的新功能包括 AI 驱动的 Windows Copilot、重新设计的文件资源管理器、为数字笔用户提供的 Ink Anywhere、改进画图应用、新的音量混合器、原生 RAR 和 7-zip 文件支持等。其中 Windows Copilot 将 Bing Chat 功能带到了桌面上,鉴于 Bing Chat 不支持中国用户使用,Windows Copilot 的情况可能类似,微软官方博客声明“具体功能依据不同市场而有所不同”。原生 RAR 和 7-zip 文件支持只是解压相应格式的压缩文件,并不支持创建,创建 RAR 压缩文件仍然需要应用 WinRAR。
Alphabet 旗下从事无人出租车业务的子公司 Waymo 宣布将在洛杉矶开展六次每次持续数周的测试或者叫观光之旅,让当地居民体验下无人出租车。测试将在洛杉矶的圣莫尼卡和威尼斯海滩、世纪城、西好莱坞、中城、韩国城以及市中心分不同时间段展开,时间从 10 月 11 日持续到 3 月 3 日。感兴趣的洛杉矶居民可以提前预约,收到票之后可以在服务区域内的规定的时间内免费使用。
OpenAI 宣布了它的下一代文本图像生成模式 DALL-E 3。该公司计划 10 月份向 ChatGPT+ 和企业客户提供 DALL-E 3,提供给 API 客户的时间未定,只是表示在秋季的某个时候。OpenAI 称,DALL-E 3 改进了细节处理,此前的模型在手指的生成上会出现问题。新版本也改进了图像内文本的处理。DALL-E 3 还与 ChatGPT 紧密集成,允许 ChatGPT 根据当前对话的上下文生成图像。
亚马逊周三演示了其先进 AI 技术。在其中一场演示中,亚马逊设备业务主管 Dave Limp 展示了 Alexa 加强后的对话功能。在听到用户的自然请求而不是脚本化命令短语后,该语音助手推荐了电影并执行了智能家居例行程序。该语音助手的回答听起来也更自然,用语更加生动,不再是用户多年来听到的固定笑话和回答。新功能的预览版将于今年秋天在家庭现有的 Echo 和 Fire TV 产品中推出。亚马逊表示,即使是 2014 年的原版Echo扬声器也将兼容新功能。
代表知名作家如 John Grisham、Jonathan Franzen、George Saunders、Jodi Picault 和 George R.R. Martin 的美国作家协会周二加入了对 OpenAI 的集体诉讼,指控该公司非法使用作家们的作品训练 AI 聊天机器人 ChatGPT。除了微软支持的 OpenAI,其它 AI 公司如 Meta Platforms 和 Stability AI 也面临类似的诉讼。AI 使用大量版权作品训练之后会生成相似但有差异的内容,因此有时候它被称为是终极洗稿工具。
Google DeepMind 的研究人员在预印本平台 arXiv 发表论文《Large Language Models as Optimizers》,介绍了大模型的一种优化方法:用一个大模型修饰提示,改进另一个大模型的数学能力。初步结果显示,使用“深呼吸,一步步解决问题”的提示效果最为显著,能大幅提升数学测试得分。对 Google 的 PaLM 2 大模型使用该提示,它在小学数学应用题数据集 GSM8K 中的正确率达到了 80.2%,而不使用该提示正确率只有 34%,“让我们一步步思考”提示的正确率为 71.8%。为什么会有如此惊人的变化?大模型显然不会呼吸,也不像人类那样思考和推理。它们所做的推理都源自从书籍和互联网上抓取的短语数据集。其中包括问答形式的论坛,此类论坛包含了大量“深呼吸”,“一步步思考”等短语,后面紧跟着更细致入微的推理方案。这些短语可能有助于大模型产生更好的答案。
Google 宣布它的 AI 聊天机器人 Bard 现在能关联该公司旗下的各种应用和服务。Google 针对英文版发布了 Bard Extensions。Bard 能从用户日常使用的 Gmail、Docs、Drive、Google Maps、YouTube 和 Google Flights 等工具中查找和显示相关信息,即使你所需要的信息跨越了多个应用和服务。举例来说,你准备去大峡谷旅行,可以在一次对话中要求 Bard 从 Gmail 中获取适合每个人的日期,查找实时航班和酒店信息,查看前往机场的 Google Maps 路线,观看相关的 YouTube 视频。
2010 年代,MIT 的 Senseable City 实验室利用大数据分析了打车和拼车如何让街道更干净交通更高效,它的结论是:纽约出租车队的规模能减少 40%,更多的人能花更少的钱乘更少的汽车出行,汽车拥有率能减少,停车场能腾出用于新用途。这项研究在技术上是正确的,但未考虑到人类行为的变化。汽车比步行、公交和地铁更方便更舒适,这是它受欢迎的原因。通过打车和拼车让乘车变得更便宜,人们会远离其它形式的交通。几年后这一结果在数据中凸显出来:打车出行产生了更多的交通量,二氧化碳排放量增加了 69%。无人驾驶出租车也将产生相同的结果。新的技术将会进一步恶化交通。让城市更便捷、更高效和更环保的方法不是新技术而是旧技术。公交、地铁、自行车和双腿步行比硅谷梦想的任何东西都更清洁、更便宜、更高效。与其让自动驾驶技术用于出租车,不如将其用于扩大公共交通。
德州奥斯丁的研究人员在从空气中提取出饮用水上取得了突破:他们研发出一种分子改造过的水凝胶,利用太阳能收集可饮用水。根据不同湿度条件,该设备每公斤凝胶材料可生产 3.5-7 公斤水。生活在高温且难以获得饮用水的居民通过在室外放置该设备就可以轻松收集到水。研究人员正对该设备展开进一步的改进,以将其转变为商业化产品。
DeepMind 联合创始人 Mustafa Suleyman 认为生成式 AI 只是一个阶段,下一个阶段是交互式 AI:机器人能通过调用其它软件和呼叫其他人来执行你为它们设置的任务。Suleyman 在 2022 年创办了 AI 公司 Inflection,从微软、英伟达、比尔盖茨和 LinkedIn 创始人 Reid Hoffman 获得了 15 亿美元的投资,今年初推出了 AI 聊天机器人 Pi,其一大特性是有礼貌。他接受采访时表示,人权原则基本上是一种权衡取舍,是一种持续的协商。我们充满了自身的偏见和盲点,所有的一切都是缓慢、低效且容易出错。他认为构建出真正反映人类集体自我的 AI 是可能的,能代表人类做出更好的权衡、更一致且更公平。他认为 AI 的第一波是分类,深度学习表明可以训练计算机对不同类型的输入数据分类。第二波是生成式 AI,第三波是交互式 AI。他长期以来一直坚信对话是未来的界面,你将与 AI 进行交流,而不是点击按钮和打字。未来 AI 将更富有主动性,这将代表着技术的巨大转变。今天的技术是静态的,它只是执行你让它执行的任务。未来的技术在采取行动上将有着某种自由度。
慕尼黑工业大学学生造出的电动汽车 muc22 打破了单次充电行驶距离记录:它的电池效率达到 0.6 千瓦时/100 公里,比市场上任何电动汽车高 25 倍。如果以每加仑英里数计算,相当于一加仑汽油行驶 3815 英里。muc22 的最高时速 42 公里/小时,空重仅为 170 公斤。在慕尼黑机场一个空机库展开的六天测试中,它创造了次充电行驶记录(排除太阳能电动汽车):2574 公里。它的电池容量只有 15.5 kWh。muc22 优化了气动外形,阻力系数仅为 0.159,正面积很小,高 1 米,宽 1.2 米。
美国公司 Smart Tire Company 通过众筹平台 Kickstarter 销售世界第一种使用形状记忆合金 nitinol 的自行车轮胎。nitinol 是 NASA 为其火星漫游车设计的由镍和钛构成的形状记忆合金,能通过温度训练记住其形状。Smart Tire Company 承诺其开发的 Metl 轮胎永远不会瘪胎,可以终身使用。Metl 轮胎售价不菲,一对 500 美元,是传统自行车轮胎的十倍以上,可以方便安装在公路车或碎石路自行车的轮圈上。该公司承诺 2024 年 6 月交付。通过 Kickstarter 购买是有风险的。
马斯克(Elon Musk)、盖茨(Bill Gates)、扎克伯格(Mark Zuckerberg)等科技行业的高管和名人周三参加了一场闭门会议,与 60 多名美国参议员就 AI 的各种可能性和风险展开了辩论。参议员们正在考虑通过立法监管 AI 技术。马斯克警告称,AI 有可能威胁到人类。盖茨则指出,AI 可能有助于解决全球饥饿问题。非营利组织 Center for Humane Technology 负责人Tristan Harris 警告开源 AI 系统会被滥用,如 Llama 2 模型能被用于获取制造危险生物化合物的指南。扎克伯格反驳说,类似的指南本来就可以在互联网上找到。扎克伯格告诉参议员,开源“使这些工具的获得变得民主化,这有助于公平竞争,促进个人和企业创新”。
Stability AI 宣布了文本音乐生成模型 Audio Diffusion,允许任何人用简单的文本去生成音乐片段。Stability AI表示会在未来发布基于 Audio Diffusion 的开源模型和训练代码,允许你训练自己的音乐生成模型。Audio Diffusion 使用了音频库 AudioSparks 中超过 80 万首授权音乐训练,大约有 12 亿个参数,与最早发布的图像生成模型 Stable Diffusion 相当。Audio Diffusion 有免费和付费方案,免费版本允许每月生成 20 首最长 20 秒的音乐,付费版本提高到 500 首最长 90 秒。