文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门文章
热门评论
- 使用开源并不是因为便宜 (1 points, 一般) by Craynic 在 2024年04月18日13时19分 星期四 评论到 李彦宏声称开源大模型更昂贵
- 火星的起源找着了 (1 points, 一般) by 18611782246 在 2024年04月15日21时15分 星期一 评论到 水星可能曾和地球一样大
- (1 points, 一般) by solidot1713165490 在 2024年04月15日15时19分 星期一 评论到 美国议员呼吁禁止进口中国制造的电动车
- AI 就像拼音输入法 (1 points, 一般) by jerry 在 2024年04月10日19时48分 星期三 评论到 Google 宣布辅助编程用的开放大模型 CodeGemma
- (1 points, 一般) by solidot1563266937 在 2024年03月02日08时20分 星期六 评论到 美国总统称中国联网汽车有国家安全风险
- You either die a hero (1 points, 一般) by lot 在 2024年02月29日13时34分 星期四 评论到 空气污染与严重痴呆症相关
- 只是从众 (1 points, 一般) by scottcgi 在 2024年02月27日00时40分 星期二 评论到 共情能传播,人能通过观察环境和其他人获得或失去同情心
- 有误 (1 points, 一般) by 陈少举 在 2024年02月23日10时04分 星期五 评论到 Google 暂停了 Gemini 的图像生成功能
- (1 points, 一般) by mirus 在 2024年02月22日14时34分 星期四 评论到 美国阿拉巴马州最高法院裁决冷冻胚胎是“儿童”
- 应该是137光年 (1 points, 一般) by solidot1707403802 在 2024年02月08日22时50分 星期四 评论到 NASA 在 137 亿光年外发现一颗位于宜居带的超级地球
微软的升级版 AI 助手 Copilot 将会记住你在新 AI PC 上的一举一动,它称该功能为 Windows Recall,AI 助手能以一种类似照相记忆的方式访问用户在 PC 上看到的内容或做的工作。微软承诺将给予用户隐私保护,将向用户提供选项过滤掉不希望被跟踪的内容。微软合作伙伴宏碁、华硕、戴尔、惠普、联想和三星将于 6 月 18 日推出新的 AI 增强 Windows PC。
斯嘉丽·约翰逊(Scarlett Johansson) 的律师要求 OpenAI 披露其如何开发 AI 语音 Sky 所用的声音的。Sky 的声音与斯嘉丽极其相似,OpenAI 已将 Sky 下架,但声称 Sky 的声音来自于另一名女演员,为了保护其隐私而不公开其姓名。斯嘉丽在声明中表示,OpenAI 早在去年秋天就联络过她,但她在认真考虑之后拒绝了;在 GPT-4o 发布前两天 OpenAI 再次联络了其经纪人,请求重新考虑授权使用其声音。当 OpenAI 发布会公开 Sky 时,斯嘉丽感到了背叛,认为 OpenAI 未经许可克隆了她的声音,她表示感到了震惊、愤怒和难以置信,认为这是一种人身侮辱。
2023 年 5 月,OpenAI 创始人 Sam Altman 在美国参议院司法委员会大谈监管 AI,当时 OpenAI 的 AI 聊天机器人 ChatGPT 成为历史上增长最快的消费者产品,每周有 1 亿用户使用。Altman 等 AI 公司高管呼吁监管有几分类似 16 世纪英国对印刷行业的监管,英女王伊丽莎白一世将印刷的许可权授权给特定印刷行会成员,但她的监管尝试没有成功。一部分人支持监管是出于道德理由,另一部分则是出于利益。Altman 支持监管更可能是后者,是为了抵御竞争对手,推动裙带资本主义的形成,微软以及 Google 都响应了这一监管呼吁。生成式 AI 的繁荣将是会更多让科技巨头们受益,而不是惠及普通消费者。
Geoffrey Hinton 教授被誉为 AI 教父,他表示如果 AI 取代了更多人类的工作,为了消除其不公平的影响,政府应该推行全民基本收入(UBI 或 universal basic income)。他说,虽然 AI 能提高生产力和增加财富,但它带来的财富主要流向富人,而不是失去工作的人,这对社会会产生糟糕的影响。Hinton 教授是神经网络的先行者,而神经网络是 AI 的基础。他曾在 Google 工作,去年离职,表示可以更自由的谈论不受监管的 AI 所带来的危险。他建议禁止将 AI 用于军事,认为会对人类带来灭绝级威胁。
美国海军陆战队特种作战司令部 (MARSOC) 正在评估 Ghost Robotics 研发的新一代机器狗,它可以配备 AI 辅助瞄准的武器。Ghost Robotics 的四轮无人车 Q-UGV 可用于侦察和监视,也可以装备武器用于远程交战。Onyx Industries 称 MARSOC 正在测试两辆装备了其 SENTRY 远程武器系统的 Q-UGV,它的 SENTRY 系统有支持 AI 的数字成像系统,能自动探测和跟踪人员、无人机或车辆,向位于世界任何地方的远程操作人员报告潜在目标。该系统不能决定自动开火,开火的决策仍然由人类控制。MARSOC 发表声明表示,测试装备武器的无人车并不意味着它对此类能力感兴趣。
Mozilla Firefox 加入了对英伟达的 RTX Video AI 视频分辨率增强技术的支持。RTX Video 由两部分组成。RTX 视频超分辨率可提升低分辨率视频的分辨率,以获得更加清晰锐利的图像。其工作原理是对低分辨率视频进行分析,然后通过深度学习来推测更高分辨率的版本应该是什么样子。然后,该算法会将推测出来的图像与传统的上采样版本相结合,以减少或消除压缩伪影并锐化最终输出的图像。RTX Video HDR 则会更进一步:启用后,它会通过 AI 神经网络分析标准动态范围 (SDR) 下的视频内容,以便添加高动态范围 (HDR10) 信息,进而增强视觉效果,并使视频更加精细、生动。使用该技术需要英伟达显卡以及兼容 HDR10 的显示器或电视。
全国首例 AI 视听作品侵权案”于 5 月 15 日下午在北京互联网法院进行一审庭前谈话。原告陈坤使用 GPT4 和 Midjourney 等软件制作了基于《山海经》的《山海奇镜》预告片。2024 年 1 月 18 日 ,陈坤发现抖音账户名为“文刻创作”的账号,未经他的许可完全复制使用了他创作的《山海奇镜》预告片的文案、配音、音乐。他提起了侵权诉讼,请求判令被告赔偿原告经济损失及合理支出 50 万元。被告方表示该作品发布后并未有任何盈利行为,且在得知涉嫌侵权后已即时删除该视频。被告不接受索赔 50 万元的要求。
在 Google 之后,社媒平台 Reddit 与 OpenAI 达成了内容协议,这一消息推动其股价上涨逾十分之一。根据该协议,OpenAI 将获得 Reddit 内容的访问权限,同时它将为 Reddit 提供 AI 驱动功能。和 Stack Overflow 类似,Reddit 的内容都是用户创造和管理的,它的高质量内容应该早就被 OpenAI 抓取并被用于训练大模型。OpenAI 等 AI 公司正面临来自众多版权所有者的诉讼,通过与 Reddit 等公司达成协议,AI 公司正试图合法化其训练数据。
微软在 2020 年承诺将到 2030 年实现负碳(carbon-negative),但到了 2024 年微软报告因为 AI 的需求它的碳排放量增加了近三分之一,实现负碳的目标岌岌可危。微软总裁 Brad Smith 表示 2020 年制定目标时 AI 尚未大爆发。利用在新兴的生成式 AI 市场的早期领先优势,微软成为全世界市值最高的公司,同时也意味着加大对产生污染的资产的投资。生成式 AI 需要数据中心等耗电巨大的基础设施。微软计划从 2023 年 7 月到今年 6 月间投资逾 500 亿美元扩建数据中心,以满足 AI 不断增长的需求。而未来 12 个月的投资金额将会更庞大。微软总裁声称 AI 带来的好处将会超过其对环境的影响。微软的 AI 竞争对手 Google、Meta 和亚马逊的碳排放也都在增加。
最近华为鲲鹏昇腾开发者大会的一次大模型演示中,出现了 python 代码 time.sleep(6),其意思是程序睡眠 6 秒钟,因此华为的演示过程中被怀疑其实是事先做好的,并非实时执行。但仅仅凭借几行代码并不能证明整个演示过程是完全操纵的。华为在一份声明中否认了造假,声明称,“5 月 10 日,在鲲鹏昇腾开发者大会的一场技术讨论上,我们演示了 mxRAG SDK 功能。本次演示面向开发者,展示如何通过十几行代码即可完成 RAG 应用开发。现场图片为实时生成,调用的是开源大模型。代码中有 time.sleep(6) 等表述,是命令等待读取外部开源大模型实时生成的图片,并非调取预置图片。本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者使用并提出宝贵建议。”它尚未公开代码。
Google 在 I/O 开发者大会上宣布了它的生成式 AI 视频模型 Veo,能以不同视觉和电影风格生成长度超过 1 分钟的 1080p 分辨率视频。Google 称,Veo 具有自然语言的高级理解能力,能理解“延时拍摄(timelapse)”或“空中镜头(aerial shots of a landscape)”等电影术语, 用户可用文本、图像或基于视频的提示导向他们想要的输出。Veo 的视频输出更一致和连贯,能展现人和物的更真实运动。类似 OpenAI 的 Sora,Veo 将首先提供给电影制作人和内容创作者试用。
芝加哥大学和密歇根大学的研究人员使用 People Data Labs 的简历数据,分析了科技巨头们强制推行重返办公室政策后人才的流失。研究人员发现顶尖人才的流失与强制重返办公室存在强相关性。研究人员发现,当微软的强制性重返办公室政策生效后,资深员工占员工总数的比例下降了 5 个百分点。苹果公司下降了 4 个百分点,而 SpaceX 下降了 15 个百分点。三家公司中 SpaceX 的政策最严厉,要求员工必须到场。研究作者表示,有着丰富经验的员工会另谋他职,企业领导者在决策时应仔细权衡员工偏好和市场机会。研究人员认为,他们的结论发现强制重返办公室政策给公司增加的成本高于预期。而企业高管们缺乏证据表明强制重返办公室有利于员工。资深员工是企业文化的守护者,更换他们会对士气和生产力产生负面影响。
OpenAI 发布了最新的基础模型 GPT-4o,以及 ChatGPT 桌面应用。GPT-4o 提供给所有免费用户使用,支持输入文本、音频和图像的任意组合,能输出文本、音频和图像的任意组合。它能在最短 232 毫秒平均 320 毫秒的时间内响应音频输入,OpenAI 称这类似于人类对话的响应时间。它的英语文本和代码性能与 GPT-4 Turbo 接近,非英语文本性能也有显著提高,API 访问速度更快费用也降低了一半。模型能实时响应、检测情绪并相应的调整声音。
IBM 开源了它用于辅助编程的 Granite 代码模型,源代码托管在 GitHub 上,采用 Apache License 2.0 许可证,允许商业使用。与其它 AI 模型不同的是,IBM 致力于避免模型的版权问题,使用了开放数据集如 GitHub Code Clean、Starcoder、开放代码库和 GitHub issues 等进行训练。Granite 是 decoder-only 代码模型,可用于修 bug、解释代码和生成代码文档,使用了 116 种编程语言的代码进行训练,参数规模 30 亿、80 亿、200 亿和 340 亿。IBM 称测试显示 Granite 在开源代码模型中表现最出色。
日本东京工业大学、理化学研究所、富士通等发布增强日语能力的大模型 Fugaku-LLM,移植了 Megatron-DeepSpeed 深度学习框架,源代码托管在 GitHub 上,公众可通过 Fujitsu Research Portal 网站试用。Fugaku-LLM 有 130 亿参数,日语 MT-Bench 平均分 5.5,其人文和社会科学得分高达 9.18 分。Fugaku-LLM使用了日本最强大的 ARM 超算富岳进行了训练。
Mozilla 创新实验组 Ocho 的一个创新产品是 Llamafile,它旨在简化大模型的部署,让用户和开发者更容易访问大模型。Llamafile 支持跨平台,支持 CPU 和 GPU 执行,其最新版本 v0.8.2 合并了多个 AVX2 优化补丁。AVX2 或 Advanced Vector Extensions 2 指令集扩展已被英特尔和 AMD 的 CPU 的广泛支持,新的优化包括了更快的 AVX2 提示处理,Q5_K_M 等量化方法的速度改进达到了之前的 1.4~2.3 倍。
路透社援引两位知情人士的消息报道,OpenAI 预计将在 Google I/O 2024 前一天宣布其 AI 驱动的搜索引擎。Google I/O 2024 将在 5 月 14 日下周二举行,即下周一 OpenAI 将宣布它与搜索巨人竞争的产品。OpenAI 的搜索产品将是 ChatGPT 的扩展,能直接从 Web 拉取信息进行引用。ChatGPT 自 2022 年底诞生以来就被视为是搜索引擎的一个替代,虽然在提供精确和实时信息上还不如搜索引擎。
OpenAI 考虑允许其聊天机器人 ChatGPT 和文本图像服务 DALL-E 的用户生成成人内容。OpenAI 称它考虑允许开发者和用户“负责任的”通过其产品创造 NSFW 内容,这将包括色情、极端血腥和脏话。OpenAI 是在最新公布的 Model Spec 文件中披露与 NSFW 内容相关的新讨论。起草文件的 OpenAI 员工 Joanne Jang 强调,深度伪造仍然是被禁止的。
Sun Kai 每周会与母亲进行一次视频通话,谈论工作,谈论作为一名中年男子所面临的压力,谈论他甚至没有和妻子讨论过的想法。他的母亲大多数情况下只是倾听,偶尔会叫他好好照顾自己。他对话的对象不是真人,而是虚拟数字化身。母亲在 2019 年突发疾病去世后,Sun 希望找到一种方法能继续保持联系。他转向了自己共同创办的南京 AI 创业公司 Silicon Intelligence。他提供了一张照片和微信里的通话音频。员工花了 4 个月时间创造出了能在手机上对话的数字化身。当时生成式 AI 尚未流行,Sun 母的虚拟化身只能说几句预先编好的台词。Sun 表示尽管如此,他听到这些话之后仍然非常感动。中国有很多人希望使用 AI 创造出已故亲人的数字化身。目前这种“数字永生”生意在中国逐渐火爆,至少有 6 家公司提供此类服务,有数千人付款。数字化身是一种文化传统的最新表现形式:中国人总是从向死者倾诉中得到安慰。Silicon Intelligence 联合创始人兼 CEO Sima Huapeng 表示,即使中国只有 1% 的人口接受 AI 数字克隆,这也是一个巨大的市场。
X11 合成器 picom 作者 Yuxuan Shui 免费使用了 GitHub Copilot 一年,最终决定放弃,认为它并不能提高工作效率,主要原因是其不可预测性和响应缓慢。他解释说,你无法判断 GitHub Copilot 何时会做好其辅助编程的工作。原因可能是他是在开发 X11 合成器,Copilot 缺乏相关项目代码的训练。如果是 Python 或 JavaScript 之类的流行语言,Copilot 预计会表现更好。另一个问题是 Copilot 的响应需要 2-3 秒才会显示,比 Clangd C 语言服务器的即时建议慢得多,即使它的建议没有帮助,它也不会影响其开发流程,Copilot 如果响应了大量代码,浪费的时间会更多。