solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2024年04月28日 20时46分 星期日
来自少数派报告
Pikesville High School 前体育指导员 Dazhon Darien 周四被捕,被控多项罪名,其中之一是伪造了校长 Eric Eiswert 的声音,在社交媒体上发布了种族主义言论,导致了校长被停职。警方称,Darien 制作 AI 语音是为了报复校长,因为校长已对学校资金可能被不正确处理发起调查。他制作的语音模拟校长的声音贬低了黑人学生和犹太社区,该语音在社交媒体上广泛传播。校长被停职,社交媒体传播着一波又一波仇恨信息,学校收到了大量电话。Darien 被捕时正准备飞往休斯顿,他随身携带了武器。

人工智能
Wilson(42865)
发表于2024年04月27日 23时23分 星期六
来自月光狂想曲
Windows 11 的一个预览版本 Insider Build 26200 被发现包含了一个 AI 硬件规格检测工具 AI Explorer。如果你的 PC 硬件未达到标准,它将显示水印形式的警告。目前的 AI Explorer 针对的是 Windows 11 的 ARM64 版本,要求系统配备 NPU 以及 16 GB 内存和 225 GB 系统存储空间。x86 版本目前所知的是 Windows 11 24H2 强制性要求 CPU 必须支持 SSE4.2 指令集,而今天几乎所有 x86 CPU 都支持该指令集。

人工智能
Wilson(42865)
发表于2024年04月26日 23时21分 星期五
来自猛兽的财富
阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称,Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 AlpacaEval 2.0。Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

人工智能
Wilson(42865)
发表于2024年04月25日 23时57分 星期四
来自大魔法师
Adobe 研究人员发表了一篇预印本论文,介绍了一种新的生成式 AI 模型 VideoGigaGAN,它能让将视频分辨率提升到原始分辨率的八倍。研究人员称 VideoGigaGAN 优于其它视频超分辨率(Video Super Resolution 或 VSR)重建方法,能提供更细粒度的细节,不会引入任何 AI 制造的幻影。现有的 VSR 方法如 GAN(Generative Adversarial Networks)能有效提升静态图像的分辨率,但提升视频的分辨率则容易引入闪烁或伪影;其它 VSR 方法能避免这些问题,但清晰度或细节不够。VideoGigaGAN 能综合现有方法的长处,有更高的图像/视频质量,同时能减少闪烁或失真问题。

人工智能
Wilson(42865)
发表于2024年04月25日 17时50分 星期四
来自火星战士
苹果发布了它的开放模型 OpenELM,可以在本地设备而不是云端运行。OpenELM 的权重、训练的不同检查点(checkpoints)、预训练评估微调等的指南都公布在 Hugging Face 平台上。示例代码许可并不禁止商业使用或修改,只是要求在重新发布时包含苹果完整且没有修改过的声明。OpenELM 由一组旨在高效执行文本生成任务的小模型组成,共八个模型,四个预训练四个指令微调,参数规模从 2.7 亿到 30 亿。

人工智能
Wilson(42865)
发表于2024年04月24日 00时01分 星期三
来自月缘
微软发布了其轻量级模型 Phi-3,其中最小版本 Phi-3 Mini 的权重已发布在 Hugging Face 上。Phi-3 有三个版本:Phi-3 Mini 有 38 亿参数,未来计划发布的 Phi-3 Small 有 70 亿参数,Phi-3 Medium 有 140 亿参数。微软高管称 Phi-3 Mini 的性能与 GPT-3.5 接近,但参数规模要小得多。相比参数规模更大的模型,小模型运行开销更低,在个人设备如手机和笔记本上表现更好。

人工智能
Wilson(42865)
发表于2024年04月23日 15时22分 星期二
来自开普罗纳的魔法师
AI 需要消耗大量的电,以至于为满足电力需求科技公司进入了能源行业。OpenAI CEO Sam Altman 最近投资了用太阳能为数据中心供电的公司 Exowatt,OpenAI 的合作伙伴微软正寻求获得核能批准,以帮助运营 AI 服务。去年 AI 公司 Anthropic 的主要投资者亚马逊表示投资了逾 100 个可再生能源项目,使其“连续第四年成为全球最大的可再生能源企业买家”。

人工智能
Wilson(42865)
发表于2024年04月20日 22时56分 星期六
来自人类向何处去
Linus Torvalds 与 Verizon Open Source Program Office 负责人 Dirk Hohndel 谈论了近期火热无比的 AI。Torvalds 讽刺的说,“看起来很搞笑!也许我会被 AI 模型取代!”Hohndel 认为今天的 AI 只是一种更强大的自动修正工具。Torvalds 认为需要再等十年才能知道 AI 会走向何处。Torvalds 已经注意到 AI 狂热对内核的影响——作为 AI 热的最大受益者英伟达公司,其开发者与内核开发者之间的沟通更频繁,该公司正在改进内核的内存管理,因为它需要 Linux 更高效的运行 AI 大模型。Torvalds 对 AI 产生的错误信息表达了谨慎,Hohndel 开玩笑的说这是美丽科学,“美丽科学进,美丽科学出。”

人工智能
Wilson(42865)
发表于2024年04月19日 23时57分 星期五
来自方舟
微软亚洲研究院发布了 VASA-1 模型,该模型能根据一个人的一张照片和一条音轨生成其说话或唱歌的同步动画视频。VASA 代表 Visual Affective Skills Animator,它使用了机器学习分析静态图像和音频片段,然后生成有精确面部表情、头部运动以及与音频口型同步的逼真视频。微软声称该模型在真实性、表现力和效率方面显著优于以前的语音动画方法。微软研究员使用了 VoxCeleb2 数据集训练了 VASA-1。该数据集包含了 6112 位名人的逾 100 万条话语,提取自上传到 YouTube 的视频。VASA-1 能以每秒最高 40 帧的速度生成 512x512 像素分辨率的视频,它潜在可用于深度伪造,研究人员没有公开模型源代码。

Windows
Wilson(42865)
发表于2024年04月19日 22时16分 星期五
来自空中城堡
Phoronix 在同一台笔记本电脑上对比了 Ubuntu 23.10、Ubuntu 24.04 LTS 和 Windows 11 的性能,显示 Ubuntu 24.04 表现最佳。评测的笔记本是 Framework 16,配备了 AMD Ryzen 7 7840HS SoC,Radeon RX 7700S 显卡,512GB SN810 NVMe SSD,MediaTek MT7922 WiFi 和 2560 x 1600 显示屏。作者共完成了 101 项基准测试,67% 的测试中 Ubuntu 24.04 领先,22% 的测试中 Ubuntu 23.10 领先(与 24.04 相差甚微),Windows 11 仅在 10% 的测试中领先。如果取平均值,Ubuntu 23.10 比 Windows 11 快 16%,而 Ubuntu 24.04 比 Windows 11 快 20%。

人工智能
Wilson(42865)
发表于2024年04月19日 17时04分 星期五
来自来自12个星球的敌人
美国空军试飞院和 DARPA 宣称在机器学习上取得突破,它演示了 AI 软件控制的 F-16 战斗机能与人类飞行员展开近距离缠斗。演示是基于 X-62A VISTA,该试验机是修改版的 F-16 战斗机,集成了飞行模拟器,能让 AI 或者称为机器学习代理(ML-Agents)控制飞机。AI 首次驾驶 X-62A 是在 2022 年 12 月,2023 年 9 月 AI 驾驶的 X-62A 与人类驾驶的 F-16 进行了模拟空战。DARPA 认为,X-62A 团队的成就将被视为类似 AlphaGo Zero 对国际象棋、将棋和围棋的影响,作为军事和商业应用的自主驾驶验证。

人工智能
Wilson(42865)
发表于2024年04月19日 14时06分 星期五
来自火星大师
Meta 发布了 80 亿和 300 亿参数版本的 Llama 3 模型,有 4050 亿参数的版本还在训练之中,将在未来几个月发布,将支持多模和多种语言间的交流,以及更长的上下文窗口。Llama 3 是开放模型,源代码和权重托管在 GitHub 和 Hugging Face 上。Meta 还开放了它的 AI 聊天服务 Meta AI,类似 OpenAI 的 ChatGPT,访问 Meta.ai 也无需注册,但如果要保留聊天记录需要登陆。Meta AI 支持美国、澳大利亚、加拿大、加纳、牙买加、马拉维、新西兰、尼日利亚、巴基斯坦、新加坡、南非、乌干达、赞比亚和津巴布韦等国家和地区的用户访问,可能因为欧盟的法律限制该服务目前不对欧盟用户开放。

人工智能
Wilson(42865)
发表于2024年04月18日 22时20分 星期四
来自彩虹尽头
印度总理莫迪(Narendra Modi)接受该国亚洲国际新闻社(ANI)采访时表示利用 AI 制定了 25 年发展蓝图。他的团队收集了 150 万人的意见,然后用 AI 精炼和分类。莫迪正寻求连任,竞选第三个总理任期,预计会轻松获胜。他没有透露发展路线图的细节,表示会在大选之后实施。他领导的印度人民党周二公布了竞选宣言,承诺利用 AI 打击非法毒品贸易,改善交通管理。其中包括投资 12.4 亿美元支持 AI 发展,构建基础设施,建造至少有 1 万个 GPU 的超算,以及推动构建本土大模型,等等。

人工智能
Wilson(42865)
发表于2024年04月18日 18时56分 星期四
来自总门谷
中科院深圳先进技术研究院、北大、中科大以及零一万物等学术机构和企业的研究人员最近推出了 COIG-CQIA 中文高质量指令微调数据集,旨在为中文自然语言处理社区提供高质量且符合人类交互行为的指令微调数据。他们的测试发现弱智吧的语料表现最出色。论文主要作者、深圳先进技术研究院研究生白岳霖澄清,他们只使用了弱智吧的标题,没有使用用户评论,“因为我们的目标是构建符合大模型指令微调质量需求的数据,而贴吧中网友的评论通常不适合直接作为微调数据,因此我们并没有将‘弱智吧’网友的评论纳入我们的数据中。”论文通讯作者、加拿大滑铁卢大学博士生张舸进一步解释:“‘弱智吧’中网友们绞尽脑汁想出来的‘弱智问题’,的确为大模型提供了角度清奇的高质量指令。但是帖子的回答,却有很多冒犯性表述甚至事实性错误,许多回答就是抖机灵、玩梗的,而GPT-4的回答基本上都‘很正经’,经过人工筛选基本上能得到较为可靠的回答。”

人工智能
Wilson(42865)
发表于2024年04月18日 00时18分 星期四
来自通灵师
法国 AI 创业公司 Mistral 宣布了其最新的开放大模型 Mixtral 8x22B,公布的测试显示它是目前最先进的开放模型。Mistral 称 8x22B 是真正开放的模型,使用 Apache 2.0 许可证,允许任何人不受限制的使用。它是一种稀疏 Mixture-of-Experts (SMoE)模型,有 1410 亿参数,但活跃参数仅为 390 亿,在其规模下提供了无与伦比的成本效率。Mixtral 8x22B 的优点包括:精通英语、法语、意大利语、德语和西班牙语,具有强大的数学和编码能力,原生能函数调用,64K 令牌上下文窗口。

科技
Wilson(42865)
发表于2024年04月17日 23时40分 星期三
来自永恒先生
在旧的液压版双足类人机器人 Atlas 退役之后,波士顿动力宣布了全电版本。波士顿动力称,新版本是为实际应用设计的,将加入其商业机器人 Spot 和 Stretch 的阵营,不再是原型而是商品了。波士顿动力将与客户合作测试电动版 Atlas,第一个合作对象是其母公司现代汽车,它将在未来几年不断测试和迭代 Atlas 应用,在旧版本的基础上扩大能力,满足不同客户环境的操作需求。

人工智能
Wilson(42865)
发表于2024年04月17日 13时54分 星期三
来自一九八四
微软亚洲研究院的中国研究人员周二发布了一个新的 AI 模型 WizardLM-2-7B,权重发布在 Hugging Face 平台上。但几小时后微软就将其从平台上移除。研究人员解释说,原因是他们意外错过了微软发布新模型前要求进行的安全测试步骤。一位知情人士表示,微软的 AI 政策要求,在发布任何 AI 模型前,必须首先获得公司委员会 Deployment Safety Board 的批准,该委员会将测试模型是否能执行有害任务,如生成暴力或令人不安的内容。WizardLM-2-7B 模型能完成文本生成、代码建议、翻译不同语言,或解决数学问题等任务。

人工智能
1
Wilson(42865)
发表于2024年04月16日 21时13分 星期二
来自人猿泰山之挚友金狮
今天流行的开源大模型主要由 Meta 和 Google 之类的巨头发布,而 OpenAI 等则转向了闭源,此外中国很多 AI 公司的大模型是在 Meta 的 Llama 开源模型基础上开发的。在深圳举行的 Create 2024 百度 AI 开发者大会上,百度 CEO 李彦宏站在了 OpenAI 闭源这边。他认为,开发者通过文心 4.0 降维裁剪出来的更小尺寸模型,要比直接拿开源模型调出来的模型,同等尺寸下效果明显更好;同等效果下,成本明显更低。“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”但开源模型一直在发展中,并非停滞不前。

人工智能
Wilson(42865)
发表于2024年04月16日 14时49分 星期二
来自巨石苍穹
奥特曼系列版权所有者日本圆谷制作披露,中国法院审判了一起与 AI 生成奥特曼相关的版权诉讼,判处被告侵权。去年中国运营商的网络服务中发现了酷似奥特曼的由生成式 AI 制作的图像。奥特曼中国代理商认为这是未经许可让 AI 学习版权作品后生成的图像,要求相关运营商停止服务及赔偿损失,并于今年 1 月提起了诉讼。广州互联网法院 2 月 8 日认定被告侵犯著作权。要求被告赔偿损失人民币 1 万元和防止图像生成的再度发生。

人工智能
Wilson(42865)
发表于2024年04月16日 14时39分 星期二
来自最后一个阿特兰蒂斯人
斯坦福公布了 2024 年 AI 指数报告:AI 在图像分类、视觉推理和英语理解等方面打败了人类,但在竞赛数学、视觉常识推理和规划等更复杂任务上不如人类;2023 年科技行业的企业发布了 53 个值得注意的机器学习模型,学界只发布了 15 个,学界和业界合作发布了 21 个;OpenAI 的 GPT-4 模型训练费用预计为 7800 万美元,而 Google Gemini Ultra 模型的计算成本约为 1.91 亿美元,先进模型的算力投资急剧上升;美国是先进 AI 模型的主要来源国,2023 年美国发布了 61 个先进的大模型,而欧盟是 21 个,中国是 15 个;美国的 AI 相关监管法规在 2023 年有 25 个,而在 2016 年只有 1 个;Ipsos 的调查显示认为 AI 在 3-5 年内显著影响生活的人的比例比 60% 上升到 66%,皮尤的数据显示 52% 的美国人表示对 AI 更感到担忧而不是兴奋,