solidot新版网站常见问题,请点击这里查看。
科技
Wilson(42865)
发表于2024年05月07日 16时45分 星期二
来自火星战士
在积累了电池相关技术之后,中国电动汽车制造商开始在垂直起降的电动飞行汽车(eVTOL)上发力。小鹏旗下的广东汇天航空航天科技计划销售可在陆地上以汽车模式行驶、在到达起飞地点从后部分离出 eVTOL 从而实现飞行的分体式 eVTOL。中国民航局于 3 月受理了商业运营所需的型号合格证申请,目前已进入审查阶段。小鹏汇天计划 10~12 月在中国开启预售,最早于2025~2026 年量产,价格在人民币 100 万元以上。亿航智能于 2023 年 10 月获得了“EH216-S”的型号合格证。该机型可乘坐两人,充电一次可飞行 25 分钟,于 4 月 1 日开始销售,售价为 239 万元。亿航智能打算与酒店等合作,通过旅游服务实现商用化。根据招商证券发布的报告显示,中国占全球 eVTOL 机型总数的 5 成,遥遥领先于美国(18%)和德国(8%)。

人工智能
Wilson(42865)
发表于2024年05月07日 14时31分 星期二
来自没有你的天堂
微软内部开发了一个新模型能与 Google、Anthropic 和 OpenAI 的最先进模型相抗衡。该模型内部被称为 MAI-1,由前 Google DeepMind 联合创始人 Mustafa Suleyman 负责,Suleyman 此前担任了 AI 创业公司 Inflection 的 CEO,微软在今年 3 月以 6.5 亿美元收购了其知识产权,雇佣了大部分员工。MAI-1 是微软的全新模型,不是继承自 Inflection,但可能使用了来自 Inflection 的训练数据和其它技术。知情人士称,MAI-1 的参数规模远大于微软此前发布的开源 AI 模型,需要更多的算力和训练数据,成本也更昂贵。MAI-1 将有大约 5000 亿个参数,可进行调整以决定模型在训练期间学习哪些内容。相比下,OpenAI 的 GPT-4 有逾万亿个参数, Meta 和 Mistral 等目前发布的开源模型只有 700 亿个参数。

科技
Wilson(42865)
发表于2024年05月06日 23时48分 星期一
来自失忆者
美国限制芯片出口正在扼杀中国在关键技术领域的进步。过去两年,生成式 AI 技术的发展推动了对 AI 芯片的高涨需求。而英伟达和 AMD 帮助美国在 AI 芯片领域占据了绝对的领先地位。然而美国限制了对华出口特定计算性能以上的 AI 芯片。清华大学的电机工程师 Yu Wang 说,我们无法获得高端英伟达芯片,也无法制造高端芯片。台积电等代工厂只允许为大陆制造低端芯片,因此中国只能在自己境内制造高性能芯片。加州圣何塞的工程师 Ahmed Banafa 表示,中国在 AI 芯片上落后美国 5-10 年。华为正在开发自己的 AI 芯片,但制造芯片的最先进技术只有 7 纳米,而台积电三星等公司已经转向 3 纳米甚至 2 纳米技术。AI 投资基金 Leonis Capital 的合伙人 Jenny Shaw 表示,中国已经出现了高端芯片的黑市,如果你想要购买 5000 个芯片,这很难不会引起注意。但如果你是一家小型创业公司,那么禁令不会影响你。在 AI 领域缺乏竞争力可能会加剧人才的流失。

科技
Wilson(42865)
发表于2024年05月06日 16时06分 星期一
来自霸主的影子
宾夕法尼亚大学科学家研制出一种可在 600℃ 高温下持续工作 60 小时的存储器。研究报告发表在《自然·电子学》杂志上。相较之下,传统硅基闪存在温度超过 200℃ 时便开始失效,导致设备故障和信息丢失。最新存储器使用铁电氮化铝钪(AlScN)研制而成。AlScN 具有存储优势,因为它能在去除外部电场后,在更高温度下保持开和关等特定电状态。其独特晶体结构也使原子间的键更稳定和牢固,不仅耐热,而且非常耐用。存储设备的设计和性能也可在不同电状态间快速切换,这对于高速数据读写至关重要。该存储设备由金属—绝缘体—金属结构组成,包括镍和铂电极以及一层 45 纳米厚的 AlScN。这种结构设计使该存储器能与高温碳化硅逻辑器件兼容,与专为极端温度设计的高性能计算系统协同工作。

索尼
Wilson(42865)
发表于2024年05月05日 22时47分 星期日
来自少数派报告
索尼发行、Arrowhead 工作室开发的多人合作射击游戏《Helldivers 2》是今年至今最畅销的作品之一。但索尼最新的一项决定在整个游戏社区引发了玩家的强烈抗议,在 Steam 上游戏遭遇了差评轰炸,玩家已留下了逾二十万条差评。引发大规模抗议的诱因是索尼要求《Helldivers 2》玩家通过 PSN 账号登陆,这听起来不是天大的事情,Steam 平台有很多发行商有类似要求,然而问题在于 PSN 在逾百个国家不提供服务(195 个国家只有 75 个国家支持),意味着这些国家的玩家将无法玩游戏。Arrowhead CEO 表示对于 PSN 不支持的国家他也不知道怎么办,表示正在与索尼讨论解决方案。但显然这已经超出了他能控制的范围。根据 SteamDB 上的纪录,对于 PSN 不支持的国家,索尼开始限制这些国家的用户购买 《Helldivers 2》。对于这起事件,Valve 已经开始允许用户退款,即使他们的游戏时长已经超过 2 小时。更新:索尼宣布不再推行强制性 PSN 账号关联。

人工智能
Wilson(42865)
发表于2024年05月04日 23时29分 星期六
来自诺比、龙和意识星云
对科学论文中特定单词使用频率的分析显示,愈来愈多的科学家使用 AI 撰写论文。伦敦大学学院 Andrew Gray 在 3 月发表的一项研究表明,2023 年发表的论文中有 1% 至少部分是由 AI 撰写的。斯坦福大学团队于 4 月发表的第二项研究称,这一数字可能在 6.3%-17.5% 之间,具体取决于论文主题。两项研究都是寻找论文中大模型常用的单词,如 intricate、pivotal 和 meticulously。在 Gray 的研究中,从 2019-2023 年,控制组的单词如 red、conclusion 和 after 的使用频率发生了几个百分点的变化,相比下 meticulous、commendable 和 intricate 等大模型常用词的使用频率分别增加了 59、83 和 117%,而在 2019-2022 年间它们的使用频率几乎没有变化。斯坦福大学的研究发现,realm、showcasing、intricate 和 pivota 单词的使用频率比 2021 年 和 2022 年分别增加了 80%、80%、120% 和近 160%。研究表明,缺乏时间和写作的需求会鼓励使用大模型,大模型有助于增加研究者的论文数量。

人工智能
Wilson(42865)
发表于2024年05月04日 23时08分 星期六
来自勇者物语
美国国务院军控局的首席副助理国务卿 Paul Dean 在一封声明中表示,美国、英国和法国都发表声明,承诺将核武器完全控制在人类而不是 AI 手中,欢迎中国和俄罗斯也发表类似的声明。他说,我们认为这是一种极重要的负责任行为规范,有五大常任理事国的支持会非常受欢迎。美国国务卿 Antony Blinken 上周访问了中国,讨论了核武器和 AI 相关问题。Blinken 称,双方同意未来几周就 AI 问题举行首次双边会谈。

Windows
Wilson(42865)
发表于2024年05月02日 22时22分 星期四
来自终极失控
根据 Statcounter 的统计,Windows 10 即将于明年终止支持,但它的市场份额在 2024 年 4 月反而增加了,增加了 0.96 个百分点至 70.03%,而 Windows 11 则丢失了 0.97 百分点,从 26.68% 降至 25.65%。为什么 Windows 11 的市场份额会下降?可能是因为它最近负面新闻太多,比如说微软开始在“开始”菜单上展示广告。这样一个不断增加广告降低用户体验的操作系统可能难以赢得用户的青睐。

人工智能
Wilson(42865)
发表于2024年04月30日 22时54分 星期二
来自拥王者的女儿
对数百份 LinkedIn 资料和 AI 论文作者的分析发现,搜索巨人是苹果 AI 专家的最大单一来源。苹果至少从 Google 挖走了 36 名 AI 专家,其中包括 2018 年雇佣 John Giannandrea 担任其 AI 团队负责人。Giannandrea 在 Google 工作了八年,领导了其 AI 研究部门。苹果 AI 团队的大部分成员在加州和西雅图工作,在收购了瑞士苏黎世的两家 AI 创业公司——FaceShift 和 Fashwell——之后,苹果在当地建立了一个被称为 Vision Lab 的实验室。苹果还为苏黎世的两处办公室招募雇员。竞争对手微软、Google 和亚马逊都在生成式 AI 上投资了数十亿美元,而苹果一直对其 AI 计划守口如瓶,但随着股价的下跌,该公司也面临越来越大的压力。业内人士称,苹果正专注于在移动设备上部署 AI 模型,让生成式 AI 应用在本地而不是依赖于云端运行。但在手机上运行大模型对硬件性能提出了更高的要求。

人工智能
Wilson(42865)
发表于2024年04月29日 18时40分 星期一
来自平行恋人
清华大学联合生数科技发布了 Sora 的文本视频生成模型 Vidu。该模型采用 Diffusion 与 Transformer 融合的架构 U-ViT,支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。Vidu不仅能模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。清华大学教授、生数科技首席科学家朱军表示,与 Sora一致,Vidu 能够根据提供的文本描述直接生成长达 16 秒的高质量视频。除了在时长方面的突破外,Vidu 在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。朱军表示,Vidu 的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术 U-ViT 架构由团队于 2022 年 9 月提出,早于 Sora 采用的 DiT 架构,是全球首个 Diffusion 与Transformer 融合的架构,完全由团队自主研发。目前使用 Vidu 需要申请。

人工智能
Wilson(42865)
发表于2024年04月29日 00时10分 星期一
来自智者之惧
微软 Windows 24H2 将包含名为 AI Explorer 的新工具。walkingdog 写道: AI Explorer 的更多功能细节已经流出:AI Explorer 依赖 Windows 设备的 NPU 在后台进行运行,AI Explorer 会理解屏幕上所有应用和画面产生的行为并将它们记录为“记忆”,这些记忆可通过后续的搜索来进行调用,AI Explorer 的大多数计算工作都是在本地进行。AI Explorer 通过记忆提供多种交互方式:AI 搜索和基于上下文的应用操作。通过 AI Explorer 搜索框搜索设备上的记忆,搜索功能完全支持自然语言。比如:找回几天前在网页上看到的有关某些动物的内容,只需要在搜索框中输入“给我展示几天前我在网页上看到的关于某个动物的页面内容”即可。AI Explorer 可以让不同应用之间的内容进行交互协同,比如:在屏幕上打开两份文档,让 AI Explorer 进行对比分析并草拟邮件给出分析结果;在浏览图片时 AI Explorer 会提示一些图片编辑操作(移除背景)等。基于上下文的应用操作不需要开发者专门适配,完全由 AI Explorer 通过理解和学习屏幕内容而给出操作建议。

人工智能
Wilson(42865)
发表于2024年04月28日 20时46分 星期日
来自少数派报告
Pikesville High School 前体育指导员 Dazhon Darien 周四被捕,被控多项罪名,其中之一是伪造了校长 Eric Eiswert 的声音,在社交媒体上发布了种族主义言论,导致了校长被停职。警方称,Darien 制作 AI 语音是为了报复校长,因为校长已对学校资金可能被不正确处理发起调查。他制作的语音模拟校长的声音贬低了黑人学生和犹太社区,该语音在社交媒体上广泛传播。校长被停职,社交媒体传播着一波又一波仇恨信息,学校收到了大量电话。Darien 被捕时正准备飞往休斯顿,他随身携带了武器。

人工智能
Wilson(42865)
发表于2024年04月27日 23时23分 星期六
来自月光狂想曲
Windows 11 的一个预览版本 Insider Build 26200 被发现包含了一个 AI 硬件规格检测工具 AI Explorer。如果你的 PC 硬件未达到标准,它将显示水印形式的警告。目前的 AI Explorer 针对的是 Windows 11 的 ARM64 版本,要求系统配备 NPU 以及 16 GB 内存和 225 GB 系统存储空间。x86 版本目前所知的是 Windows 11 24H2 强制性要求 CPU 必须支持 SSE4.2 指令集,而今天几乎所有 x86 CPU 都支持该指令集。

人工智能
Wilson(42865)
发表于2024年04月26日 23时21分 星期五
来自猛兽的财富
阿里巴巴发布了首个千亿参数的大模型 Qwen1.5-110B。此前它发布了 0.5B、1.8B、4B、7B、14B 和 72B 不同规模参数的版本。阿里巴巴称,Qwen1.5-110B 模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 AlpacaEval 2.0。Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

人工智能
Wilson(42865)
发表于2024年04月25日 23时57分 星期四
来自大魔法师
Adobe 研究人员发表了一篇预印本论文,介绍了一种新的生成式 AI 模型 VideoGigaGAN,它能让将视频分辨率提升到原始分辨率的八倍。研究人员称 VideoGigaGAN 优于其它视频超分辨率(Video Super Resolution 或 VSR)重建方法,能提供更细粒度的细节,不会引入任何 AI 制造的幻影。现有的 VSR 方法如 GAN(Generative Adversarial Networks)能有效提升静态图像的分辨率,但提升视频的分辨率则容易引入闪烁或伪影;其它 VSR 方法能避免这些问题,但清晰度或细节不够。VideoGigaGAN 能综合现有方法的长处,有更高的图像/视频质量,同时能减少闪烁或失真问题。

人工智能
Wilson(42865)
发表于2024年04月25日 17时50分 星期四
来自火星战士
苹果发布了它的开放模型 OpenELM,可以在本地设备而不是云端运行。OpenELM 的权重、训练的不同检查点(checkpoints)、预训练评估微调等的指南都公布在 Hugging Face 平台上。示例代码许可并不禁止商业使用或修改,只是要求在重新发布时包含苹果完整且没有修改过的声明。OpenELM 由一组旨在高效执行文本生成任务的小模型组成,共八个模型,四个预训练四个指令微调,参数规模从 2.7 亿到 30 亿。

人工智能
Wilson(42865)
发表于2024年04月24日 00时01分 星期三
来自月缘
微软发布了其轻量级模型 Phi-3,其中最小版本 Phi-3 Mini 的权重已发布在 Hugging Face 上。Phi-3 有三个版本:Phi-3 Mini 有 38 亿参数,未来计划发布的 Phi-3 Small 有 70 亿参数,Phi-3 Medium 有 140 亿参数。微软高管称 Phi-3 Mini 的性能与 GPT-3.5 接近,但参数规模要小得多。相比参数规模更大的模型,小模型运行开销更低,在个人设备如手机和笔记本上表现更好。

人工智能
Wilson(42865)
发表于2024年04月23日 15时22分 星期二
来自开普罗纳的魔法师
AI 需要消耗大量的电,以至于为满足电力需求科技公司进入了能源行业。OpenAI CEO Sam Altman 最近投资了用太阳能为数据中心供电的公司 Exowatt,OpenAI 的合作伙伴微软正寻求获得核能批准,以帮助运营 AI 服务。去年 AI 公司 Anthropic 的主要投资者亚马逊表示投资了逾 100 个可再生能源项目,使其“连续第四年成为全球最大的可再生能源企业买家”。

人工智能
Wilson(42865)
发表于2024年04月20日 22时56分 星期六
来自人类向何处去
Linus Torvalds 与 Verizon Open Source Program Office 负责人 Dirk Hohndel 谈论了近期火热无比的 AI。Torvalds 讽刺的说,“看起来很搞笑!也许我会被 AI 模型取代!”Hohndel 认为今天的 AI 只是一种更强大的自动修正工具。Torvalds 认为需要再等十年才能知道 AI 会走向何处。Torvalds 已经注意到 AI 狂热对内核的影响——作为 AI 热的最大受益者英伟达公司,其开发者与内核开发者之间的沟通更频繁,该公司正在改进内核的内存管理,因为它需要 Linux 更高效的运行 AI 大模型。Torvalds 对 AI 产生的错误信息表达了谨慎,Hohndel 开玩笑的说这是美丽科学,“美丽科学进,美丽科学出。”

人工智能
Wilson(42865)
发表于2024年04月19日 23时57分 星期五
来自方舟
微软亚洲研究院发布了 VASA-1 模型,该模型能根据一个人的一张照片和一条音轨生成其说话或唱歌的同步动画视频。VASA 代表 Visual Affective Skills Animator,它使用了机器学习分析静态图像和音频片段,然后生成有精确面部表情、头部运动以及与音频口型同步的逼真视频。微软声称该模型在真实性、表现力和效率方面显著优于以前的语音动画方法。微软研究员使用了 VoxCeleb2 数据集训练了 VASA-1。该数据集包含了 6112 位名人的逾 100 万条话语,提取自上传到 YouTube 的视频。VASA-1 能以每秒最高 40 帧的速度生成 512x512 像素分辨率的视频,它潜在可用于深度伪造,研究人员没有公开模型源代码。