solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2025年04月17日 18时05分 星期四
来自森林送信人
微软研究人员声称,他们开发出迄今为止规模最大的 1 位 AI 模型 bitnet。该模型命名为 BitNet b1.58 2B4T,采用 MIT 许可证发布,能在包括苹果 M2 处理器在内的各种 CPU 上运行。大模型是通过修改人工神经元之间的连接强度进行训练,连接强度以数学参数的形式储存。通过减少参数的精度研究人员能压缩网络,这一过程被称为量化,参数的位数能从 16 位减少到 8 或 4 位,研究人员正致力于将其推向极限——以 1 位精度储存参数。压缩能让模型在低端硬件上运行。bitnet 将权重量化为三个值:-1、0 和 1,其内存和计算效率远高于大多数模型。BitNet b1.58 2B4T 是首个拥有 20 亿个参数的 bitnet,测试中该模型在包括 GSM8K(小学水平数学题库)和 PIQA(测试物理常识推理能力)的测试中超过了 Meta 的 Llama 3.2 1B、Google 的 Gemma 3 1B 和阿里巴巴的 Qwen 2.5 1.5B。

科技
Wilson(42865)
发表于2025年04月17日 00时33分 星期四
来自独眼巨人的笑声
随着芯片上的晶体管日益致密,热量问题日益难以忽视。温度会影响芯片的性能、功耗和能效。随着时间的推移,过多的热量会减慢处理器中关键信号的传输速度,导致芯片性能永久性下降。它还会导致晶体管泄漏更多电流,浪费电,增加能耗。问题的根源在于半导体电子学中另一个定律 Dennard scaling 的终结。芯片逻辑电路的密度日益增长,功率密度也随之增长,产生了副产品热量。对 A10(指 10 埃或 1 纳米)和 A5 工艺节点的分析显示,A5 节点的功率密度比 A10 节点高出 12% 到 15%。在相同工作电压下,功率密度的提升将导致温度预计上升 9°C。