solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2024年05月11日 18时49分 星期六
来自空色勾玉
日本东京工业大学、理化学研究所、富士通等发布增强日语能力的大模型 Fugaku-LLM,移植了 Megatron-DeepSpeed 深度学习框架,源代码托管在 GitHub 上,公众可通过 Fujitsu Research Portal 网站试用。Fugaku-LLM 有 130 亿参数,日语 MT-Bench 平均分 5.5,其人文和社会科学得分高达 9.18 分。Fugaku-LLM使用了日本最强大的 ARM 超算富岳进行了训练。

人工智能
Wilson(42865)
发表于2024年05月11日 00时18分 星期六
来自夜焰
Mozilla 创新实验组 Ocho 的一个创新产品是 Llamafile,它旨在简化大模型的部署,让用户和开发者更容易访问大模型。Llamafile 支持跨平台,支持 CPU 和 GPU 执行,其最新版本 v0.8.2 合并了多个 AVX2 优化补丁。AVX2 或 Advanced Vector Extensions 2 指令集扩展已被英特尔和 AMD 的 CPU 的广泛支持,新的优化包括了更快的 AVX2 提示处理,Q5_K_M 等量化方法的速度改进达到了之前的 1.4~2.3 倍。