solidot新版网站常见问题,请点击这里查看。
人工智能
1
Wilson(42865)
发表于2023年07月11日 22时58分 星期二
来自沙皇的邮件
AI 创业公司 Anthropic 宣布了新大语言模型 Claude 2。Claude 2 改进了性能,响应时间更长,可通过 API 访问,它同时推出了面向公众的 beta 网站 claude.ai(尚未对中国大陆开放)。Anthropic 称,Claude 2 在律考多项选择部分的得分为 76.5%,高于 Claude 1.3 的 73.0%;相比申请研究生院的大学生,Claude 2 在 GRE 阅读和写作考试中的得分高于 90%,数量推理得分与申请者的中位数相当。Anthropic 表示,Claude 2 的企业 API 价格与 Claude 1.3 相同。

人工智能
1
Wilson(42865)
发表于2023年07月11日 19时30分 星期二
来自天堂的喷泉
OpenAI 今年初公布的新一代大模型 GPT-4 的技术细节泄露,它有 1.8 万亿个参数,利用了 16 个混合专家模型(mixture of experts),每个有 1110 亿个参数,每次前向传递路由经过两个专家模型。它有 550 亿个共享注意力参数,使用了包含 13 万亿 tokens 的数据集训练,tokens 不是唯一的,根据迭代次数计算为更多的 tokens。GPT-4 预训练阶段的上下文长度为 8k,32k 版本是对 8k 微调的结果。如果是在云端进行训练,以 每 A100 小时 1 美元计算,那么一次的训练成本就高达 6300 万美元。不过今天的训练成本能降至 2150 万美元。

科技
Wilson(42865)
发表于2023年07月11日 00时00分 星期二
来自图书馆员与黄金锅
SpaceX Falcon 9 火箭使用的第一级 B1058-16 周日完成了创记录的第 16 次发射,在完成 Starlink 宽带卫星发射任务之后成功着陆在无人驳船 Just Read the Instructions 上。B1058 的首次发射是在 2020 年 5 月 20 日执行 Crew Dragon Demo 2 载人飞行演示任务,之后的任务包括 ANASIS-II、CRS-21、Transporter-1、Transporter-3,以及 10 次 Starlink 发射。B1058 的上一次飞行是在 200 多天前。它的第 16 次任务是 Starlink 6-5,将 22 颗第二代 Starlink V2 mini 卫星送入轨道。