奇客资讯网

文章
往日文章往日投票
皮肤
蓝色橙色绿色浅绿色

关注我们：

solidot新版网站常见问题，请点击这里查看。

Solidot 公告

文章提交注意事项：
请在发布文章时用HTML代码加上至少一条新闻来源的链接；原创性消息，可加入相关信息（如涉及公司的网址）的链接。有任何问题，邮件至：he.fang#zhiding.cn
注意：收到邮件乱码的用户请修改客户端的默认字体编码，从"简体中文（GB2312）"修改为"Unicode（UTF-8）"。

投票

快速链接

科技: Google 支持一千种语言的大 AI 模型取得进展

Wilson(42865)

发表于2023年03月07日 23时04分星期二
来自时间捕手

Google 宣布它正朝着支持一千种语言的大 AI 模型的目标前进。搜索巨人是在去年 11 月宣布千种语言倡议（1,000 Languages Initiative），旨在构建一个机器学习模型能翻译世界上最常用的 1000 种口语，给全世界居民带来更大的包容性。本周一，Google 分享了其 Universal Speech Model(USM)的更多信息。USM 是一个语音模型家族，有 20 亿个参数，使用 1200 万小时的语音和逾 300 种语言的 280 亿文本语句训练。Google 研究人员在预印本平台 arXiv 上发表了论文《Google USM: Scaling Automatic Speech Recognition Beyond 100 Languages》，利用无标签多语言大数据集预训练模型，在较小的有标签数据集上微调，使之能识别代表性不足的语言。USM 已被 YouTube 用于生成隐藏式字幕，它还支持自动语音识别（ASR），自动检测和翻译语言，包括英语、普通话、阿姆哈拉语、宿务语、阿萨姆语等。现在 USM 支持逾 100 种语言，将作为一个基础去构建更庞大的语言系统。

科技: 企业软件创业公司拥抱生成式 AI

Wilson(42865)

发表于2023年03月07日 22时07分星期二
来自少年侠

瑞银估计，OpenAI 的 AI 聊天机器人 ChatGPT 在今年 1 月吸引了逾一亿用户。在此之后，更多初创公司试图将这一热潮带入商业市场，以 ChatGPT 语言模型为基础建立企业应用，或利用类似的生成式 AI 功能。根据市场分析机构 PitchBook 的数据，去年全球风投通过 78 笔交易向开发生成式 AI 软件的初创企业投入了 13 亿美元。投资规模接近过去五年类似初创企业获得的资金总额，而且是在风投交易普遍放缓的情况下发生的。

科技: ChatGPT 是如何构建的

Wilson(42865)

发表于2023年03月07日 13时40分星期二
来自人猿泰山之绝地反击

当 OpenAI 在 2022 年 11 月发布 ChatGPT 时它并没有预料到这个 AI 聊天机器人会取得难以想象的成功。OpenAI 内部将之视为研究预览，旨在收集公众的反馈消除部分缺陷。参与开发 ChatGPT 的科学家 Liam Fedus 说，我们不想将其夸大为一次巨大的基础性突破。MIT 科技评论采访了 OpenAI 的科学家以及联合创始人 John Schulman，揭示 ChatGPT 的开发过程和技术细节，介绍 ChatGPT 是如何构建的。自去年 11 月以来，OpenAI 已经多次更新了 ChatGPT，主要是通过对抗性训练阻止用户诱骗聊天机器人绕过限制——这种做法被称为越狱。对于 ChatGPT 的巨大成功，OpenAI 团队也有几分感到不解，因为 ChatGPT 使用的技术都不是新的，ChatGPT 使用了微调版的 GPT-3.5，而 GPT-3.5 是 2020 年发布的 GPT-3 的更新版，OpenAI 在 2022 年 1 月发布了微调版 GPT-3.5 的预览。相关 API 也早就发布了，不过这些都不是面向公众的。