solidot新版网站常见问题,请点击这里查看。
人工智能
Wilson(42865)
发表于2024年12月03日 22时53分 星期二
来自彗星来临
腾讯混元大模型公布最新进展,上线视频生成能力。与此同时,腾讯开源该视频生成大模型,参数量 130 亿,是当前最大的视频开源模型。目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。该模型已上线腾讯元宝APP,用户可在 AI 应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入,API 同步开放内测申请。混元视频生成能力基于与 Sora 类似的 DiT 架构,并在架构设计上进行多多处升级。混元视频生成模型适配了新一代文本编码器提升语义遵循,其具备强大的语义跟随能力,更好地应对多个主体描绘,实现更加细致的指令和画面呈现;采用统一的全注意力机制,使得每帧视频的衔接更为流畅,并能实现主体一致的多视角镜头切换;通过先进的图像视频混合VAE(3D 变分编码器),让模型在细节表现有明显提升,特别是小人脸、高速镜头等场景。

人工智能
Wilson(42865)
发表于2024年12月03日 16时57分 星期二
来自月池
盖帝图片社(Getty Images) CEO Craig Peters 在《财富》上刊文批评了 AI 公司在版权上的立场。盖帝是一家出售图像版权的公司,因 AI 创业公司 Stability AI 涉嫌收集了数百万张盖帝可能持有版权的图像训练其 AI 模型 Stable Diffusion,盖帝正对其提起诉讼。盖帝 CEO 质疑了微软 AI 高管 Mustafa Suleyman 的观点,Suleyman 认为互联网上公开访问的内容都是“freeware”——类似免费软件可以免费使用。他认为应该根据具体情况应用合理使用原则,区分用于科学进步和用于生成商业内容的 AI 模型。音乐流媒体行业从共享平台 Napster 转向授权平台 Spotify,AI 公司也可以采用类似的授权模式。