文章提交注意事项:
请在发布文章时用HTML代码加上至少一条新闻来源的链接;原创性消息,可加入相关信息(如涉及公司的网址)的链接。有任何问题,邮件至:he.fang#zhiding.cn
注意:收到邮件乱码的用户请修改客户端的默认字体编码,从"简体中文(GB2312)"修改为"Unicode(UTF-8)"。
solidot新版网站常见问题,请点击这里查看。
Solidot 公告
投 票
热门文章
-
- 仍然没有放弃软盘的人 (0)
- 修复免疫系统能延缓衰老 (0)
- IBM 开源 Granite 代码模型 (0)
- 梅琳达·盖茨退出盖茨基金会 (0)
- OpenAI 发布新的免费模型 GPT-4o (0)
- 上周末的太阳风暴影响了拖拉机的 GPS 系统 (0)
- 英特尔的 Aurora 超算突破 Exaflops (0)
- 美国警告勒索软件组织 Black Basta 对关键基础设施的攻击 (0)
- Frontier 继续称霸 Top500 超算榜单 (0)
- 贝多芬不太可能死于铅中毒 (0)
热门评论
- 使用开源并不是因为便宜 (1 points, 一般) by Craynic 在 2024年04月18日13时19分 星期四 评论到 李彦宏声称开源大模型更昂贵
- 火星的起源找着了 (1 points, 一般) by 18611782246 在 2024年04月15日21时15分 星期一 评论到 水星可能曾和地球一样大
- (1 points, 一般) by solidot1713165490 在 2024年04月15日15时19分 星期一 评论到 美国议员呼吁禁止进口中国制造的电动车
- AI 就像拼音输入法 (1 points, 一般) by jerry 在 2024年04月10日19时48分 星期三 评论到 Google 宣布辅助编程用的开放大模型 CodeGemma
- (1 points, 一般) by solidot1563266937 在 2024年03月02日08时20分 星期六 评论到 美国总统称中国联网汽车有国家安全风险
- You either die a hero (1 points, 一般) by lot 在 2024年02月29日13时34分 星期四 评论到 空气污染与严重痴呆症相关
- 只是从众 (1 points, 一般) by scottcgi 在 2024年02月27日00时40分 星期二 评论到 共情能传播,人能通过观察环境和其他人获得或失去同情心
- 有误 (1 points, 一般) by 陈少举 在 2024年02月23日10时04分 星期五 评论到 Google 暂停了 Gemini 的图像生成功能
- (1 points, 一般) by mirus 在 2024年02月22日14时34分 星期四 评论到 美国阿拉巴马州最高法院裁决冷冻胚胎是“儿童”
- 应该是137光年 (1 points, 一般) by solidot1707403802 在 2024年02月08日22时50分 星期四 评论到 NASA 在 137 亿光年外发现一颗位于宜居带的超级地球
清华大学联合生数科技发布了 Sora 的文本视频生成模型 Vidu。该模型采用 Diffusion 与 Transformer 融合的架构 U-ViT,支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。Vidu不仅能模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。清华大学教授、生数科技首席科学家朱军表示,与 Sora一致,Vidu 能够根据提供的文本描述直接生成长达 16 秒的高质量视频。除了在时长方面的突破外,Vidu 在视频效果方面实现显著提升,主要体现在模拟真实物理世界、多镜头语言、时空一致性高、理解中国元素等方面。朱军表示,Vidu 的快速突破源自于团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。其核心技术 U-ViT 架构由团队于 2022 年 9 月提出,早于 Sora 采用的 DiT 架构,是全球首个 Diffusion 与Transformer 融合的架构,完全由团队自主研发。目前使用
Vidu 需要申请。
微软 Windows 24H2 将包含名为 AI Explorer 的新工具。walkingdog 写道:
AI Explorer 的更多功能细节已经流出:AI Explorer 依赖 Windows 设备的 NPU 在后台进行运行,AI Explorer 会理解屏幕上所有应用和画面产生的行为并将它们记录为“记忆”,这些记忆可通过后续的搜索来进行调用,AI Explorer 的大多数计算工作都是在本地进行。AI Explorer 通过记忆提供多种交互方式:AI 搜索和基于上下文的应用操作。通过 AI Explorer 搜索框搜索设备上的记忆,搜索功能完全支持自然语言。比如:找回几天前在网页上看到的有关某些动物的内容,只需要在搜索框中输入“给我展示几天前我在网页上看到的关于某个动物的页面内容”即可。AI Explorer 可以让不同应用之间的内容进行交互协同,比如:在屏幕上打开两份文档,让 AI Explorer 进行对比分析并草拟邮件给出分析结果;在浏览图片时 AI Explorer 会提示一些图片编辑操作(移除背景)等。基于上下文的应用操作不需要开发者专门适配,完全由 AI Explorer 通过理解和学习屏幕内容而给出操作建议。