2025年4月21日 人工智能前沿资讯

资讯2天前更新 ai_world
246 0 0

☕️

【新进展】
「全尺寸」人形机器人天工Ultra拿下首个人形机器人半马冠军
https://mp.weixin.qq.com/s/S7tiV8g6L2Y02M-aqU7xcA

实测通义Wan2.1首尾帧视频模型,还能“拼接”经典梗图
https://mp.weixin.qq.com/s/j-F1eNH-hjxUVFRXw_njnQ

全球最快闪存问世:复旦团队实现亚纳秒级闪存擦写速度
https://mp.weixin.qq.com/s/J2unfPCLKv-rQkN8wN9lig

o3幻觉率狂飙,强化学习是祸首
https://mp.weixin.qq.com/s/rQXOpEjXjFi-cE331D3eFg

【新应用】
DMM(图像生成-南京大学、阿里巴巴等)
-紧凑地重组来自多个教师模型的知识,并实现可控的任意风格生成
项目主页:https://github.com/MCG-NJU/DMM

FocusedAD(视频字幕生成-浙江大学、新加坡国立大学)
-提供以角色为中心的电影音频描述,生成包含丰富剧情相关细节和指定角色的叙述
项目主页:https://github.com/Thorin215/FocusedAD

【新模型】
Wan2.1-FLF2V-14B-720P(视频生成模型-阿里通义)
-在多个基准测试中超越现有开源模型和最先进的商业解决方案,支持消费级GPU,支持视频生成领域多种任务处理
开源地址:https://huggingface.co/Wan-AI/Wan2.1-FLF2V-14B-720P

UI-TARS-1.5(视觉语言模型-字节跳动Seed)
-开源多模态智能体,集成了强化学习支持的高级推理功能,在游戏和GUI任务方面表现出色
开源地址:https://huggingface.co/ByteDance-Seed/UI-TARS-1.5-7B

【新研究】
CLIMB:基于聚类的迭代数据混合引导语言模型预训练(英伟达)
论文地址:https://arxiv.org/abs/2504.13161

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...