2025年4月08日 人工智能前沿资讯

资讯2天前更新 ai_world
229 0 0

🩵
【新进展】
米哈游蔡浩宇的AI游戏,实机演示片段曝光
https://mp.weixin.qq.com/s/KyKm2jIPnhwIh0LTfjZQ-g

Llama 4发布36小时差评如潮!匿名员工爆料拒绝署名技术报告
https://mp.weixin.qq.com/s/OMFedXUghK-XJM7EEsMICQ

奥特曼最新访谈认可“套壳”:多数改变世界的公司,最初都是这样的
https://mp.weixin.qq.com/s/70uwMn5EiFa90Tpx2LWTEQ

清华耶鲁推理模型新范式:动态推理实现高效测试时扩展,大大节省Token消耗
https://mp.weixin.qq.com/s/kqTpfabyoFHno6q9H1WjnA

首个个性化对齐大模型问世,可精准识别用户内在动机和偏好
https://mp.weixin.qq.com/s/PnDcgkCrl4uUw7OyYEnRGA

【新应用】
Comprehensive Relighting(图像编辑-南加州大学、Adobe)
-可以控制和协调任何场景中任意身体部位的人体图像或视频的照明的一体化方法,同时保留输入图像中的高频细节
项目主页:https://junyingw.github.io/paper/relighting/

HumanDreamer-X(3D重建-GigaAI、中国科学院自动化研究所等)
-将多视图人体生成和重建集成到一个统一的管道中,显著提高重建3D模型的几何一致性和视觉保真度
项目主页:https://humandreamer-x.github.io

【新模型】
SkyReels-A2(图生视频模型-昆仑万维)
-能够根据文本提示将任意视觉元素(如人物、物体、背景)组装成合成视频,同时保持每个元素与参考图像的严格一致性
开源地址:https://huggingface.co/Skywork/SkyReels-A2

VARGPT-v1.1(文生图模型-北京大学、香港中文大学)
-在多模态理解和文本到图像指令遵循任务中实现了最先进的性能,且通过视觉指令调整获得了图像编辑功能
开源地址:https://github.com/VARGPT-family/VARGPT-v1.1

【新研究】
Multi-SWE-bench:问题解决的多语言基准(字节跳动Seed)
论文地址:https://arxiv.org/abs/2504.02605

【其他资讯】
“充电厂商”为何跨界AI眼镜?对话闪极创始人张波
https://mp.weixin.qq.com/s/79i9bvac1JfwAgQ99B0tIQ

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...