2025年4月23日 人工智能前沿资讯

资讯2天前更新 ai_world
1,019 0 0

☕️

【新进展】
清华特奖得主团队视频生成AI一夜刷屏,100%开源+61页技术报告,还能无限扩展生成
https://mp.weixin.qq.com/s/pWWdTBNBULRiT9GwR6tDKw

21岁学生开发AI作弊工具被哥大停学,转身拿下530万美元融资
https://mp.weixin.qq.com/s/KAi9q_FLfkc6jTvHMn41JQ

Vidu Q1登榜全球文生视频第一、图生视频榜单双专项第一
https://mp.weixin.qq.com/s/UHOYgeu5b6G6Cjagw3s5Cg

OpenAI或将收购谷歌浏览器Chrome
https://mp.weixin.qq.com/s/K6WxP5U_IckvFYy54g_zjA

【新应用】
SphereDiff(视频生成-KAIST)
-无需额外调优即可生成无缝的360度全景图像和视频,减轻等距矩形投影的畸变,可应用于沉浸式AR/VR
项目主页:https://pmh9960.github.io/research/SphereDiff/

StyleMe3D(3D重建-上海科技大学、阶跃星辰等)
-用于3D高斯溅射风格转换,集成了多模态风格调节、多级语义对齐和感知质量增强,在保留几何细节和确保场景间风格一致性上表现卓越
项目主页:https://styleme3d.github.io

【新模型】
Dia-1.6B(文生语音模型-Nari Labs)
-可以直接从文字记录生成高度逼真的对话,允许根据音频调整输出,控制情绪和语调,且支持生成笑声、咳嗽声等非语言交流
开源地址:https://huggingface.co/nari-labs/Dia-1.6B

MAGI-1(图生视频模型-Sand AI)
-在以文本指令为条件的I2V任务中表现出色,提供了高度的时间一致性和可扩展性,还通过逐块提示支持可控生成,实现流畅的场景过渡
开源地址:https://huggingface.co/sand-ai/MAGI-1

【新研究】
强化学习真的能激励大语言模型超越基础模型的推理能力吗?
(清华大学LeapLab、上海交通大学)
论文地址:https://arxiv.org/abs/2504.13837

【其他】
清华团队造出“论文卷姬”:3分钟速通200小时文献综述
https://mp.weixin.qq.com/s/l3INrZiRX_r60nX6lByAdA

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...