2025年4月23日人工智能前沿资讯

☕️

【新进展】
清华特奖得主团队视频生成AI一夜刷屏，100%开源+61页技术报告，还能无限扩展生成
https://mp.weixin.qq.com/s/pWWdTBNBULRiT9GwR6tDKw

21岁学生开发AI作弊工具被哥大停学，转身拿下530万美元融资
https://mp.weixin.qq.com/s/KAi9q_FLfkc6jTvHMn41JQ

Vidu Q1登榜全球文生视频第一、图生视频榜单双专项第一
https://mp.weixin.qq.com/s/UHOYgeu5b6G6Cjagw3s5Cg

OpenAI或将收购谷歌浏览器Chrome
https://mp.weixin.qq.com/s/K6WxP5U_IckvFYy54g_zjA

【新应用】
SphereDiff（视频生成-KAIST）
-无需额外调优即可生成无缝的360度全景图像和视频，减轻等距矩形投影的畸变，可应用于沉浸式AR/VR
项目主页：https://pmh9960.github.io/research/SphereDiff/

StyleMe3D（3D重建-上海科技大学、阶跃星辰等）
-用于3D高斯溅射风格转换，集成了多模态风格调节、多级语义对齐和感知质量增强，在保留几何细节和确保场景间风格一致性上表现卓越
项目主页：https://styleme3d.github.io

【新模型】
Dia-1.6B（文生语音模型-Nari Labs）
-可以直接从文字记录生成高度逼真的对话，允许根据音频调整输出，控制情绪和语调，且支持生成笑声、咳嗽声等非语言交流
开源地址：https://huggingface.co/nari-labs/Dia-1.6B

MAGI-1（图生视频模型-Sand AI）
-在以文本指令为条件的I2V任务中表现出色，提供了高度的时间一致性和可扩展性，还通过逐块提示支持可控生成，实现流畅的场景过渡
开源地址：https://huggingface.co/sand-ai/MAGI-1

【新研究】
强化学习真的能激励大语言模型超越基础模型的推理能力吗？
（清华大学LeapLab、上海交通大学）
论文地址：https://arxiv.org/abs/2504.13837

【其他】
清华团队造出“论文卷姬”：3分钟速通200小时文献综述
https://mp.weixin.qq.com/s/l3INrZiRX_r60nX6lByAdA

文章版权归作者所有，未经允许请勿转载。

8个月前

08240

8个月前

07620

6个月前

01200

1年前

01,2030

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...