2025年3月21日人工智能前沿资讯

资讯8个月前更新 ai_world

1,249 0 0

😄
【新进展】
华为发布“阔形屏”折叠手机Pura X：7499拿下纯血鸿蒙+DeepSeek
https://mp.weixin.qq.com/s/s8YK_e777_BsRzFD5CfsCg

宇树机器人侧空翻惊呆网友
https://mp.weixin.qq.com/s/VQ1Ob0LWU8JMSFhDivX6Ww

DeepSeek上脸实测：AR眼镜实时翻译老黄GTC演讲
https://mp.weixin.qq.com/s/aks-jzH4W_qZ2zwuhd3meg

OpenAI推出语音智能体全家桶
https://mp.weixin.qq.com/s/kFUqoqeBcLPCv8sGemnuPA

群核科技SpatialLM模型正式开源
https://mp.weixin.qq.com/s/Q3HHUCBHHrNt2hfm4Lv0sA

李飞飞、吴佳俊团队新作：不需要卷积和GAN，更好的图像tokenizer来了
https://mp.weixin.qq.com/s/qwxVGyvspTDBzEvpovoc4g

Grok上线全新功能DeeperSearch
https://mp.weixin.qq.com/s/UmW3ng-JXW2XdKsWhd8Omg

【新应用】
DeepMesh（3D网格生成-清华大学、南洋理工大学、生数科技）
-以点云和图像为条件，生成具有复杂细节和精确拓扑的网格，在精度和质量方面均优于最先进的方法
项目主页：https://zhaorw02.github.io/DeepMesh/

FluxFlow（视频生成-Everlyn AI、香港科技大学等）
-显著提高各种视频生成模型（U-Net、DiT和基于AR的架构）的时间连贯性和多样性，同时保持了空间保真度
项目主页：https://haroldchen19.github.io/FluxFlow/

【新模型】
Orpheus 3B 0.1 Finetuned（文生语音模型-Canopy Labs）
-旨在生成高质量、富有同理心的文本转语音，经过微调可提供人类级别的语音合成，实现卓越的清晰度、表现力和实时流式传输性能
开源地址：https://huggingface.co/canopylabs/orpheus-3b-0.1-ft

Stable Virtual Camera（图生视频模型-Stability AI）
-在给定任意数量的输入视图和目标相机的情况下生成场景的3D一致新视图，可生成长达半分钟的高质量视频
开源地址：https://huggingface.co/stabilityai/stable-virtual-camera

【新研究】
φ-解码：用于平衡推理时间探索和利用的自适应前瞻采样
（上海AI Lab、西安交通大学、香港大学、北京大学、新加坡国立大学）
论文地址：https://arxiv.org/abs/2503.13288

【其他资讯】
杭州珠海之后，智谱再获成都投资3亿元
https://mp.weixin.qq.com/s/rnJDA4xkAFa7vSrWA8p3SQ

软银65亿美元全现金收购美国服务器CPU公司Ampere Computing
https://mp.weixin.qq.com/s/vU11EA1qDeLSOdqxB6CkMA