😄
【新进展】
华为发布“阔形屏”折叠手机Pura X:7499拿下纯血鸿蒙+DeepSeek
https://mp.weixin.qq.com/s/s8YK_e777_BsRzFD5CfsCg
宇树机器人侧空翻惊呆网友
https://mp.weixin.qq.com/s/VQ1Ob0LWU8JMSFhDivX6Ww
DeepSeek上脸实测:AR眼镜实时翻译老黄GTC演讲
https://mp.weixin.qq.com/s/aks-jzH4W_qZ2zwuhd3meg
OpenAI推出语音智能体全家桶
https://mp.weixin.qq.com/s/kFUqoqeBcLPCv8sGemnuPA
群核科技SpatialLM模型正式开源
https://mp.weixin.qq.com/s/Q3HHUCBHHrNt2hfm4Lv0sA
李飞飞、吴佳俊团队新作:不需要卷积和GAN,更好的图像tokenizer来了
https://mp.weixin.qq.com/s/qwxVGyvspTDBzEvpovoc4g
Grok上线全新功能DeeperSearch
https://mp.weixin.qq.com/s/UmW3ng-JXW2XdKsWhd8Omg
【新应用】
DeepMesh(3D网格生成-清华大学、南洋理工大学、生数科技)
-以点云和图像为条件,生成具有复杂细节和精确拓扑的网格,在精度和质量方面均优于最先进的方法
项目主页:https://zhaorw02.github.io/DeepMesh/
FluxFlow(视频生成-Everlyn AI、香港科技大学等)
-显著提高各种视频生成模型(U-Net、DiT和基于AR的架构)的时间连贯性和多样性,同时保持了空间保真度
项目主页:https://haroldchen19.github.io/FluxFlow/
【新模型】
Orpheus 3B 0.1 Finetuned(文生语音模型-Canopy Labs)
-旨在生成高质量、富有同理心的文本转语音,经过微调可提供人类级别的语音合成,实现卓越的清晰度、表现力和实时流式传输性能
开源地址:https://huggingface.co/canopylabs/orpheus-3b-0.1-ft
Stable Virtual Camera(图生视频模型-Stability AI)
-在给定任意数量的输入视图和目标相机的情况下生成场景的3D一致新视图,可生成长达半分钟的高质量视频
开源地址:https://huggingface.co/stabilityai/stable-virtual-camera
【新研究】
φ-解码:用于平衡推理时间探索和利用的自适应前瞻采样
(上海AI Lab、西安交通大学、香港大学、北京大学、新加坡国立大学)
论文地址:https://arxiv.org/abs/2503.13288
【其他资讯】
杭州珠海之后,智谱再获成都投资3亿元
https://mp.weixin.qq.com/s/rnJDA4xkAFa7vSrWA8p3SQ
软银65亿美元全现金收购美国服务器CPU公司Ampere Computing
https://mp.weixin.qq.com/s/vU11EA1qDeLSOdqxB6CkMA