🩵小编👇
【新进展】
陶哲轩DeepMind梦幻联动,最强通用科学Agent来了:一口气解决芯片设计、矩阵乘法和300年几何难题
https://mp.weixin.qq.com/s/M9muLk9Bshu_3WWoF7UFdg
讯飞AI耳机新品1499开卖,三年成绩单公布:用户破百万,AI调用破千亿
https://mp.weixin.qq.com/s/0yutXqgzagGboZ50dOj6Lg
Qwen3家族训练秘籍公开:思考/非思考融进一个模型,大模型蒸馏带动小模型
https://mp.weixin.qq.com/s/vBunvAtrzNoGQxABVgDB4w
通义万相VACE开源,一款模型搞定多种视频编辑任务
https://mp.weixin.qq.com/s/jbOSf3_elqZvXAl0SMERpw
GPT-4.1正式上线ChatGPT
https://mp.weixin.qq.com/s/-VI607u6APR0L_h79Vd46Q
【新应用】
MiniMax-Speech(语音生成-MiniMax)
-无需转录即可从参考音频中提取音色特征,能够以零样本方式生成富有表现力且音色与参考音频一致的语音,同时还支持一次性语音克隆
项目主页:https://minimax-ai.github.io/tts_tech_report/
FramePack-F1(视频生成-linoyts)
-根据历史帧预测未来帧,在输入图像上绘制蒙版以修复视频输出,也可根据文本提示快速生成视频
体验地址:https://huggingface.co/spaces/linoyts/FramePack-F1
【新模型】
AM‑Thinking‑v1(推理语言模型-A-m-team)
-32B密集语言模型,基于Qwen2.5-32B-Base构建,专注于增强推理能力,在推理基准测试中表现出色,堪比更大规模的MoE和密集模型
开源地址:https://huggingface.co/a-m-team/AM-Thinking-v1
AgentCPM-GUI(视觉语言模型-OpenBMB)
-设备端LLM代理模型,基于MiniCPM-V构建,拥有80亿参数,能够接受智能手机屏幕截图作为输入,并自主执行用户指定任务
开源地址:https://huggingface.co/openbmb/AgentCPM-GUI
【新研究】
利用生成的游戏测量通用智力
(加州大学伯克利分校计算机科学系)
论文地址:https://arxiv.org/abs/2505.07215
【智能驾驶】
鸿蒙智行5月动作不断:尊界S800即将上市、“尚界”项目基地开工
https://www.cls.cn/detail/2030461
李斌:蔚来虽然致敬了保时捷、奔驰、宝马 但我没有抄袭人家
https://www.myzaker.com/article/6824adf9b15ec03faa1bef65
李书福收购极氪,还有变数?
https://www.21jingji.com/article/20250514/herald/909a77e9cdeab2ec15d36f83d8b09b5c.html
江苏扬州冲出一家IPO,为小米汽车、蔚来供应商
https://www.36kr.com/p/3291852362217604
中国自动驾驶出海加速!百度“萝卜快跑”瞄准日本、瑞士
https://www.cls.cn/detail/2030670
比亚迪“K-Car”微型车谍照曝光,剑指日本市场
https://www.ithome.com/0/852/934.htm
小马智行创始人自愿延长锁定期540天,Robotaxi正规模化量产
https://www.leinews.com/n30008/detail.html
文远知行在广州核心市区开通 8 条自动驾驶示范运营专线: 24 小时可用
https://www.ithome.com/0/853/060.htm
【其他】
中国商业航天企业将算力设施送到太空
https://mp.weixin.qq.com/s/Giw-q8AfbMYuDBuuh5FcHg