2025年4月10日人工智能前沿资讯

资讯8个月前更新 ai_world

1,168 0 0

📰

【新进展】
谷歌最新AI芯片打平英伟达B200，专为推理模型打造
https://mp.weixin.qq.com/s/J2B9ev0fnn2YyjO6IZEM-w

大模型一体机塞进锐炫™显卡，价格砍掉一个数量级
https://mp.weixin.qq.com/s/nKDDaOYODG574R6CiUdkRA

阿里云造“Agent工厂”，百炼MCP服务上线，无需代码5分钟人人都可搭建Agent
https://mp.weixin.qq.com/s/xEBkxqxy4JpCsR5cC6wXhQ

李飞飞团队提出世界模型基准：“世界生成”能力迎来统一评测
https://mp.weixin.qq.com/s/DWvA47PguoHMdsfyc-ITBw

谷歌开源首个标准智能体交互协议A2A
https://mp.weixin.qq.com/s/ih2FLqmWhJiRvoXxLu68Ag

英伟达开源新模型，性能直逼DeepSeek-R1，4倍推理吞吐量
https://mp.weixin.qq.com/s/fPQDQatA5UrdOrJtHuOVCg

alphaXiv推出Deep Research一秒搜遍arXiv，研究效率爆表
https://mp.weixin.qq.com/s/IAdpqmlvFHGOF_iHsG7IFg

谷歌Deep Research迎来升级，正式搭载Gemini 2.5 Pro
https://mp.weixin.qq.com/s/Tmuzdhi212vunT7JtwFtzg

【新应用】
OmniSVG（图像生成-复旦大学、StepFun）
-利用预训练的视觉语言模型进行端到端多模态可缩放矢量图形（SVG）生成
项目主页：https://omnisvg.github.io

UNO（图像生成-字节跳动）
-基于多图像条件的主体到图像方法，在单主体和多主体驱动生成中都能实现高度一致性，同时确保可控性
项目主页：https://bytedance.github.io/UNO/

【新模型】
Skywork-R1V（多模态模型-昆仑万维）
-38B多模态推理模型，通过高效的迁移、混合SFT+GRPO训练和自适应CoT提炼，将R1系列LLM扩展到视觉领域，具有强大的数学推理能力
开源地址：https://github.com/SkyworkAI/Skywork-R1V

DeepCoder-14B-Preview（代码大语言模型-Agentica）
-基于DeepSeek-R1-Distilled-Qwen-14B微调的代码推理LLM，仅使用140亿个参数就达到了与OpenAI o3-mini相当的性能
开源地址：https://huggingface.co/agentica-org/DeepCoder-14B-Preview

【新研究】
GPT-4o图像生成能力的实证研究
（香港科技大学、新加坡国立大学、北京大学、香港中文大学等）
论文地址：https://arxiv.org/abs/2504.05979

【其他】
AI智能助手DDKT双端垄断超85%，Web端元宝紧逼Kimi，DeepSeek优势收窄｜量子位智库https://mp.weixin.qq.com/s/J-7n7tMp2l3Acsbz7y2EGQ