2025年4月10日 人工智能前沿资讯

资讯2天前更新 ai_world
1,027 0 0

📰

【新进展】
谷歌最新AI芯片打平英伟达B200,专为推理模型打造
https://mp.weixin.qq.com/s/J2B9ev0fnn2YyjO6IZEM-w

大模型一体机塞进锐炫™显卡,价格砍掉一个数量级
https://mp.weixin.qq.com/s/nKDDaOYODG574R6CiUdkRA

阿里云造“Agent工厂”,百炼MCP服务上线,无需代码5分钟人人都可搭建Agent
https://mp.weixin.qq.com/s/xEBkxqxy4JpCsR5cC6wXhQ

李飞飞团队提出世界模型基准:“世界生成”能力迎来统一评测
https://mp.weixin.qq.com/s/DWvA47PguoHMdsfyc-ITBw

谷歌开源首个标准智能体交互协议A2A
https://mp.weixin.qq.com/s/ih2FLqmWhJiRvoXxLu68Ag

英伟达开源新模型,性能直逼DeepSeek-R1,4倍推理吞吐量
https://mp.weixin.qq.com/s/fPQDQatA5UrdOrJtHuOVCg

alphaXiv推出Deep Research一秒搜遍arXiv,研究效率爆表
https://mp.weixin.qq.com/s/IAdpqmlvFHGOF_iHsG7IFg

谷歌Deep Research迎来升级,正式搭载Gemini 2.5 Pro
https://mp.weixin.qq.com/s/Tmuzdhi212vunT7JtwFtzg

【新应用】
OmniSVG(图像生成-复旦大学、StepFun)
-利用预训练的视觉语言模型进行端到端多模态可缩放矢量图形(SVG)生成
项目主页:https://omnisvg.github.io

UNO(图像生成-字节跳动)
-基于多图像条件的主体到图像方法,在单主体和多主体驱动生成中都能实现高度一致性,同时确保可控性
项目主页:https://bytedance.github.io/UNO/

【新模型】
Skywork-R1V(多模态模型-昆仑万维)
-38B多模态推理模型,通过高效的迁移、混合SFT+GRPO训练和自适应CoT提炼,将R1系列LLM扩展到视觉领域,具有强大的数学推理能力
开源地址:https://github.com/SkyworkAI/Skywork-R1V

DeepCoder-14B-Preview(代码大语言模型-Agentica)
-基于DeepSeek-R1-Distilled-Qwen-14B微调的代码推理LLM,仅使用140亿个参数就达到了与OpenAI o3-mini相当的性能
开源地址:https://huggingface.co/agentica-org/DeepCoder-14B-Preview

【新研究】
GPT-4o图像生成能力的实证研究
(香港科技大学、新加坡国立大学、北京大学、香港中文大学等)
论文地址:https://arxiv.org/abs/2504.05979

【其他】
AI智能助手DDKT双端垄断超85%,Web端元宝紧逼Kimi,DeepSeek优势收窄| 量子位智库https://mp.weixin.qq.com/s/J-7n7tMp2l3Acsbz7y2EGQ

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...