2025年4月30日人工智能前沿资讯

🚀

【新进展】
实测纳米AI万能工具箱，100+MCP工具随便选，撰写报告/爬虫小红书效果惊艳
https://mp.weixin.qq.com/s/GwB_2AdwxBFLFl9YRlshDA

14.9万元一体机，满血流畅运行DeepSeek，清华90后初创出品
https://mp.weixin.qq.com/s/luK0nlylq5faBytZ6Pvc1Q

GPT-4o更新后变马屁精差评如潮，奥特曼：一周才能完全修复
https://mp.weixin.qq.com/s/fXsKA9CUKjnpJyEDxLQ3cg

Meta发布对标ChatGPT的App，语音交互联动AI眼镜，Llama API免费用
https://mp.weixin.qq.com/s/DMKLpGTbYTNntScqlP_avw

【新应用】
Insert Anything（图像编辑-浙江大学、哈佛大学等）
-图像插入框架，支持多种实际场景，包括艺术创作、逼真的脸部交换、电影场景构图、虚拟服装试穿、配饰定制和数字道具更换等
项目主页：https://song-wensong.github.io/insert-anything/

UNIEDIT-FLOW（图像编辑-清华大学、Snap等）
-用于图像反演和编辑，在复杂情况下也能实现精确重建，同时确保与编辑无关的区域得到强有力的保留
项目主页：https://uniedit-flow.github.io

【新模型】
Qwen3-235B-A22B（大语言模型-阿里巴巴）
-推理能力显著增强，在数学、代码生成和常识性逻辑推理方面超越了之前的QwQ和Qwen2.5指令模型，在创意写作、角色扮演、多轮对话和指令执行方面表现出色
开源地址：https://huggingface.co/Qwen/Qwen3-235B-A22B

DAM-3B（视觉语言模型-英伟达）
-以图像中的点/框/涂鸦/蒙版的形式接收用户指定区域的输入，并生成图像的详细局部描述，模型仅用于研发
开源地址：https://huggingface.co/nvidia/DAM-3B

【新研究】
LLM驱动的手机自动化GUI代理：调查进展与前景
（浙江大学、vivo、香港中文大学）
论文地址：https://arxiv.org/abs/2504.19838

【其他】
无问芯穹夏立雪：让算力像水电煤一样成为标准化、高附加值的“拎包入住”基础设施
https://mp.weixin.qq.com/s/g0WghQpe2TKjGSJXeg-SzQ