🚀
【新进展】
实测纳米AI万能工具箱,100+MCP工具随便选,撰写报告/爬虫小红书效果惊艳
https://mp.weixin.qq.com/s/GwB_2AdwxBFLFl9YRlshDA
14.9万元一体机,满血流畅运行DeepSeek,清华90后初创出品
https://mp.weixin.qq.com/s/luK0nlylq5faBytZ6Pvc1Q
GPT-4o更新后变马屁精差评如潮,奥特曼:一周才能完全修复
https://mp.weixin.qq.com/s/fXsKA9CUKjnpJyEDxLQ3cg
Meta发布对标ChatGPT的App,语音交互联动AI眼镜,Llama API免费用
https://mp.weixin.qq.com/s/DMKLpGTbYTNntScqlP_avw
【新应用】
Insert Anything(图像编辑-浙江大学、哈佛大学等)
-图像插入框架,支持多种实际场景,包括艺术创作、逼真的脸部交换、电影场景构图、虚拟服装试穿、配饰定制和数字道具更换等
项目主页:https://song-wensong.github.io/insert-anything/
UNIEDIT-FLOW(图像编辑-清华大学、Snap等)
-用于图像反演和编辑,在复杂情况下也能实现精确重建,同时确保与编辑无关的区域得到强有力的保留
项目主页:https://uniedit-flow.github.io
【新模型】
Qwen3-235B-A22B(大语言模型-阿里巴巴)
-推理能力显著增强,在数学、代码生成和常识性逻辑推理方面超越了之前的QwQ和Qwen2.5指令模型,在创意写作、角色扮演、多轮对话和指令执行方面表现出色
开源地址:https://huggingface.co/Qwen/Qwen3-235B-A22B
DAM-3B(视觉语言模型-英伟达)
-以图像中的点/框/涂鸦/蒙版的形式接收用户指定区域的输入,并生成图像的详细局部描述,模型仅用于研发
开源地址:https://huggingface.co/nvidia/DAM-3B
【新研究】
LLM驱动的手机自动化GUI代理:调查进展与前景
(浙江大学、vivo、香港中文大学)
论文地址:https://arxiv.org/abs/2504.19838
【其他】
无问芯穹夏立雪:让算力像水电煤一样成为标准化、高附加值的“拎包入住”基础设施
https://mp.weixin.qq.com/s/g0WghQpe2TKjGSJXeg-SzQ