2025年09月04日 人工智能前沿资讯

资讯2天前发布 power
0 0 0

【新进展】
宇树科技IPO时间定了
https://mp.weixin.qq.com/s/tbfh9giQROS8ROLEBa46XQ

苹果自研AI搜索引擎曝光,代号WKA
https://mp.weixin.qq.com/s/SG38lbfHbE6xn75AwufdoQ

GPT-5帮陶哲轩解决半自动化文献检索的难题
https://mp.weixin.qq.com/s/gJZ0PeLIeopkHlba3RnbKg

OpenAI免费开放ChatGPT Projects
https://mp.weixin.qq.com/s/hPuh7WW54NtUZ_jSqWB1Dw

优必选斩获2.5亿全球人形机器人最大合同
https://mp.weixin.qq.com/s/YmICWqWfbo03hA_lNQvaHg

Kimi在官方Discord上发布Kimi K2-0905,开放Beta测试邀请
https://mp.weixin.qq.com/s/V8U6TrvQvdlsXwNQWwQHiA

【新应用】
GenCompositor(视频合成-北京大学、腾讯PCG等)
-以交互方式自适应地将前景视频的身份和运动信息注入目标视频,允许用户自定义最终视频中添加的动态元素的大小、运动轨迹和其他属性
项目主页:https://gencompositor.github.io

MobiAgent(端侧Agent-上海交通大学)
-在实际端侧设备场景(如购物、娱乐、社交、商务旅行等)中超越了GPT-5和Gemini-2.5-pro等通用大模型,以及UI-TARS-1.5等开源GUI代理模型
项目主页:https://github.com/IPADS-SAI/MobiAgent

【新模型】
Kwai Keye-VL-1.5(视觉语言模型-快手)
-在视频理解、图像理解和推理能力方面达到了新的高度,支持128k token的扩展上下文长度,能够处理更长的对话和复杂的任务
开源地址:https://huggingface.co/Kwai-Keye/Keye-VL-1_5-8B

Apertus-8B-Instruct-2509(大语言模型-Swiss AI Initiative)
-完全开放的多语言模型,支持超过1000种语言和长上下文,仅使用合规开放的训练数据即实现了与闭门训练的模型相当的性能
开源地址:https://huggingface.co/swiss-ai/Apertus-8B-Instruct-2509

【新研究】
SimpleTIR:用于多轮工具集成推理的端到端强化学习
(南洋理工大学、TikTok)
论文地址:https://arxiv.org/abs/2509.02479

【其他资讯】
苹果机器人负责人被小扎挖走了,浙大校友,任职Meta机器人技术一号位
https://mp.weixin.qq.com/s/lrhYKGVM7owWYAzcFrEU-Q

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...