2025年09月01日人工智能前沿资讯

【新进展】
马斯克亲口证实xAI代码库被盗，涉案前员工被起诉，已跳槽OpenAI
https://mp.weixin.qq.com/s/d50DAxwoMSBsX2ybYoJ5_A

快手可灵负责人爆料：AI视频商用最高50万/分钟
https://mp.weixin.qq.com/s/a3coFt2gfl0kzNIA0QxlSQ

阿里市值暴涨：造AI芯传闻+业绩双重推动，AI产品连续8个季度三位数增长
https://mp.weixin.qq.com/s/JA_XEMBTRWOuLdkcVZCOSQ

美团开源龙猫大模型，性能追平DeepSeek
https://mp.weixin.qq.com/s/rDzzODj80YVMPTDCXOMQMw

【新应用】
USO（图像生成-字节跳动）
-将风格驱动和主题驱动的生成统一在同一个框架内，在主题一致性和风格相似度两个维度的测试均达到开源最优性能
项目主页：https://bytedance.github.io/USO/

OneReward（图像编辑-字节跳动）
进行蒙版引导的图像生成，可进一步细分为图像填充、图像扩展、对象移除和文本渲染等多个子任务，在多个评估维度上优于Ideogram、Adobe Photoshop等
项目主页：https://one-reward.github.io

【新模型】
LongCat-Flash-Chat（大语言模型-美团）
-采用动态计算机制，可根据上下文需求激活186 亿∼313亿个参数，扩展了计算-通信重叠窗口，经济高效地实现每秒超过100个token（TPS）的推理速度
开源地址：https://huggingface.co/meituan-longcat/LongCat-Flash-Chat

FastVLM-0.5B（视觉语言模型-苹果）
-显著缩短高分辨率图像的编码时间，性能优于LLaVA-OneVision-0.5B，首个token时间（TTFT）速度提高了85倍，视觉编码器体积缩小了3.4倍
开源地址：https://huggingface.co/apple/FastVLM-0.5B

【新研究】
Pref-GRPO：基于成对偏好奖励的GRPO，用于稳定的文本到图像强化学习
（复旦大学、上海创新学院、上海AI Lab、腾讯混元、上海交通大学）
论文地址：https://arxiv.org/abs/2508.20751

【其他】
被OpenAI开除的00后搞投资，700%回报率降维暴击华尔街
https://mp.weixin.qq.com/s/0MgYyQVL-EhtMODBoMD3Pw