【新进展】
马斯克亲口证实xAI代码库被盗,涉案前员工被起诉,已跳槽OpenAI
https://mp.weixin.qq.com/s/d50DAxwoMSBsX2ybYoJ5_A
快手可灵负责人爆料:AI视频商用最高50万/分钟
https://mp.weixin.qq.com/s/a3coFt2gfl0kzNIA0QxlSQ
阿里市值暴涨:造AI芯传闻+业绩双重推动,AI产品连续8个季度三位数增长
https://mp.weixin.qq.com/s/JA_XEMBTRWOuLdkcVZCOSQ
美团开源龙猫大模型,性能追平DeepSeek
https://mp.weixin.qq.com/s/rDzzODj80YVMPTDCXOMQMw
【新应用】
USO(图像生成-字节跳动)
-将风格驱动和主题驱动的生成统一在同一个框架内,在主题一致性和风格相似度两个维度的测试均达到开源最优性能
项目主页:https://bytedance.github.io/USO/
OneReward(图像编辑-字节跳动)
进行蒙版引导的图像生成,可进一步细分为图像填充、图像扩展、对象移除和文本渲染等多个子任务,在多个评估维度上优于Ideogram、Adobe Photoshop等
项目主页:https://one-reward.github.io
【新模型】
LongCat-Flash-Chat(大语言模型-美团)
-采用动态计算机制,可根据上下文需求激活186 亿∼313亿个参数,扩展了计算-通信重叠窗口,经济高效地实现每秒超过100个token(TPS)的推理速度
开源地址:https://huggingface.co/meituan-longcat/LongCat-Flash-Chat
FastVLM-0.5B(视觉语言模型-苹果)
-显著缩短高分辨率图像的编码时间,性能优于LLaVA-OneVision-0.5B,首个token时间(TTFT)速度提高了85倍,视觉编码器体积缩小了3.4倍
开源地址:https://huggingface.co/apple/FastVLM-0.5B
【新研究】
Pref-GRPO:基于成对偏好奖励的GRPO,用于稳定的文本到图像强化学习
(复旦大学、上海创新学院、上海AI Lab、腾讯混元、上海交通大学)
论文地址:https://arxiv.org/abs/2508.20751
【其他】
被OpenAI开除的00后搞投资,700%回报率降维暴击华尔街
https://mp.weixin.qq.com/s/0MgYyQVL-EhtMODBoMD3Pw