早新闻☕️
【新进展】
苹果炮轰推理模型全是假思考,4个游戏戳破神话,o3/DeepSeek高难度全崩溃
https://mp.weixin.qq.com/s/WRPjXZRm4QRGOUzsJ4FxGA
马斯克祸不单行:擎天柱负责人突然离职,特斯拉蒸发万亿市值
https://mp.weixin.qq.com/s/UJnMiYsULvdEI0qHFwrc5A
小红书开源首个大模型,11万亿非合成训练数据
https://mp.weixin.qq.com/s/VTr8IBZGxUY767Sm-XPssQ
华人团队提出全新注意力机制:对数线性注意力
https://mp.weixin.qq.com/s/6yIV2yCnAFe7CognsjNqng
【新应用】
SkyReels-Audio(视频生成-昆仑万维)
-用于合成高保真度和时间连贯性说话肖像视频,在唇形同步准确度、身份一致性和逼真的面部动态方面实现了卓越的性能
项目主页:https://skyworkai.github.io/skyreels-audio.github.io/
FlexPainter(3D生成-香港科技大学(广州)、趣玩科技等)
-支持灵活的多模态条件引导,生成无缝高分辨率纹理图,在灵活性和生成质量方面均优于现有方法
项目主页:https://starydy.xyz/FlexPainter/
【新模型】
MiniCPM4-8B(大语言模型-面壁智能)
-高效的端侧大模型,在保持相同规模最佳性能的同时,实现了极致的效率提升,在端侧芯片上可实现超过5倍的代际加速
开源地址:https://huggingface.co/openbmb/MiniCPM4-8B
dots.llm1.inst(大语言模型-小红书)
-大规模MoE模型,在总共1420亿参数中激活140亿参数,达到了与Qwen2.5-720相当的性能
开源地址:https://huggingface.co/rednote-hilab/dots.llm1.inst
【新研究】
RoboRefer:面向机器人视觉语言模型的空间参考推理
(北京航空航天大学、北京大学、北京人工智能研究院)
论文地址:https://huggingface.co/papers/2506.04308
【其他资讯】
腾讯顶尖学生招募启动:高中生可直接参与大模型/具身智能前沿研究
https://mp.weixin.qq.com/s/Mp21rlvb7yTxM7r1A-dDOg