2025年2月06日人工智能前沿资讯

新年好呀🥳

【新进展】
DeepSeek百万年薪招AI人才，实习生都能月入过万
https://mp.weixin.qq.com/s/QgOTPHB9CuLNqvIedqHehw

微信元宝红包封面助手实测来了
https://mp.weixin.qq.com/s/0riN22XtuRr6AlTt18MOzQ

英伟达CMU新研究，让宇树机器人投篮模仿篮球巨星，代码论文全开源
https://mp.weixin.qq.com/s/g6t9twNOptByKVmExNS2Gg

多模态版DeepSeek-R1：评测表现超GPT-4o，模态穿透反哺文本推理能力
https://mp.weixin.qq.com/s/_S4tovrggFZdPIqFuos2Nw

谷歌发布Gemini 2.0 Pro：多模态，编程能力炸裂，免费开放
https://mp.weixin.qq.com/s/PjMpSUModRlLz-SMQV1n4Q

OpenAI免费开放ChatGPT搜索，无需注册
https://mp.weixin.qq.com/s/3bUpEV2a_98dnEoT95qNKw

字节OmniHuman，一张图配上音频，就能直接生成视频
https://mp.weixin.qq.com/s/0OYlkcxoFvx6Z9IN-aq90w

【新应用】
VideoJAM（视频生成-Meta、特拉维夫大学）
-通过鼓励模型学习联合外观-运动表示，增强视频生成的视觉质量和连贯性，框架可以应用于任何视频模型
项目主页：https://hila-chefer.github.io/videojam-paper.github.io/

SynCD（图像生成-卡内基梅隆大学、Meta）
-在高质量的合成训练数据集上训练，通过规范化文本和图像引导向量来缓解推理过程中的过度曝光，生成效果出色
项目主页：https://www.cs.cmu.edu/~syncd-project/

【新模型】
Lumina-Image-2.0（文生图模型-Alpha-VLLM）
-拥有20亿参数的基于流的扩散Transformer模型，根据文本描述生成图像
开源地址：https://huggingface.co/Alpha-VLLM/Lumina-Image-2.0

Llama-3.1-Tulu-3-405B（大语言模型-艾伦研究所）
-领先的指令跟随模型，除聊天之外在MATH、GSM8K和IFEval等各种任务上都可实现一流的性能
开源地址：https://huggingface.co/allenai/Llama-3.1-Tulu-3-405B

【新研究】
通过隐性奖励来强化过程
（清华大学、上海人工智能实验室、伊利诺伊大学香槟分校、北京大学等）
论文地址：https://arxiv.org/abs/2502.01456

【其他】
DeepSeek超ChatGPT成全球增长最快AI应用！下载破4000万，日活超豆包登顶中国No.1
https://mp.weixin.qq.com/s/7mA2HA-QaRrMgL_LENyq1g

OpenAI突遭人形机器人独角兽Figure解约
https://mp.weixin.qq.com/s/ujhGM2xGeVWvxsfBLmTXDg

文章版权归作者所有，未经允许请勿转载。

8个月前

04590

8个月前

04320

9个月前

01250

7个月前

01330

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...