2025年2月6日 人工智能前沿资讯

资讯7小时前更新 fdaia002
3,000,045 0 0

新年好呀🥳

新进展
DeepSeek百万年薪招AI人才,实习生都能月入过万
https://mp.weixin.qq.com/s/QgOTPHB9CuLNqvIedqHehw

微信元宝红包封面助手实测来了
https://mp.weixin.qq.com/s/0riN22XtuRr6AlTt18MOzQ

英伟达CMU新研究,让宇树机器人投篮模仿篮球巨星,代码论文全开源
https://mp.weixin.qq.com/s/g6t9twNOptByKVmExNS2Gg

多模态版DeepSeek-R1:评测表现超GPT-4o,模态穿透反哺文本推理能力
https://mp.weixin.qq.com/s/_S4tovrggFZdPIqFuos2Nw

谷歌发布Gemini 2.0 Pro:多模态,编程能力炸裂,免费开放
https://mp.weixin.qq.com/s/PjMpSUModRlLz-SMQV1n4Q

OpenAI免费开放ChatGPT搜索,无需注册
https://mp.weixin.qq.com/s/3bUpEV2a_98dnEoT95qNKw

字节OmniHuman,一张图配上音频,就能直接生成视频
https://mp.weixin.qq.com/s/0OYlkcxoFvx6Z9IN-aq90w

【新应用】
VideoJAM(视频生成-Meta、特拉维夫大学)
-通过鼓励模型学习联合外观-运动表示,增强视频生成的视觉质量和连贯性,框架可以应用于任何视频模型
项目主页:https://hila-chefer.github.io/videojam-paper.github.io/

SynCD(图像生成-卡内基梅隆大学、Meta)
-在高质量的合成训练数据集上训练,通过规范化文本和图像引导向量来缓解推理过程中的过度曝光,生成效果出色
项目主页:https://www.cs.cmu.edu/~syncd-project/

【新模型】
Lumina-Image-2.0(文生图模型-Alpha-VLLM)
-拥有20亿参数的基于流的扩散Transformer模型,根据文本描述生成图像
开源地址:https://huggingface.co/Alpha-VLLM/Lumina-Image-2.0

Llama-3.1-Tulu-3-405B(大语言模型-艾伦研究所)
-领先的指令跟随模型,除聊天之外在MATH、GSM8K和IFEval等各种任务上都可实现一流的性能
开源地址:https://huggingface.co/allenai/Llama-3.1-Tulu-3-405B

【新研究】
通过隐性奖励来强化过程
(清华大学、上海人工智能实验室、伊利诺伊大学香槟分校、北京大学等)
论文地址:https://arxiv.org/abs/2502.01456

【其他】
DeepSeek超ChatGPT成全球增长最快AI应用!下载破4000万,日活超豆包登顶中国No.1
https://mp.weixin.qq.com/s/7mA2HA-QaRrMgL_LENyq1g

OpenAI突遭人形机器人独角兽Figure解约
https://mp.weixin.qq.com/s/ujhGM2xGeVWvxsfBLmTXDg

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...