2025年2月26日 人工智能前沿资讯

资讯2个月前更新 ai_world
767 0 0

👇

【新进展】
DeepSeek开源第二弹,为MoE和EP量身定制的通信库,暂和英伟达显卡绑定
https://mp.weixin.qq.com/s/2ecxmq9zbwFlzOalprok0Q

阿里旗舰推理模型硬刚DeepSeek,官宣独立APP
https://mp.weixin.qq.com/s/UjwuAKaRhKpQ-9eA2pSh8g

实测Claude 3.7:3200行代码一口气输出,物理规律手拿把掐
https://mp.weixin.qq.com/s/9eQqxZZ5MBTjbnXEDOxkeQ

豆包语音大模型升级长上下文理解,AI说书媲美真人
https://mp.weixin.qq.com/s/dKRwkFSp-ri_B4pkyeQ8_g

阿里云开源视频生成大模型万相2.1
https://mp.weixin.qq.com/s/VVHT87-XV8YtyD-zEBKpgw

微软开源多模态AI Agent基础模型Magma
https://mp.weixin.qq.com/s/jlVAkaho7DOHaDMSFUsnFA

【新应用】
FantasyID(视频生成-阿里巴巴、北京邮电大学)
-通过增强基于DiT构建的预训练视频模型的面部知识,在保持身份不变的同时实现令人满意的面部动态
项目主页:https://fantasy-amap.github.io/fantasy-id/

VideoGrain(视频编辑-悉尼科技大学、浙江大学)
-通过调节时空(交叉和自我)注意机制,实现对视频内容的细粒度控制,在现实场景中实现了SOTA性能
项目主页:https://knightyxp.github.io/VideoGrain_project_page/

【新模型】
Tiny-R1-32B-Preview(大语言模型-360、北京大学)
-性能优于70B模型Deepseek-R1-Distill-Llama-70B,并且在数学上几乎与完整的R1模型相媲美
开源地址:https://huggingface.co/qihoo360/TinyR1-32B-Preview

Arcee-Blitz(大语言模型-Arcee AI)
-基于Mistral的新型24B模型,由DeepSeek提炼而来,兼具快速和高效,可处理一系列任务而无需承担更大架构的开销
开源地址:https://huggingface.co/arcee-ai/Arcee-Blitz

【新研究】
LLM-显微镜:揭示标点符号在Transformer上下文记忆中的隐藏作用
(AIRI、Skoltech、HSE大学、莫斯科国立罗蒙诺索夫大学)
论文地址:https://arxiv.org/abs/2502.15007

【其他】
网易有道发布AI答疑笔,让DeepSeek当家教
https://mp.weixin.qq.com/s/Fx85HBW2dy6f2Cu3pq4JfQ

联想推出全球首款端侧部署DeepSeek的AI PC新品
https://mp.weixin.qq.com/s/nnnjtaLUbWCEL7wELIxRcg

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...