2025年4月22日 人工智能前沿资讯

资讯2天前更新 ai_world
1,035 0 0

 

【新进展】
全球首个无限时长视频生成,新扩散模型引爆万亿市场,电影级理解,全面开源
https://mp.weixin.qq.com/s/c9r537ZRmu-Wk2BkYE4x7Q

全国产算力深度推理模型讯飞星火X1升级,4张华为910B即可部署满血版
https://mp.weixin.qq.com/s/Rpw06sqrMF5s3vtsOGO8Dw

o3/o4-mini幻觉暴增2-3倍,OpenAI官方承认暂无法解释原因
https://mp.weixin.qq.com/s/oZYrfH8C9xnOZqsVWPOY3w

微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当
https://mp.weixin.qq.com/s/CpHcrSpzoDYcagknX9oe5g

秘塔科技推出“今天学点啥”,一本书、一篇文章直接变视频课程
https://mp.weixin.qq.com/s/dOjYp8eEHdjDuKiJk_aYFQ

【新应用】
HiScene(3D生成-浙江大学、字节跳动)
-使用等距视图生成技术创建分层3D场景,可以产生更自然的对象排列和完整的对象实例,适合交互式应用
项目主页:https://zju3dv.github.io/hiscene/

Complex-Edit(图像编辑-加州大学圣克鲁斯分校、爱丁堡大学、谷歌)
-图像编辑基准测试,旨在系统地评估基于指令的图像编辑模型在不同复杂度的指令中的表现
项目主页:https://ucsc-vlaa.github.io/Complex-Edit/

【新模型】
FLUX.1-dev-ControlNet-Union-Pro-2.0(文生图模型-Shakker Labs)
-支持多种控制模式,包括Canny控制模式、软边缘控制模式、深度控制模式、姿态控制模式和灰度控制模式
开源地址:https://huggingface.co/Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro-2.0

ReZero-v0.1-llama-3.2-3b-it-grpo-250404(大语言模型-Menlo Research)
-与多个合成搜索引擎交互,每个引擎都具有独特的检索机制,以优化查询并持续搜索,直到找到准确的答案
开源地址:https://huggingface.co/Menlo/ReZero-v0.1-llama-3.2-3b-it-grpo-250404

【新研究】
MIG:通过最大化语义空间中的信息增益来自动选择数据以进行指令调整
(上海人工智能实验室、复旦大学、卡内基梅隆大学)
论文地址:https://arxiv.org/abs/2504.13835

【其他】
以兼容高效胜出,C86成为教育行业最优架构
https://mp.weixin.qq.com/s/-4Hnh4MWh_AGjH-02law1w

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...