科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-04 09:15:32
cadrille:基于在线强化学习的多模态CAD重建技术

AIRI研究院团队开发的cadrille是一款突破性多模态CAD重建模型,能同时处理点云、多视角图像和文本描述输入,并生成精确的Python代码来构建CAD模型。该研究首次将在线强化学习应用于CAD重建任务,采用两阶段训练策略:…详细

CAD重建多模态学习强化学习

2025-06-04 09:15:10
降低复杂度,加速生成:对扩散模型采样的可微分求解器搜索方法

这项研究提出了一种可微分求解器搜索方法,通过优化时间步长和求解器系数,显著加速扩散模型的采样过程。在仅使用10步采样的情况下,该方法使修正流模型和DDPM模型在ImageNet数据集上的FID得分分别达到2.40和2.33,大…详细

扩散模型数值求解器图像生成

2025-06-04 09:14:25
代码效率优化的新突破:强化学习如何帮助大语言模型实现自我进化

《Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization》这篇论文提出了一种创新的代码效率优化框架,通过强化学习技术让大语言模型能够自我改进生成代码的计算效率。研究…详细

人工智能强化学习代码优化

2025-06-03 20:42:21
拆解视频大语言模型评测基准:知识、空间感知还是真正的时序理解?苹果公司研究团队带来新分析框架

这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型…详细

人工智能评测视频理解模型时序分析

2025-06-03 20:42:00
差分信息:一种信息论视角下理解偏好优化的新方法 - KAIST AI研究团队突破性解读

这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最…详细

人工智能偏好优化信息论

2025-06-03 18:36:09
VidText:视频文本理解的全面评估新基准,打造视觉文本与上下文交互的研究新高度

VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使…详细

视频理解多模态模型文本视觉交互

2025-06-03 18:35:51
ZeroGUI:零人工成本下自动化在线GUI学习的突破性研究

ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图…详细

GUI代理在线强化学习零标注学习

2025-06-03 18:09:52
KADC 2025汇聚高校创新力量,鲲鹏昇腾科研创新成果全新发布!

5月23日至24日,鲲鹏昇腾开发者大会2025(KADC 2025)在北京中关村国际创新中心成功举办。…详细

2025-06-03 18:05:21
“阿凡达”技术落地!这套系统让人机动作同步误差小于0.1毫米

在这个人机协作时代,人类的智慧和机器的能力将以前所未有的方式结合在一起,共同创造一个更加美好的世界。…详细

2025-06-03 17:59:28
IXD0579M高压侧和低压侧栅极驱动器提供紧凑型即插即用解决方案

新型栅极驱动器集成电路集成了自举二极管和电阻器,有助于简化无刷电机、电动工具和DC-DC转换器的高速设计。…详细

2025-06-03 17:40:47
爬山过程铭刻的智慧远超登顶:腾讯和人民大学研究团队揭示AI推理中的"噪声奖励"惊人价值

这项研究揭示了大语言模型在学习推理时对噪声奖励的惊人适应力。研究表明,即使有40%的奖励信号被故意颠倒,Qwen-2.5-7B模型仍能将数学题准确率从5%提升至72%。更惊人的是,仅奖励模型使用关键推理词组(如"首先,我…详细

大语言模型强化学习推理能力

2025-06-03 17:40:29
空间智能先行者:清华大学研究团队打造全新视频空间理解模型

清华大学研究团队提出的Spatial-MLLM是一种创新视频理解模型,通过双编码器架构结合语义和空间信息,使AI能仅从2D视频理解3D空间关系。该模型采用空间感知帧采样策略,在VSI-Bench测试中超越了Gemini-1.5 Pro等顶级商…详细

多模态大语言模型视觉空间智能双编码器架构

2025-06-03 17:39:47
Yale研究团队突破传统:Table-R1开创表格推理的全新境界

Yale大学自然语言处理实验室研发的Table-R1模型突破性地将推理时间缩放技术应用于表格推理任务。研究团队通过两种方法提升模型能力:从DeepSeek-R1模型的推理过程中学习,以及利用可验证奖励进行强化学习。实验表明,…详细

人工智能表格推理自然语言处理

2025-06-03 17:01:37
VideoReasonBench:Moonshot AI与北京大学联手推出衡量大型多模态语言模型视频推理能力的新基准测试

这项研究由Moonshot AI与北京大学合作开展,提出了名为VideoReasonBench的新型基准测试,专门评估多模态大语言模型在视觉为中心的复杂视频推理任务中的表现能力。研究团队发现,包括GPT-4o在内的大多数当前顶尖模型在…详细

人工智能视频理解多模态大语言模型视觉推理基准测试

2025-06-03 17:01:15
Muddit: 突破文生图限制,统一图文生成的离散扩散模型

Muddit是一种创新的统一生成框架,它使用离散扩散技术同时处理文本和图像生成。由北京大学等机构联合开发,该模型整合了预训练文生图模型的强大视觉先验,使其能高效并行地处理多模态内容。尽管仅有1B参数,Muddit在…详细

人工智能离散扩散多模态生成

2025-06-03 17:00:55
微软研究院重大突破:更稳定高效的大语言模型强化学习算法—OPO如何解决算法不稳定和计算浪费问题

微软研究院推出的"基于最优奖励基线的在策略强化学习"(OPO)算法解决了大语言模型强化学习中的两大问题:训练不稳定和计算效率低。通过严格遵循在策略训练和引入理论最优奖励基线,OPO无需额外的辅助模型或复杂正则…详细

强化学习大语言模型算法优化

2025-06-03 17:00:39
SWE-bench直播上线!微软携手上海人工智能实验室推出实时更新的代码修复基准测试

SWE-bench-Live是微软与上海人工智能实验室联合开发的持续更新基准测试平台,解决了现有代码修复评估工具的数据老化、覆盖有限和人工依赖问题。核心创新是REPOLAUNCH自动化流水线,能从GitHub抓取2024年后的1,319个真…详细

人工智能代码自动化软件测试

2025-06-03 17:00:14
Atlas:谷歌研究团队打造的"超级记忆师",让AI模型记住整个上下文而非单个词

Google研究团队推出Atlas,一种革命性的AI记忆优化模型,解决传统Transformer架构在处理长文本时的计算复杂度问题。Atlas通过三大创新:超线性容量的记忆模块、基于上下文而非单词的记忆优化、及使用Muon优化器的高效…详细

人工智能长文本理解记忆优化

2025-06-03 16:59:52
LoRAShop:训练自由的多概念图像生成与编辑突破

LoRAShop是弗吉尼亚理工大学研究团队开发的突破性框架,首次实现了无需额外训练的多概念图像编辑。该技术通过在整流流变换器中识别概念特定区域,创建分离的潜在掩码,并仅在相应区域混合LoRA权重,有效解决了"LoRA交…详细

人工智能图像生成多概念图像编辑低秩适应模型

2025-06-03 16:59:34
Fast-dLLM:NVIDIA研究团队通过KV缓存和并行解码实现扩散大语言模型的无训练加速

NVIDIA联合麻省理工学院和香港大学的研究团队提出Fast-dLLM,一种无需重新训练即可显著加速扩散大语言模型的新方法。该技术通过两大创新解决了扩散模型的主要性能瓶颈:首先设计了适用于双向注意力机制的块式近似KV缓…详细

大语言模型扩散模型推理加速

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章