科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-01 08:08:16
脑部核磁共振正片加强!波尔多大学研发通过强化学习驱动大语言模型的神经退行性痴呆症可解释诊断框架

法国波尔多大学研究团队开发了一个突破性框架,用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告,并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法,这一系统能生成透明、…详细

人工智能神经影像学神经退行性疾病

2025-06-01 08:06:28
揭秘事实核查的不确定性:哥本哈根大学研究团队如何让AI解释证据冲突

这项研究提出了CLUE框架,首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同,CLUE能识别文本片段间的冲突与一致关系,并解释它们如何影响模型的预测不确定性。实验表明,CLUE生成的解释…详细

人工智能自然语言处理可解释AI

2025-05-31 17:26:54
SynLogic:香港科技大学与MiniMax联合开发的逻辑推理数据集,让AI更懂得思考

来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测…详细

人工智能大型语言模型逻辑推理

2025-05-31 17:26:37
大型语言模型的一步生成能力:揭秘人工智能"一口气"说故事的秘密 - AIRI与Skoltech研究成果

这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快…详细

人工智能大型语言模型并行文本生成

2025-05-31 17:26:21
深度解析:腾讯混元团队《先走后跑》——利用强化学习实现大模型简洁推理的新突破

腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理…详细

人工智能强化学习大语言模型

2025-05-31 17:25:57
压缩还是行动?实测告诉你压缩后的大语言模型是否真能胜任Agent任务

这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBe…详细

压缩LLMAgent能力评估大模型应用

2025-05-31 13:35:05
R1-Searcher++:用强化学习激励大语言模型动态获取知识的新框架

这项研究提出了R1-Searcher++框架,通过两阶段训练策略使大语言模型能像人类一样灵活利用内部知识和外部信息。该方法创新性地采用强化学习激励模型优先使用内部知识,并引入记忆机制将检索到的信息转化为内部知识,实…详细

大语言模型强化学习检索增强生成

2025-05-31 13:34:50
AutoRefine:让大语言模型主动搜索并优化信息的全新范式

这项研究提出了AutoRefine,一种革新性的强化学习框架,为大语言模型引入了"边思考边搜索和完善"的全新范式。与传统方法不同,AutoRefine在连续搜索调用之间添加知识完善步骤,让模型能够有效过滤和组织信息。通过结…详细

人工智能检索增强生成大语言模型推理

2025-05-31 13:34:33
当广告成为武器:解密中科院团队开发的AdInject攻击,揭示网页代理漏洞

这项研究揭示了一种新型网络安全威胁:利用普通网络广告攻击AI网页代理。中科院研究团队开发的AdInject攻击无需特殊权限,仅通过精心设计的广告内容就能误导AI代理点击恶意链接,成功率高达90%以上。研究使用严格的黑…详细

人工智能安全网页代理攻击广告投放漏洞

2025-05-31 12:13:30
UNITE:东北大学和快手科技合作打造的通用多模态信息检索系统

东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争…详细

多模态信息检索大型多模态模型对比学习

2025-05-31 11:47:33
多模态大语言模型深受模态偏差影响:理解、原因与解决方案

这篇研究论文揭示了多模态大语言模型(MLLMs)存在严重的模态偏差问题,即模型过度依赖文本信息而忽视图像等其他模态。研究团队通过理论分析和实验证明,这种偏差主要源于三个因素:数据集不平衡、模态骨干能力不对称以…详细

人工智能多模态学习模态偏差

2025-05-31 11:47:05
ComfyMind:通过树状规划和反馈机制打造通用生成系统

ComfyMind是香港科技大学研究团队开发的一个协作式AI系统,旨在解决当前开源通用生成系统面临的稳定性和规划挑战。该系统基于ComfyUI平台,引入了两项关键创新:语义工作流接口(SWI)和带本地反馈执行的搜索树规划机制…详细

人工智能生成视觉内容创建通用生成系统

2025-05-31 11:45:46
热带几何遇上人工智能:用"热带注意力"机制解决组合算法问题的突破性研究

这项研究介绍了一种名为"热带注意力"的新型注意力机制,专为解决神经网络在组合算法推理中的困境而设计。传统注意力机制使用softmax函数产生平滑的概率分布,无法精确捕捉组合算法所需的锐利决策边界。…详细

人工智能热带几何神经算法推理

2025-05-31 11:45:08
RAG系统真的受位置偏见影响吗?—来自罗马大学和技术创新研究所的最新研究揭示

这项研究揭示了RAG系统中位置偏见的真实影响——虽然在受控环境中明显存在,但在实际应用中却微不足道。研究人员发现,先进的检索系统不仅会找出相关内容,还会将具有干扰性的段落排在前列,超过60%的查询中至少包含…详细

人工智能检索增强生成位置偏见

2025-05-31 11:41:26
让视频大模型更聪明:哈工大团队开发的VerIPO让模型推理更深更长

哈工大(深圳)团队提出VerIPO方法,通过验证器引导的迭代策略优化提升视频大语言模型的长推理能力。该方法创新性地在GRPO和DPO训练阶段之间引入验证器,筛选高质量推理样本,有效解决了传统强化学习方法在推理链质量…详细

视频大模型验证器引导优化长推理能力

2025-05-31 11:41:05
GraLoRA:解决大型语言模型微调瓶颈的突破性方法 — SqueezeBits和POSTECH联合研究

SqueezeBits和POSTECH联合研究团队提出了GraLoRA,一种改进的参数高效微调方法,解决了传统LoRA在高秩设置下的表现瓶颈。通过将权重矩阵分解成多个独立的子块,每块配备自己的低秩适配器,GraLoRA有效增加了表达能力…详细

人工智能低秩适应参数高效微调

2025-05-31 11:40:42
rStar-Coder:微软亚洲研究院打造大规模验证数据集,小模型也能实现卓越代码推理能力

微软亚洲研究院研究团队开发的rStar-Coder通过构建大规模验证数据集,显著提升了语言模型的代码推理能力。该数据集包含418K个竞赛级代码问题和580K个长推理解决方案,每个都经过多样化测试案例验证。关键创新在于三步…详细

代码推理大规模数据集小模型优化

2025-05-31 10:06:36
解锁多模态推理力量:华中科技大学推出MMMR基准,全面评测模型思考能力

华中科技大学与利哈伊大学研究团队开发的MMMR基准是首个专门评估多模态大语言模型推理思考过程的综合工具。通过1,083个跨六大领域的高难度推理任务和创新的推理过程评估管道,研究发现即使最先进的模型在推理任务上也…详细

人工智能多模态推理思维评估

2025-05-31 10:06:16
UI-Genie: 一种自我改进的方法,通过迭代提升基于多模态大语言模型的移动端GUI智能体

UI-Genie是一个创新的自我改进框架,解决了GUI智能体面临的两大挑战:轨迹验证困难和高质量训练数据缺乏。研究团队开发了专用奖励模型UI-Genie-RM,采用图像-文本交错架构有效处理历史上下文,并统一了步骤级和任务级…详细

多模态大语言模型智能体系统人机交互

2025-05-31 10:05:58
主动感知:浙江大学团队ACTIVE-O3让多模态大语言模型"学会看哪里"

浙江大学和蚂蚁集团的研究团队开发了ACTIVE-O3,一种创新框架,赋予多模态大语言模型"主动感知"能力,使AI能够智能地决定"看哪里"和"怎么看"。基于群体相对策略优化(GRPO)构建,该系统采用两阶段策略,先选择关注区域…详细

多模态大语言模型主动感知强化学习

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章