这项由爱丁堡大学和华为研究团队完成的研究探究了大语言模型在多跳问题答案任务中如何处理上下文排列。研究发现:编码器-解码器模型(如Flan-T5)在未微调时表现优于更大规模的因果解码器模型;改变黄金文档顺序揭示…详细
KERL是一个创新的食谱推荐系统,由伦斯勒理工学院研究者开发,将食品知识图谱与大语言模型相结合,提供个性化推荐并生成食谱步骤和营养信息。系统包含三个模块:KERL-Recom(负责推荐菜品)、KERL-Recipe(生成烹饪步…详细
Meta公司研究团队开发的Dynadiff技术实现了单阶段从脑部fMRI信号直接解码图像的突破,解决了现有方法复杂多阶段和忽略时间维度的问题。通过创新的"大脑模块"设计和扩散模型整合,Dynadiff在高级语义图像重建方面超越…详细
这篇研究论文展示了以物体为中心的表征(OCR)如何提升机器人操作的泛化能力。法国中央工学院的研究团队对比了全局、密集和基于OCR的视觉模型在模拟和真实环境中的表现,发现OCR方法(特别是VIDEOSAUR*)在各种视觉干扰条…详细
2025年5月20日,上海交通大学与上海人工智能实验室合作发布了"视觉智能体强化微调"(Visual-ARFT)研究,使AI模型能像人类一样主动使用搜索引擎和编写代码处理图像。这项突破性技术通过强化学习让大型视觉-语言模型获…详细
香港城市大学、OPPO研究院与香港理工大学研究团队提出了VisualQuality-R1,一种通过排序强化学习训练的推理增强型图像质量评估模型。该模型将Thurstone排序模型无缝集成到组相对策略优化中,使用连续保真度奖励取代传…详细
这项研究提出了AnytimeReasoner框架,通过从先验分布采样思考预算,优化大语言模型在任意计算资源下的推理能力。研究团队开发的预算相对策略优化(BRPO)技术引入可验证的密集奖励,提升强化学习效率。实验表明,该方…详细
文章指出在企业中,AI 试点屡遭挫折,OpenAI因此转向消费者市场,暗示AI将通过用户扩散进入企业,最终由IT部门解决相关问题。…详细
本文汇总了解释 AI 领域常用术语及技术概念,涵盖从 AGI 到神经网络等多个关键内容,帮助读者理解人工智能的基本原理与应用。…详细
谷歌正全力打造具备“世界模型”的全能 AI 助手,通过深度整合各项技术与产品,旨在重塑搜索体验,并在 AI 竞争中超越微软和 OpenAI。…详细
这篇研究通过创新的"先描述后推理"方法,解决了视觉语言模型在学习推理过程中容易走捷径的问题。研究团队开发的Visionary-R1模型不依赖任何推理链标注数据,仅使用问题-答案对和强化学习,就实现了超越GPT-4o等商业模…详细
香港浸会大学周開陽教授率领的研究团队提出了IndexMark,这是首个针对自回归图像生成模型的免训练水印框架。该方法利用码本中索引的冗余性,通过匹配-替换策略在生成过程中嵌入不可见水印。具体而言,IndexMark将码本…详细
5月26日,昆仑万维天工超级智能体(Skywork Super Agents)APP正式上线! 这是全球首款基于AI Agent架构的Office智能体手机APP,标志着“AI Office智能体”时代从桌面端全面迈向移动端,让生产力革命触手可及!…详细
在当今科技日新月异的背景下,新质生产力正成为推动经济社会高质量发展的关键力量。而工业作为国民经济的中流砥柱,其培育新质生产力的步伐和速度,一定程度影响着整个经济新质转型的进程和效果。…详细
随着新一代消费群体对生活质量、审美一致性与空间一体化要求的提升,水行业正面临一次从产品功能到空间角色的集体重塑。…详细
这项研究提出了量化零阶优化(QZO)方法,解决大型语言模型微调时的内存瓶颈问题。研究团队通过创新性地结合模型量化(将权重从16位压缩到4位)和零阶优化(通过前向传递扰动估计梯度),同时消除了对梯度和优化器状…详细
纽约大学阿布扎比分校研究团队提出了一种创新的两阶段训练方法,解决了AI领域的数据稀缺问题。他们首先让AI模型在简单的"骑士与恶棍"逻辑游戏中"热身",学习通用推理技能,然后再用少量特定领域数据进行强化学习。实…详细
这项由EPFL和Google联合完成的研究提出了WilliamT,一种创新的低成本自动化程序修复工具。与传统的寻找漏洞根本原因的方法不同,WilliamT专注于"崩溃点修复",直接在程序崩溃位置添加防护代码,有效阻止漏洞被利用。…详细
这项研究介绍了一种新型的新闻偏见检测工具"bias-detector",由慕尼黑工业大学和罗马大学的研究团队开发。他们通过在BABE数据集上微调RoBERTa模型,显著提升了偏见检测准确率,其宏观F1得分达0.9257,优于现有最佳方…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。