这项研究提出了CPGD算法,解决语言模型规则强化学习中的训练不稳定问题。通过用策略梯度损失替代PPO-clip损失,并引入裁剪机制和策略漂移正则化,CPGD有效避免了现有方法中由重要性采样比率引起的训练崩溃。实验结果…详细
这项由香港大学和Salesforce AI Research联合开展的研究解决了AI助手操作电脑时的关键障碍:GUI定位能力。研究者创建了新的OSWORLD-G基准测试(564个样本)和JEDI数据集(400万示例),通过将复杂界面交互分解为基础…详细
这项研究提出了一种名为"断点思维链推理"的创新方法,颠覆了大语言模型中"完整思考过程必不可少"的传统观念。研究表明,在思考链中途截断并直接生成答案竟能达到甚至超过完整推理的准确率,同时显著节省计算资源。基…详细
香港中文大学与智谱研究院的研究团队提出了VisionReasoner,一个基于强化学习的统一视觉感知与推理框架。该模型能够同时处理检测、分割和计数三类视觉任务,通过结构化推理过程分析图像内容。实验显示,与Qwen2.5VL相…详细
这项研究提出了QCompiler,一个神经符号框架,旨在提升检索增强生成系统中的搜索意图识别精确度。研究团队设计了最小且充分的BNF语法来形式化复杂查询,并开发了包含查询表达式翻译器、词法语法分析器和递归下降处理…详细
这项研究提出了一种加速TarFlow图像生成模型采样过程的方法。研究人员发现TarFlow中的块具有不同重要性:少数块在图像生成中起主要作用,而其他块贡献较小;有些块对初始值敏感,其他块则相对稳健。基于此,他们提出…详细
SPOT是一项开创性研究,揭示了大型语言模型在科学论文错误检测方面的严重不足。研究团队创建了包含83篇跨10个学科领域的论文基准,每篇均包含导致勘误或撤回的已验证错误。最先进的AI模型在此任务上表现惊人地差,最…详细
德克萨斯大学奥斯汀分校的研究团队开发了一个名为CHARTMUSEUM的全新基准测试,专门评估大型视觉-语言模型理解图表的能力。研究表明,即使最先进的AI模型在图表视觉推理任务上远远落后于人类表现——虽然人类能达到93…详细
西北工业大学研究团队开发了FinePhys框架,解决了AI生成的人体动作不符合物理规律的问题。该系统通过在线估计2D姿态并转换为3D骨架,再利用欧拉-拉格朗日方程进行物理重估计,最终生成物理上合理的精细人体动作视频。…详细
在HarmonyOS 5上,华为云空间除了可以保护电脑的的设备安全外,还能安全存储用户的个人数据。无论是照片、视频还是文档,都能快速上传和下载,轻松调用。尝鲜鸿蒙电脑的用户,可在电脑上打开我的华为 App,在“首页-…详细
Red Hat 子公司推出的全新 RHEL 10 聚焦混合云及 AI 工作负载,通过生成式 AI 助手 Lightspeed 简化 Linux 管理,同时集成量子抗性加密和容器原生 OS 管理,实现 IT 运维一体化。…详细
MCP引领Agent互联网新时代暨物理AI模型新篇章,2025年第二届AIGC上海开发者大会即将在模力社区举办…详细
在当今人工智能应用蓬勃发展的浪潮中,AI Agent无疑备受瞩目,被视为人工智能走向成熟应用的关键载体,承载着众多企业智能化转型的期望。相关数据显示,未来两到三年内,中国人工智能市场规模有望突破500亿美元,年复合增长…详细
Panasonic Industry Europe 与 DigiCert 合作,将 DigiCert Device Trust Manager 集成至 PAN-MaX 服务,实现 Matter 设备自动认证,加速智能家居产品安全、合规生产,助力制造商抢占市场先机。…详细
本文探讨了人工智能如何通过重构内在情感、认知和外部社交、社会结构,既可能扩展也可能限制我们的自由,呼吁以人为本、主动掌控AI未来。…详细
这项研究探索了如何通过"LLM情境调节"和"持续工作流程提示"技术来提高大型语言模型在验证化学分子式时的准确性。研究者发现,普通提示方法往往不可靠,因为LLM倾向于自动"纠正"错误而非指出它们。然而,通过精心设计…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。