南京大学与微软研究院合作提出过程式自我奖励语言模型,让AI在数学推理中既当学生又当老师。该方法通过逐步判断和偏好优化,使AI能够自我监督和持续改进,在多个数学基准测试中显示出显著性能提升,为实现超越人类水…详细
人民大学团队创建了OlymMATH,这是首个奥数级AI数学推理基准测试,包含200道双语题目。测试结果显示,即使最先进的AI模型如Gemini 2.5 Pro在困难题目上也只能达到58.4分,揭示了当前AI在复杂数学推理方面的真实能力边…详细
阿里巴巴研究团队首次将强化学习的可验证奖励方法应用于全模态情感识别,开发出R1-Omni系统。该系统能同时处理视频、音频和文本信息进行情感判断,并提供详细推理过程。在多个数据集测试中,R1-Omni不仅准确率超越传…详细
斯坦福大学研究团队通过对比实验发现,AI模型自我改进能力的关键在于四种认知行为:验证、回溯、子目标设置和逆向推理。具备这些"思维习惯"的模型能有效利用额外计算时间提升表现,而缺乏认知行为的模型则停滞不前。…详细
微软团队首次系统性对比了API代理和GUI代理两种AI自动化方案。API代理通过程序接口高效执行任务,GUI代理则像人类一样操作界面。研究发现两者各有优势:API代理速度快、可靠性高但功能受限;GUI代理通用性强、透明度…详细
中科院软件所联合阿里巴巴推出SolutionRAG智能工程设计系统,通过双重思维树机制自动生成复杂工程解决方案。该系统能像资深工程师一样同时考虑地震、土壤、降雨等多重约束条件,在八个工程领域的测试中均达到最佳性能…详细
中国人民大学研究团队开发了ReaRec推荐系统,让AI学会"三思而后行"。不同于传统推荐系统的直接反应,ReaRec通过多步推理深度理解用户需求,特别擅长为新用户和小众商品提供精准推荐。实验显示平均性能提升7.49%,理论…详细
随着新一轮科技革命与产业变革的持续演进,软件作为信息经济发展的核心引擎与基础支撑,正持续释放创新活力。以AI大模型为代表的新兴技术,深刻重塑了软件产业格局,尤其在工业软件领域,其与AI的融合已成为引领产业…详细
7月29日,2025世界人工智能大会(WAIC)期间,由是石科技主办的“算力为基——并行优化与行业模型赋能AI产业变革”高端圆桌对话在上海隆重举行。…详细
2025年7月30日,江苏润和软件股份有限公司(以下简称“润和软件”)以“智领微界 量点未来”为主题,面向全球重磅发布AI量子点微生物检测平台。该平台以“30分钟检测时长、超90%精准度”的核心优势,将重新定义微生物…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。