人工智能文章列表第99页-至顶网频道

2025-06-01

Alita：极简设计打造无限创造力的通用AI助手

Alita是一种新型通用AI代理系统，采用极简设计理念，以"最小预定义，最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita，只配备一个核心能力和少量通用模块，能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示，Alita在GAIA基准测试上达到87.27%的通过率，超越包括OpenAI Deep Research在内的复杂系统，证明简约设计可带来卓越性能。

打破极限：清华与阿里联合研究团队用多智能体协作突破大语言模型外部知识输入的窗口限制

清华大学与阿里巴巴通义实验室合作研发了EXTAGENTS，一个创新的多智能体框架，解决了大语言模型处理超大规模外部知识的限制问题。该研究通过全局知识同步和知识累积推理两大创新组件，使模型能够有效整合远超其上下文窗口大小的信息量，在多跳问答和长篇综述生成等任务中取得显著优势。这一突破为知识密集型应用提供了无需额外训练的高效解决方案，同时保持了高并行性和可扩展性。

脑部核磁共振正片加强！波尔多大学研发通过强化学习驱动大语言模型的神经退行性痴呆症可解释诊断框架

法国波尔多大学研究团队开发了一个突破性框架，用于神经退行性痴呆症的差异化诊断。该框架将3D脑部MRI转换为文本报告，并利用强化学习优化的大语言模型进行详细诊断推理。不同于传统"黑箱"方法，这一系统能生成透明、有因果关系的解释，同时保持高诊断准确率。研究显示，通过群组相对策略优化(GRPO)训练的轻量级模型能展现复杂推理行为，包括假设检验和非线性思考，提供与临床决策流程一致的排序诊断结果。

揭秘事实核查的不确定性：哥本哈根大学研究团队如何让AI解释证据冲突

这项研究提出了CLUE框架，首次能够生成自然语言解释来揭示AI事实核查系统不确定性的来源。与现有方法不同，CLUE能识别文本片段间的冲突与一致关系，并解释它们如何影响模型的预测不确定性。实验表明，CLUE生成的解释在三种语言模型和两个事实核查数据集上都更忠实于模型不确定性，用户评价其更有帮助、信息更丰富、冗余更少且逻辑更一致。CLUE不需要微调或架构更改，适用于任何白盒语言模型，为事实核查提供了实用支持。

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: