人工智能 关键字列表
复旦大学团队首创多维约束框架:让AI更听话,不再"一言难尽"

复旦大学团队首创多维约束框架:让AI更听话,不再"一言难尽"

复旦大学团队开发了全新的多维约束框架来评估和改进大语言模型的指令跟随能力。研究发现AI在处理复杂约束时表现不佳,成功率从简单约束的77%降至复杂约束的33%。通过强化学习训练,模型性能显著提升30-50个百分点且不影响其他能力。研究揭示改进主要来自注意力机制优化,为AI实用化提供了重要突破。

用AI玩游戏,加州大学伯克利分校科学家发明了一个永远玩不完的智力测试

用AI玩游戏,加州大学伯克利分校科学家发明了一个永远玩不完的智力测试

加州大学伯克利分校研究团队开发了gg-bench系统,让AI自己设计策略游戏来测试其他AI的智能水平。研究发现,即使是最先进的AI模型,在面对自己"同类"设计的游戏时胜率也只有7-36%,揭示了AI在创造和解决问题之间的能力差异。这项研究为避免传统AI测试中的"数据污染"问题提供了创新解决方案。

华盛顿大学首创耳机AI助手:悄悄在你耳边提醒的智能伙伴来了

华盛顿大学首创耳机AI助手:悄悄在你耳边提醒的智能伙伴来了

华盛顿大学研究团队开发出世界首个主动式耳机AI助手LLAMAPIE,能够在用户对话中主动提供简短关键词提醒,无需用户主动询问。该系统采用双模型架构,在真人测试中将问答准确率从37%提升至87%,同时保持对话自然流畅。这项技术为人机交互带来新突破,在教育、商务和辅助医疗等领域具有广阔应用前景。

记忆力爆满的AI大脑终于找到了"忘记"的艺术——MIT等顶尖院校发现让AI聪明"遗忘"的秘密

记忆力爆满的AI大脑终于找到了"忘记"的艺术——MIT等顶尖院校发现让AI聪明"遗忘"的秘密

MIT等顶尖院校研究团队发现AI处理长文本时存在"记忆过载"问题,提出OPRM溢出预防方法,通过"分而治之"策略让AI学会聪明遗忘,性能提升14%-51%。该方法类似智能图书管理员,先快速浏览所有相关内容,再专注分析最相关部分,避免了传统方法的记忆溢出困境,为实现更高效的长文本AI应用开辟新路径。

独角兽、人工智能与医疗健康的未来:HLTH Europe 2025大会亮点回顾

独角兽、人工智能与医疗健康的未来:HLTH Europe 2025大会亮点回顾

第二届欧洲健康大会汇聚了全球健康领域领导者、初创企业、投资者和开发者,对当前医疗创新现状及未来发展进行年中评估。在经济不确定性和监管优先级变化的背景下,制药、健康科技和医疗服务领域都在竞相证明价值并扩大创新规模。会议涵盖了GLP-1药物兴起、真正的患者中心化、AI的潜力与陷阱,以及为大胆创新想法提供资金的途径等热点话题。

二季度全球风投资金达910亿美元,AI引领投资趋势

二季度全球风投资金达910亿美元,AI引领投资趋势

全球风险投资资金在今年第二季度表现强劲,总资金从去年同期的820亿美元增长至910亿美元。AI公司获得400亿美元投资,占季度全球总额的45%。其中Scale AI单笔融资143亿美元创纪录。美国初创企业获得600亿美元,占全球风投资金的三分之二。2025年上半年全球风投总额达2050亿美元,同比增长32%,显示投资环境日益偏向大规模融资。

中山大学开发PASSAT:让AI预测天气像物理学家一样思考

中山大学开发PASSAT:让AI预测天气像物理学家一样思考

中山大学联合深圳气象创新研究院开发出PASSAT模型,这是首个同时融合物理约束和球面拓扑的AI天气预报系统。该模型通过球面图神经网络处理地气相互作用,用物理方程计算大气流动,避免了传统平面投影的几何扭曲问题。测试显示PASSAT在多项指标上超越现有AI模型,甚至优于部分业务化数值预报系统,为AI气象预报开辟了新路径。

MIT推出NANDA协议:智能体组织化管理的新标准

MIT推出NANDA协议:智能体组织化管理的新标准

MIT开发的NANDA协议为AI智能体提供完整的交互平台,通过加密身份验证、智能体注册和分布式账本技术,实现智能体在分布式环境中的安全、可扩展和自主运行。该协议类似于为AI智能体建立组织架构,赋予它们身份、角色和职责,支持多智能体系统协作。专家认为NANDA将解决信任、文化和编排三大挑战,并可能颠覆传统商业模式。

谁需要大型AI模型?

谁需要大型AI模型?

AI领域持续快速发展,尤其是DeepSeek及其追随者的推出后,许多人认为企业并不真正需要OpenAI、Meta和Google推广的大型昂贵AI模型,而是专注于更小的模型。然而,对于代码生成、推理和智能体AI而言,大模型仍然必不可少。Cerebras Systems宣布支持大型Qwen3-235B模型,支持131K上下文长度,成本仅为每百万输出令牌0.60美元。该模型擅长深度逻辑推理、高级数学和代码生成,能够同时处理数万行代码。

专访:Happy Socks首席信息官Vivek Bharadwaj谈AI转型与数据驱动决策

专访:Happy Socks首席信息官Vivek Bharadwaj谈AI转型与数据驱动决策

Happy Socks首席信息官Vivek Bharadwaj负责企业技术战略、IT转型和数字营销等多个领域。他通过建立AI业务流程转型单元来推动运营优化,并消除了企业业务单元间的数据孤岛。公司迁移到Snowflake AI数据云平台,实现了从Excel手工报告到每15分钟更新的实时报告的转变。在AI应用方面,公司制定了严格的人工监督政策,确保负责任的AI部署。

新型15亿参数路由模型实现93%准确率,无需昂贵重训练

新型15亿参数路由模型实现93%准确率,无需昂贵重训练

Katanemo Labs研究人员推出Arch-Router,一个智能路由模型框架,可将用户查询映射到最合适的大语言模型。该框架采用"偏好对齐路由"方法,允许用户用自然语言定义路由策略,通过域-动作分类法组织任务。Arch-Router是15亿参数模型,在四个公开数据集上达到93.17%的路由准确率,超越顶级专有模型平均7.71%。系统支持实时策略调整,无需重新训练,为企业多模型部署提供灵活解决方案。

Cloudian将Milvus向量数据库集成到HyperStore中用于AI推理

Cloudian将Milvus向量数据库集成到HyperStore中用于AI推理

对象存储供应商Cloudian正在将Milvus向量数据库功能集成到其HyperStore软件中,作为AI数据平台路线图的一部分提供AI推理能力。HyperStore是一个对象存储系统,具有几乎无限的可扩展性并支持Nvidia的GPUDirect。向量数据库存储非结构化文档数据的多维方面的数学变换,以及向量化的音频、图像和视频数据。这些向量被大型语言模型用于在构建对用户请求的响应时搜索语义相关的向量。

Deepgram推出Saga:为开发者打造的AI语音接口

Deepgram推出Saga:为开发者打造的AI语音接口

Deepgram发布了名为Saga的AI语音操作系统,专为开发者设计。该工具作为通用语音界面直接嵌入开发环境,允许开发者仅通过语音控制工具和代码。Saga集成了多种AI原生编码环境,包括Cursor和Windsurf,还可维护Linear、Asana、Jira等项目管理软件的状态更新。开发者可通过语音表达想法,如"创建一个响应表情符号的Slack机器人",Saga会将其转换为可执行的编程提示。该工具旨在减少开发者在工具间切换的"静默税收",提高开发效率。

Graphwise升级图数据库成为AI智能体的大脑

Graphwise升级图数据库成为AI智能体的大脑

保加利亚图数据库初创公司Graphwise发布GraphDB 11重大升级,新增功能旨在增强企业知识管理并为人工智能模型提供更可靠的基础。该平台通过语义层管理结构化和非结构化数据,支持更多大语言模型包括Llama、Gemini等,并新增模型上下文协议支持。GraphDB 11还改进了精确实体链接功能,优化了数据检索和AI输出应用。公司表示新版本可帮助解决AI就绪数据不足问题,降低基础设施成本,提高AI项目成功率。

三星收购Xealth加速数字健康平台布局

三星收购Xealth加速数字健康平台布局

韩国电子巨头三星宣布收购美国西雅图数字健康技术公司Xealth,进一步扩大在健康领域的布局。Xealth专注于帮助医疗专业人员将数字健康技术整合到日常实践中,与70多家数字健康技术供应商合作,应用覆盖美国500多家医院。此次收购将推动三星向连接医疗保健平台转型,结合其在传感器技术和可穿戴设备方面的优势,完善Samsung Health平台功能。

小米7B模型挑战巨头:如何让"小个子"AI在推理任务上击败32B大模型

小米7B模型挑战巨头:如何让"小个子"AI在推理任务上击败32B大模型

小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。

让AI学会团队合作:中文大学团队破解大模型推理"独行侠"难题

让AI学会团队合作:中文大学团队破解大模型推理"独行侠"难题

这项由中国香港中文大学(深圳)团队主导的研究发现,AI大模型存在"前缀主导陷阱"问题——仅15%的错误开头就能导致20%的性能下降。研究团队创新性地提出LeaP方法,让多个AI推理路径在思考过程中互相交流协作,显著提升了推理准确性。实验显示,使用LeaP的32B模型甚至超越了671B模型,证明了AI协作的巨大潜力。

AI搜索助手学会了"知之为知之,不知为不知":中科院团队让机器学会判断何时查资料

AI搜索助手学会了"知之为知之,不知为不知":中科院团队让机器学会判断何时查资料

中科院团队开发了名为IKEA的AI搜索助手系统,解决了现有AI过度依赖外部搜索或内部知识的问题。该系统通过创新的知识边界感知机制和奖励设计,让AI学会准确判断何时使用内部知识、何时进行搜索。实验结果显示,IKEA在保持高准确率的同时,将搜索次数减少了50%以上,为开发更智能、高效的AI助手提供了新思路。

ByteDance Seed研究团队突破性发现:小模型也能给大模型当"质检员",AI训练数据筛选迎来革命性转变

ByteDance Seed研究团队突破性发现:小模型也能给大模型当"质检员",AI训练数据筛选迎来革命性转变

ByteDance Seed研究团队提出AttentionInfluence方法,让13亿参数小模型为70亿参数大模型筛选训练数据。该方法利用模型内部注意力机制判断数据质量,无需人工标注。实验显示在推理密集型任务上性能提升1.4-3.5%,展现了"弱到强"的泛化能力,为AI训练数据选择提供了新的解决方案。

Adobe研究院揭秘:让AI学会"引经据典"的新方法——从此告别人工智能的"胡说八道"

Adobe研究院揭秘:让AI学会"引经据典"的新方法——从此告别人工智能的"胡说八道"

Adobe研究院开发出让AI学会准确引用信息来源的新方法,通过简单的"对错判断"策略和注意力机制分析,显著提升了AI系统在归因任务上的表现,为解决AI"胡说八道"问题提供了实用解决方案。