清华大学团队发布AutoTriton,这是首个专门用于Triton编程的AI模型,通过创新的两阶段训练方法——监督微调与强化学习相结合,让普通程序员也能轻松编写高性能GPU内核代码。尽管只有80亿参数,但在权威基准测试中表现媲美千亿级大模型,有望大幅降低GPU编程门槛。
ByteDance人工智能团队开发的FR3E算法通过模仿侦探破案的思维模式,让AI在数学推理中能够识别关键决策点并进行重点探索,显著提高了数学问题解决的准确性和稳定性。该算法在AIME24等困难数学竞赛上表现出色,为AI推理能力的提升开辟了新方向。
中科院团队开发出DiffSpectra系统,首次实现仅通过多模态光谱数据就能准确推断分子完整三维结构的AI技术。该系统同时处理红外、拉曼和紫外光谱,采用扩散模型直接生成分子结构,突破了传统依赖分子库查找的局限。测试显示16.01%完全准确率,前20候选准确率达96.86%,将revolutionize化学分析效率,加速新药研发和材料科学发展。
亚马逊发布Nova Premier AI模型的首个全面安全评估报告,针对化学生物武器、网络攻击和AI自主研发三大高风险领域进行了系统性测试。研究采用自动化基准测试和人工评估相结合的方法,并邀请第三方机构独立验证。结果显示Nova Premier虽然在各领域知识水平有所提升,但实际危险操作能力仍在安全阈值内,可安全向公众开放。
Yale大学等机构联合开发的Agent KB系统让AI助手们能够像人类一样分享经验和知识,通过"师生协作"模式和跨领域知识迁移,在GAIA和SWE-bench基准测试中取得了显著的性能提升,其中最困难任务的成功率提升了近20个百分点,为AI发展开辟了"集体智慧"的新范式。
卡内基梅隆大学研究团队深入分析了当前世界模型的根本缺陷,提出了PAN架构。该研究发现现有系统过分关注视觉效果而忽略智能推理,提出混合表示和多尺度推理的解决方案。PAN采用离散标记和连续嵌入的组合,通过增强的大语言模型和扩散预测器实现真正的"思想实验"能力,为AI从内容生成器向智能推理系统的转变提供了新路径。
阿联酋穆罕默德·本·扎耶德人工智能大学研究团队开发出世界首个支持埃及阿拉伯语双文字系统的AI语言模型Nile-Chat,能同时理解和生成阿拉伯文字和拉丁字母书写的埃及阿拉伯语。该模型采用创新的混合专家架构,在各项测试中显著超越现有模型,为超过1亿埃及阿拉伯语使用者提供了更精准的AI语言服务。
本古里安大学研究团队开发了Diff-Mamba,这是对高效AI架构Mamba的重要改进。该技术通过创新的"差分"机制解决了AI系统容易"走神"的问题,让AI能够更好地专注于重要信息、过滤无关内容。实验证明,Diff-Mamba在语言理解、信息检索和长文本处理方面都有显著提升,为构建更可靠、更高效的AI系统提供了新思路。
Liqid发布了新产品,支持主机服务器应用程序访问由GPU、内存和存储池构建的动态编排GPU服务器系统,专注于AI推理和代理应用。该公司从PCIe Gen 4架构升级至PCIe 5,支持CXL 2.0内存池化。新产品包括Matrix软件、可组合GPU服务器、可组合内存和I/O加速器等。系统提供两种配置:UltraStack可为单台服务器提供最多30个GPU和100TB DRAM;SmartStack可在最多20个服务器节点间池化30个GPU。
Uber宣布与Lucid和Nuro合作部署至少2万辆自动驾驶出租车。Lucid负责制造基于Gravity电动SUV的改装车辆,Nuro提供自动驾驶软件。车辆搭载英伟达DRIVE Thor芯片的Nuro Driver模块,具备L4级自动驾驶能力。该服务将于2026年底在美国单一城市启动,随后6年内部署超过2万辆车辆。
法国AI实验室Mistral为其Le Chat聊天机器人推出多项新功能,包括"深度研究"模式、原生多语言推理和高级图像编辑功能。深度研究模式将Le Chat转变为协调研究助手,能够规划、澄清需求、搜索和综合数据。该功能面向消费者和企业用户,可进行详尽的旅行规划分析和企业研究。Mistral专注于将Le Chat集成到企业生态系统中,支持本地数据连接,无需上传至云端。新增的项目功能帮助用户组织聊天、文档和想法,多语言推理现已支持法语、西班牙语、日语等。
AWS为S3对象存储新增向量存储桶功能,旨在降低Amazon OpenSearch Service中低频访问向量的存储成本。该功能专为向量数据存储设计,可将上传、存储和查询向量的总成本降低90%。新的向量存储桶提供专用API,无需预配置基础设施即可存储和查询向量数据。每个存储桶最多支持10000个向量索引,每个索引可容纳数千万个向量。该功能已与Amazon Bedrock Knowledge Bases集成,支持构建RAG应用程序,并可与OpenSearch Service协同工作以优化成本。
谷歌澄清ChromeOS不会完全转变为Android,而是基于Android底层技术构建ChromeOS体验,实现更高性能和更好的设备协同。新的统一代码库将减少开发工作量,简化AI功能访问,同时保持ChromeOS的安全性和管理能力。这一变化可能影响入门级Chromebook的硬件要求,但将为两个平台带来显著优势,包括更好的Android应用兼容性和多用户支持。
开放闪存平台(OFP)旨在用直接访问的闪存盒替代全闪存阵列,每个闪存盒配备控制器DPU、Linux系统和并行NFS软件。该倡议由Hammerspace主导,针对新云、超大规模和AI公司在数据中心设计演进中面临的基础设施限制。OFP通过结合IPU/DPU技术、闪存优化机箱和Linux协议,提供高密度、低功耗的存储解决方案,满足AI应用从PB级向EB级数据容量需求的扩展。
ERP系统市场近年来相对稳定,但AI正在改变一切。供应商们正竞相在产品组合中嵌入AI功能,构建包括可组合应用、集中数据存储和可扩展云平台的生态系统。Oracle凭借AI投资超越SAP成为ERP收入领导者,而AI代理已从实验阶段进入实际应用,能够管理整个工作流程并进行自动化决策。本文盘点了Oracle、SAP、微软等十大最具影响力的ERP厂商及其AI战略。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
以色列魏茨曼科学研究所、英特尔实验室和d-Matrix研究人员开发出新算法,能显著降低大语言模型服务成本。该算法基于投机解码技术,无需专门的草稿模型即可将令牌生成速度提升2.8倍。研究提出三种方法:令牌级交集、字符串级精确匹配和字符串级拒绝采样,解决了不同模型词汇表匹配问题。算法已集成到Hugging Face框架中,开发者仅需一行代码即可使用。
AWS在纽约峰会上发布Amazon Bedrock AgentCore,这是一个企业级AI代理构建、部署和运营平台。该平台支持开源框架如CrewAI、LangChain等,提供运行时、内存、身份管理、可观测性等核心服务。Box、巴西伊塔乌银行等企业已开始使用该平台构建生产级应用。平台采用按需付费模式,目前在部分AWS区域提供预览版,2025年9月16日前免费试用。
网约车巨头Uber宣布与中国科技公司百度达成多年战略合作,计划在美国和中国以外地区推出数千辆自动驾驶出租车。服务将从今年晚些时候开始,首先在亚洲和中东的未指定国家推出。百度的Apollo自动驾驶汽车已在中国11个城市运营,成本仅为3.7万美元,远低于行业平均的20万美元。用户可选择乘坐自动驾驶车辆或人工驾驶车辆。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。