阿里巴巴等机构联合研究团队通过分析2021-2024年间148个国家发布的2000多个多语言AI评测基准,发现尽管全球已投入超过1100万美元,但现有评测体系与人类真实判断仍存在巨大鸿沟,特别是在语言理解任务上关联度仅11-3…详细
这项由上海交通大学与OPPO人工智能中心合作的研究首次深入探索了多模态大语言模型的视频空间推理能力提升方法。研究发现传统提示词对小型模型无效,转而采用GRPO强化学习训练法,构建了包含10万样本的VSI-100k数据集…详细
KAIST研究团队开发出革命性AI检索系统UniversalRAG,首次实现跨文字、图片、视频的智能信息路由。该系统能根据问题特点自动选择最合适的信息类型和详细程度,在8个基准测试中显著优于传统方法,平均性能提升15-20%,…详细
StepFun和清华大学联合提出Open-Reasoner-Zero,这是首个开源的大规模推理导向强化学习训练框架。该方法采用极简的vanilla PPO算法直接在基础模型上训练,无需复杂预处理,仅用十分之一训练时间就在多个数学推理基准…详细
这项NVIDIA团队的突破性研究解决了AI视觉理解中的精确局部描述难题。通过创新的聚焦提示技术和本地化视觉架构,DAM模型能够准确描述图片和视频中任何指定区域的详细内容,性能显著超越现有方法,为医疗诊断、教育辅助…详细
卡内基梅隆大学研究团队开发出"反蒸馏采样"技术,能让AI模型在保持正常性能的同时,阻止竞争对手通过观察推理过程来复制模型能力。这种方法巧妙地在模型输出中加入"毒性"内容,对人类用户无害但会干扰机器学习过程,…详细
约翰斯·霍普金斯大学团队发现AI专家混合系统存在10-20%的性能损失,开发出C3PO方法通过测试时动态优化专家选择策略,让1-3亿参数的小模型超越7-9亿参数大模型,在六个基准测试上提升7-15%准确率,为资源受限环境下部…详细
新加坡国立大学研究团队开发了JudgeLRM,一个专门用于评判AI系统表现的模型。研究发现传统训练方法在需要复杂推理的评判任务上效果较差,因此采用强化学习训练JudgeLRM,使其具备真正的推理能力。JudgeLRM-3B甚至超越…详细
ByteDance研究团队提出ReTool框架,通过强化学习让大型语言模型学会在数学推理中战略性使用代码工具。该方法在AIME数学竞赛中达到67%准确率,比传统文本推理方法提升27个百分点,训练效率提高近3倍,展现了工具增强推…详细
随着汽车行业智能化的蓬勃发展,消费者对越野车的需求也在不断升级,期待在保留硬核实力的同时,融入更多智能化的体验。…详细
全球帆船锦标赛SailGP与BT集团和爱立信合作,在英国朴茨茅斯赛事中部署5G独立组网切片技术。该技术为时速100公里的F50双体帆船提供实时数据传输,支持裁判通过5G直播摄像头执法,并为12支参赛队伍提供战术分析。爱立…详细
Anthropic推出首个行业定制版AI产品Claude for Financial Services,专为金融行业打造。该服务基于Claude企业版,提供更高使用限制、内置数据连接器以及提示词库。新版本预装了连接FactSet、PitchBook等金融数据提供…详细
多年来,Cursor、Windsurf和GitHub Copilot等代码编辑工具一直是AI编程的标准。但随着代理AI能力增强,AI系统正从处理代码转向直接与系统终端交互。Anthropic、DeepMind和OpenAI都推出了命令行编程工具。终端工具采用…详细
来自OpenAI、谷歌DeepMind、Anthropic等公司的AI研究人员发表联合立场文件,呼吁深入研究监控AI推理模型"思维链"的技术。思维链是AI模型解决问题的外化过程,类似人类使用草稿纸解题。研究人员认为思维链监控可能是控…详细
特斯拉在孟买开设首家体验中心,正式进入印度市场,距离马斯克2016年首次预告已过去九年。该体验中心位于孟买中央商务区,展示从上海进口的Model Y车型。后驱版售价约68000美元,长续航版约79000美元。印度客户今日起…详细
博通推出Tomahawk Ultra交换芯片,主张以太网技术可替代新兴的UALink协议。该51.2 Tbps交换ASIC专门针对高性能网络调优,延迟低至250纳秒,支持1024个加速器的扩展系统。博通认为以太网在监控、遥测和调试工具方面具…详细
随着多家公司进入机器人出租车领域,如何判断其技术成熟度成为关键问题。真正的机器人出租车需要满足五个基本要求:无需人工监督的安全自主驾驶、在公共道路运营、商业可行的服务区域、向公众开放服务,以及提供点对…详细
人工智能基础设施初创公司C-Gen.AI推出新平台,帮助数据中心运营商自动化部署并最大化利用昂贵的AI硬件资源。该GPU编排平台能够在几分钟内自动部署AI集群,实时监控并确保最高效率运行。通过动态重新分配闲置GPU资源…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。