科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-16 09:17:07
阿里巴巴团队深度解剖2000+多语言评测基准:为什么花费千万美元的AI评测体系仍然"看不懂"人类的真实需求?

阿里巴巴等机构联合研究团队通过分析2021-2024年间148个国家发布的2000多个多语言AI评测基准,发现尽管全球已投入超过1100万美元,但现有评测体系与人类真实判断仍存在巨大鸿沟,特别是在语言理解任务上关联度仅11-3…详细

多语言评测人工智能大语言模型

2025-07-16 09:16:46
AI也会"看图说话"了!上海交大团队让机器视觉推理能力提升12%

这项由上海交通大学与OPPO人工智能中心合作的研究首次深入探索了多模态大语言模型的视频空间推理能力提升方法。研究发现传统提示词对小型模型无效,转而采用GRPO强化学习训练法,构建了包含10万样本的VSI-100k数据集…详细

人工智能强化学习视觉空间推理

2025-07-16 09:16:27
KAIST团队打造全能AI检索助手:一个系统搞定文字、图片、视频所有问题

KAIST研究团队开发出革命性AI检索系统UniversalRAG,首次实现跨文字、图片、视频的智能信息路由。该系统能根据问题特点自动选择最合适的信息类型和详细程度,在8个基准测试中显著优于传统方法,平均性能提升15-20%,…详细

人工智能检索增强生成多模态路由

2025-07-16 09:16:11
从零起步也能做推理大模型?StepFun和清华大学揭秘超高效训练的神奇配方

StepFun和清华大学联合提出Open-Reasoner-Zero,这是首个开源的大规模推理导向强化学习训练框架。该方法采用极简的vanilla PPO算法直接在基础模型上训练,无需复杂预处理,仅用十分之一训练时间就在多个数学推理基准…详细

人工智能强化学习数学推理

2025-07-16 09:13:20
NVIDIA团队突破性成果:让AI精准描述图片和视频中的任何细节

这项NVIDIA团队的突破性研究解决了AI视觉理解中的精确局部描述难题。通过创新的聚焦提示技术和本地化视觉架构,DAM模型能够准确描述图片和视频中任何指定区域的详细内容,性能显著超越现有方法,为医疗诊断、教育辅助…详细

计算机视觉局部描述多模态学习

2025-07-16 09:13:03
从保护到攻击:卡内基梅隆大学团队让AI模型学会"藏私"的巧妙方法

卡内基梅隆大学研究团队开发出"反蒸馏采样"技术,能让AI模型在保持正常性能的同时,阻止竞争对手通过观察推理过程来复制模型能力。这种方法巧妙地在模型输出中加入"毒性"内容,对人类用户无害但会干扰机器学习过程,…详细

人工智能模型蒸馏知识产权保护

2025-07-16 09:12:42
大学新突破:让AI专家系统"更聪明"的秘密配方——约翰斯·霍普金斯大学团队发现如何让机器在考试时临场发挥

约翰斯·霍普金斯大学团队发现AI专家混合系统存在10-20%的性能损失,开发出C3PO方法通过测试时动态优化专家选择策略,让1-3亿参数的小模型超越7-9亿参数大模型,在六个基准测试上提升7-15%准确率,为资源受限环境下部…详细

专家混合系统测试时优化动态路径选择

2025-07-16 09:12:24
新加坡国立大学最新突破:让AI当法官,推理能力决定评判准确性

新加坡国立大学研究团队开发了JudgeLRM,一个专门用于评判AI系统表现的模型。研究发现传统训练方法在需要复杂推理的评判任务上效果较差,因此采用强化学习训练JudgeLRM,使其具备真正的推理能力。JudgeLRM-3B甚至超越…详细

人工智能强化学习模型评估

2025-07-16 09:11:54
人工智能在数学奥赛中的巅峰突破:ByteDance团队让AI学会了使用代码工具

ByteDance研究团队提出ReTool框架,通过强化学习让大型语言模型学会在数学推理中战略性使用代码工具。该方法在AIME数学竞赛中达到67%准确率,比传统文本推理方法提升27个百分点,训练效率提高近3倍,展现了工具增强推…详细

工具增强推理强化学习数学推理优化

2025-07-16 09:07:59
智野双全一车搞定 豪华智能越野“第一车”即将发布

随着汽车行业智能化的蓬勃发展,消费者对越野车的需求也在不断升级,期待在保留硬核实力的同时,融入更多智能化的体验。…详细

2025-07-16 09:03:45
SailGP英国赛事部署私有和公共5G SA网络切片技术

全球帆船锦标赛SailGP与BT集团和爱立信合作,在英国朴茨茅斯赛事中部署5G独立组网切片技术。该技术为时速100公里的F50双体帆船提供实时数据传输,支持裁判通过5G直播摄像头执法,并为12支参赛队伍提供战术分析。爱立…详细

5G技术网络切片体育赛事应用

2025-07-16 08:54:30
Anthropic推出专为金融服务设计的Claude专业版

Anthropic推出首个行业定制版AI产品Claude for Financial Services,专为金融行业打造。该服务基于Claude企业版,提供更高使用限制、内置数据连接器以及提示词库。新版本预装了连接FactSet、PitchBook等金融数据提供…详细

人工智能定制化解决方案金融科技

2025-07-16 08:47:54
AI编程工具正向终端转移:生成式AI的新趋势

多年来,Cursor、Windsurf和GitHub Copilot等代码编辑工具一直是AI编程的标准。但随着代理AI能力增强,AI系统正从处理代码转向直接与系统终端交互。Anthropic、DeepMind和OpenAI都推出了命令行编程工具。终端工具采用…详细

人工智能自然语言处理终端交互优化

2025-07-16 08:47:13
研究领导者呼吁科技行业监控AI的"思维"过程

来自OpenAI、谷歌DeepMind、Anthropic等公司的AI研究人员发表联合立场文件,呼吁深入研究监控AI推理模型"思维链"的技术。思维链是AI模型解决问题的外化过程,类似人类使用草稿纸解题。研究人员认为思维链监控可能是控…详细

人工智能思维链监控可解释性研究

2025-07-16 08:44:16
特斯拉终于进入印度市场 九年磨一剑首家展厅开业

特斯拉在孟买开设首家体验中心,正式进入印度市场,距离马斯克2016年首次预告已过去九年。该体验中心位于孟买中央商务区,展示从上海进口的Model Y车型。后驱版售价约68000美元,长续航版约79000美元。印度客户今日起…详细

电动汽车市场扩张全球销量下滑

2025-07-16 08:43:03
Broadcom推出Tomahawk Ultra:以太网能否取代UALink?

博通推出Tomahawk Ultra交换芯片,主张以太网技术可替代新兴的UALink协议。该51.2 Tbps交换ASIC专门针对高性能网络调优,延迟低至250纳秒,支持1024个加速器的扩展系统。博通认为以太网在监控、遥测和调试工具方面具…详细

人工智能网络互连高速交换

2025-07-16 08:38:15
自主性、服务区域、通用性 - 真正机器人出租车的核心要素

随着多家公司进入机器人出租车领域,如何判断其技术成熟度成为关键问题。真正的机器人出租车需要满足五个基本要求:无需人工监督的安全自主驾驶、在公共道路运营、商业可行的服务区域、向公众开放服务,以及提供点对…详细

人工智能自动驾驶安全监督

2025-07-16 08:37:22
C-Gen.AI推出GPU编排平台,旨在提升AI数据中心效率

人工智能基础设施初创公司C-Gen.AI推出新平台,帮助数据中心运营商自动化部署并最大化利用昂贵的AI硬件资源。该GPU编排平台能够在几分钟内自动部署AI集群,实时监控并确保最高效率运行。通过动态重新分配闲置GPU资源…详细

人工智能GPU编排自动化部署

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章