科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-16 09:58:37
微软推出史上最高效AI模型:2GB内存跑2千亿参数大模型成为现实

微软研究院开发出革命性的1位大语言模型BitNet b1.58 2B4T,仅需0.4GB内存就能运行2千亿参数规模的AI模型,相比传统模型内存消耗降低90%以上,能耗降低95%,推理速度提升40%,在保持相当性能的同时让AI技术真正实现普…详细

人工智能模型量化资源优化

2025-07-16 09:58:01
AI侦探诞生记:Allen Institute打造首个能追溯大模型"记忆"的神奇工具

Allen Institute for AI推出首个能实时追溯大语言模型输出到万亿训练数据来源的系统OLMOTRACE。该系统通过创新的并行算法,可在几秒内找到AI回答中与训练数据完全匹配的文本片段,为AI行为分析开创了新范式。支持事实…详细

AI行为分析文本匹配算法实时追溯系统

2025-07-16 09:53:40
Gartner预测到2027年末,超过40%的代理型AI项目将被取消

Gartner预测到2027年末,超过40%的代理型AI项目将因成本不断攀升、商业价值不明确或风险控制不足而被取消。…详细

GartnerAI

2025-07-16 09:49:07
安徽首台!神州鲲泰鲲鹏技术路线商用电脑在合肥下线

2025年7月15日,安徽省信创产业迎来里程碑时刻——神州鲲泰首台鲲鹏技术路线商用电脑正式下线。…详细

2025-07-16 09:17:45
让AI真正"看懂"并编辑图片:上海交大团队开创视觉推理新基准

上海交大团队首次建立AI视觉推理评估标准RISEBench,测试发现即使最先进的GPT-4o-Image在推理驱动的图像编辑任务中准确率仅28.8%。研究涵盖时间、因果、空间、逻辑四大推理维度,揭示当前AI缺乏真正理解物理规律和逻…详细

人工智能视觉推理基准测试

2025-07-16 09:17:23
NVIDIA发布Eagle 2.5:小模型也能看懂电影级长视频的突破性技术

NVIDIA研究团队发布了Eagle 2.5,这是一个突破性的视觉语言模型,专门用于长视频理解任务。该模型仅使用80亿参数就在Video-MME等基准测试中达到72.4%的准确率,与GPT-4o等顶级商业模型相当。Eagle 2.5采用了信息优先…详细

视觉语言模型长视频理解轻量级AI模型

2025-07-16 09:17:07
阿里巴巴团队深度解剖2000+多语言评测基准:为什么花费千万美元的AI评测体系仍然"看不懂"人类的真实需求?

阿里巴巴等机构联合研究团队通过分析2021-2024年间148个国家发布的2000多个多语言AI评测基准,发现尽管全球已投入超过1100万美元,但现有评测体系与人类真实判断仍存在巨大鸿沟,特别是在语言理解任务上关联度仅11-3…详细

多语言评测人工智能大语言模型

2025-07-16 09:16:46
AI也会"看图说话"了!上海交大团队让机器视觉推理能力提升12%

这项由上海交通大学与OPPO人工智能中心合作的研究首次深入探索了多模态大语言模型的视频空间推理能力提升方法。研究发现传统提示词对小型模型无效,转而采用GRPO强化学习训练法,构建了包含10万样本的VSI-100k数据集…详细

人工智能强化学习视觉空间推理

2025-07-16 09:16:27
KAIST团队打造全能AI检索助手:一个系统搞定文字、图片、视频所有问题

KAIST研究团队开发出革命性AI检索系统UniversalRAG,首次实现跨文字、图片、视频的智能信息路由。该系统能根据问题特点自动选择最合适的信息类型和详细程度,在8个基准测试中显著优于传统方法,平均性能提升15-20%,…详细

人工智能检索增强生成多模态路由

2025-07-16 09:16:11
从零起步也能做推理大模型?StepFun和清华大学揭秘超高效训练的神奇配方

StepFun和清华大学联合提出Open-Reasoner-Zero,这是首个开源的大规模推理导向强化学习训练框架。该方法采用极简的vanilla PPO算法直接在基础模型上训练,无需复杂预处理,仅用十分之一训练时间就在多个数学推理基准…详细

人工智能强化学习数学推理

2025-07-16 09:13:20
NVIDIA团队突破性成果:让AI精准描述图片和视频中的任何细节

这项NVIDIA团队的突破性研究解决了AI视觉理解中的精确局部描述难题。通过创新的聚焦提示技术和本地化视觉架构,DAM模型能够准确描述图片和视频中任何指定区域的详细内容,性能显著超越现有方法,为医疗诊断、教育辅助…详细

计算机视觉局部描述多模态学习

2025-07-16 09:13:03
从保护到攻击:卡内基梅隆大学团队让AI模型学会"藏私"的巧妙方法

卡内基梅隆大学研究团队开发出"反蒸馏采样"技术,能让AI模型在保持正常性能的同时,阻止竞争对手通过观察推理过程来复制模型能力。这种方法巧妙地在模型输出中加入"毒性"内容,对人类用户无害但会干扰机器学习过程,…详细

人工智能模型蒸馏知识产权保护

2025-07-16 09:12:42
大学新突破:让AI专家系统"更聪明"的秘密配方——约翰斯·霍普金斯大学团队发现如何让机器在考试时临场发挥

约翰斯·霍普金斯大学团队发现AI专家混合系统存在10-20%的性能损失,开发出C3PO方法通过测试时动态优化专家选择策略,让1-3亿参数的小模型超越7-9亿参数大模型,在六个基准测试上提升7-15%准确率,为资源受限环境下部…详细

专家混合系统测试时优化动态路径选择

2025-07-16 09:12:24
新加坡国立大学最新突破:让AI当法官,推理能力决定评判准确性

新加坡国立大学研究团队开发了JudgeLRM,一个专门用于评判AI系统表现的模型。研究发现传统训练方法在需要复杂推理的评判任务上效果较差,因此采用强化学习训练JudgeLRM,使其具备真正的推理能力。JudgeLRM-3B甚至超越…详细

人工智能强化学习模型评估

2025-07-16 09:11:54
人工智能在数学奥赛中的巅峰突破:ByteDance团队让AI学会了使用代码工具

ByteDance研究团队提出ReTool框架,通过强化学习让大型语言模型学会在数学推理中战略性使用代码工具。该方法在AIME数学竞赛中达到67%准确率,比传统文本推理方法提升27个百分点,训练效率提高近3倍,展现了工具增强推…详细

工具增强推理强化学习数学推理优化

2025-07-16 09:07:59
智野双全一车搞定 豪华智能越野“第一车”即将发布

随着汽车行业智能化的蓬勃发展,消费者对越野车的需求也在不断升级,期待在保留硬核实力的同时,融入更多智能化的体验。…详细

2025-07-16 09:03:45
SailGP英国赛事部署私有和公共5G SA网络切片技术

全球帆船锦标赛SailGP与BT集团和爱立信合作,在英国朴茨茅斯赛事中部署5G独立组网切片技术。该技术为时速100公里的F50双体帆船提供实时数据传输,支持裁判通过5G直播摄像头执法,并为12支参赛队伍提供战术分析。爱立…详细

5G技术网络切片体育赛事应用

2025-07-16 08:54:30
Anthropic推出专为金融服务设计的Claude专业版

Anthropic推出首个行业定制版AI产品Claude for Financial Services,专为金融行业打造。该服务基于Claude企业版,提供更高使用限制、内置数据连接器以及提示词库。新版本预装了连接FactSet、PitchBook等金融数据提供…详细

人工智能定制化解决方案金融科技

2025-07-16 08:47:54
AI编程工具正向终端转移:生成式AI的新趋势

多年来,Cursor、Windsurf和GitHub Copilot等代码编辑工具一直是AI编程的标准。但随着代理AI能力增强,AI系统正从处理代码转向直接与系统终端交互。Anthropic、DeepMind和OpenAI都推出了命令行编程工具。终端工具采用…详细

人工智能自然语言处理终端交互优化

2025-07-16 08:47:13
研究领导者呼吁科技行业监控AI的"思维"过程

来自OpenAI、谷歌DeepMind、Anthropic等公司的AI研究人员发表联合立场文件,呼吁深入研究监控AI推理模型"思维链"的技术。思维链是AI模型解决问题的外化过程,类似人类使用草稿纸解题。研究人员认为思维链监控可能是控…详细

人工智能思维链监控可解释性研究

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章