科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-03 11:43:52
转弯级助攻:明尼苏达大学团队用回合级信誉分配增强大语言模型智能体的多回合推理能力

明尼苏达大学研究团队提出了一种创新方法,通过回合级信誉分配显著提升大语言模型(LLM)智能体的多回合推理能力。传统方法只对整个过程进行评价,而他们的MT-GRPO算法能够精确评估每个决策步骤的价值,就像为每一步提…详细

人工智能强化学习大语言模型智能体

2025-06-03 11:41:04
精准的记忆手术:研究人员开发PISCES技术,在不影响其他能力的情况下从大语言模型中精确"抹除"概念

这篇研究介绍了PISCES——一种能精确从大语言模型参数中移除特定概念知识的创新技术。与现有方法不同,PISCES通过解缠器模型识别概念相关特征,直接编辑模型参数,实现了更精准的知识移除。在Gemma和Llama模型上的测…详细

大语言模型参数编辑概念擦除

2025-06-03 11:40:46
大语言模型能从真实世界文本中推断因果关系吗?——一项来自伍斯特理工学院与亚马逊通用人工智能团队的探索

这项研究探究大语言模型从真实文本中推断因果关系的能力,创建了首个真实世界基准数据集ReCAST。研究发现,即使最先进模型在此任务上表现也不佳,最高F1分数仅为0.477。模型尤其难以处理隐含因果关系、区分关键因素与…详细

人工智能因果推理大语言模型

2025-06-03 10:17:15
物理世界如何实现AGI?前空中客车CTO红杉访谈:我们的愿景是让AI设计人类无法设计的系统,从星际飞船到戴森球

P1.AI创始人保罗·埃雷门科正用合成数据训练AI设计物理系统,从住宅冷却到星际飞船,突破工程AGI的终极瓶颈——数据稀缺。他的AI工程师Archie已能像人类一样处理多物理场任务,目标是让机器设计人类无法想象的复杂系…详细

2025-06-03 10:09:14
法国政府正式出价4.1亿欧元收购Atos精简后的高性能计算资产

Atos 正在重组,法国政府已确认以4.1亿欧元收购其 Eviden 子公司先进计算业务(不含 Vision AI 部分),该业务涵盖 HPC、量子计算及 AI 部门,预计2025年营收约8亿欧元,此举将为 Atos 提供急需流动资金。…详细

先进计算高性能计算战略重组

2025-06-03 10:05:04
理解 GPU 服务器及其在数据中心中的角色

文章讨论了 GPU 服务器如何利用并行处理支持 AI 运算,比较了其与传统 CPU 服务器在扩展性、功耗与散热等方面的区别,并指出数据中心须相应升级供电与冷却设施。…详细

人工智能GPU服务器数据中心优化

2025-06-03 10:01:23
AI 聊天机器人如何让你不断聊天

本文探讨了AI聊天机器人通过迎合用户情绪持续吸引用户,但这种过度迎合可能导致信息失真与心理风险。…详细

人工智能自然语言处理优化模型

2025-06-03 10:00:26
IBM 收购数据分析初创公司 Seek AI,在纽约市开设 AI 加速器

IBM 周一宣布收购 AI 数据分析平台 Seek AI,并在纽约启动 Watsonx AI Labs 加速器,以利用自然语言处理技术支持企业数据查询,扩展 AI 解决方案和人才培养。…详细

人工智能数据分析企业级AI

2025-06-03 09:59:56
微软 Bing 推出免费 Sora 驱动的 AI 视频生成器

Bing 视频生成器利用 OpenAI 的 Sora 模型,通过文字提示生成视频。登录微软账户的用户可免费生成10个视频,之后需消耗微软奖励积分。目前仅支持竖屏9:16比例,未来将增加横屏选项。…详细

人工智能生成式 AI免费开放

2025-06-03 09:49:32
视角正确吗?用多维精细感知任务解析多模态大语言模型的方向理解能力

波士顿大学研究团队开发的DORI基准测试从四个维度评估多模态大语言模型的物体方向理解能力:正面对齐、旋转变换、相对方向和规范方向感知。研究评估了15个最先进模型,发现即使最佳模型在粗粒度任务上的准确率也仅为…详细

人工智能多模态大语言模型空间推理

2025-06-03 09:48:51
企业搜索系统的突破性进展:Oracle AI团队推出领域特定检索的硬负样本挖掘框架

这篇研究介绍了Oracle AI团队开发的一种针对企业系统的域特定检索硬负样本挖掘框架。该方法通过整合多种嵌入模型、降维处理和独特的语义选择标准,动态识别具有挑战性但上下文无关的文档作为训练样本,显著提升了重排…详细

企业搜索硬负样本挖掘检索增强生成

2025-06-03 09:48:03
以更少参数实现更好效果:Oracle团队的FS-DAG模型让文档智能处理变得更简单高效

Oracle研究团队开发了FS-DAG,这是一种用于视觉丰富文档理解的少样本领域适应图网络模型。与传统大型模型不同,FS-DAG仅需5份示例文档即可适应新文档类型,参数量不到90M,却在信息提取任务中表现卓越。模型采用模块…详细

文档理解图神经网络少样本学习

2025-06-03 09:46:56
Prot2Token:通过下一个标记预测统一蛋白质建模的全新框架

Prot2Token是密苏里大学研究团队开发的一种突破性蛋白质建模框架,它通过将各种蛋白质预测任务转化为统一的下一个标记预测问题,解决了传统方法需要为不同任务开发专门模型的限制。这个框架以自回归解码器为核心,配…详细

人工智能蛋白质语言模型生物信息学

2025-06-03 09:46:35
大模型视觉编码器嫁接技术突破:马里兰大学和Meta团队实现零样本视觉能力传递

这项研究提出了一种通过"替身模型"训练视觉编码器并实现零样本嫁接到大型语言模型的创新方法。研究团队分析发现大语言模型内部存在明显的处理阶段转折点,据此构建的替身模型保留早期处理层而压缩后期层。使用替身训…详细

人工智能视觉语言模型零样本嫁接

2025-06-03 09:46:13
FastTD3:简单、快速且强大的人形机器人强化学习算法——加州大学伯克利分校的革命性研究

这项研究介绍了FastTD3,一种简单却高效的强化学习算法,能显著加速人形机器人的训练过程。由加州大学伯克利分校团队开发,FastTD3通过四个关键优化——并行模拟、大批量更新、分布式评论家网络和精心调整的超参数,…详细

强化学习人形机器人控制快速训练算法

2025-06-03 09:45:52
HLIP:密歇根大学团队打造3D医学影像高效语言-图像预训练新模型

密歇根大学研究团队开发的HLIP框架为3D医学影像处理提供了突破性解决方案。通过模拟放射科医生的层次化阅读策略,HLIP能高效处理未经筛选的CT和MRI数据,无需昂贵的人工标注。在两个大规模数据集(包含220K患者的脑部…详细

医学影像层次化注意力深度学习

2025-06-03 09:45:05
创新融合的力量:希伯来大学研究团队打造CHIMERA知识库,揭示科学创新背后的思想重组机制

希伯来大学研究团队创建了CHIMERA,这是一个从科学文献中自动提取思想重组实例的大规模知识库。研究区分了两种重组类型:概念融合和灵感迁移,并从28,000多个案例中揭示了跨学科创新的模式。研究发现认知科学和生物学…详细

人工智能知识库科学创新

2025-06-03 07:45:19
HoPE:视觉语言模型中的混合位置编码技术让AI更懂长视频

这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信…详细

视觉语言模型位置编码长视频理解

2025-06-03 07:44:51
漫画也懂故事:东京大学开发 MangaLMM,让 AI 像人类一样阅读日本漫画

东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别…详细

日本漫画多模态理解视觉问答

2025-06-03 07:44:15
影响力蒸馏:谷歌与ISTA研究院联合推出大模型高效数据筛选新方法

这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少…详细

大语言模型训练数据高效选择影响力蒸馏

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章