科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-05-28 22:08:36
噢易云与曙光云签署战略合作协议,携手拓展行业智能化市场版图

近日,噢易云与曙光云正式签署战略合作协议,双方将围绕核心技术攻关、产品生态共建及行业解决方案创新展开深度协同。噢易云副总裁张惠、噢易云总裁助理兼战略合作部总监赵利飞、曙光云副总裁孙会首、曙光云总裁助理兼…详细

2025-05-28 21:57:57
地瓜机器人完成1亿美元A轮融资,加速构建具身智能生态版图

地瓜机器人率先构建从芯片、算法到软件的全栈产品体系,形成 5~500TOPS完整产品布局。…详细

地平线机器人

2025-05-28 20:32:01
语音无需语音:Menlo Research团队为低资源语言开发的创新语音指令训练方法

这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依…详细

语音技术低资源语言语义表示

2025-05-28 20:31:32
变革性进化:Transformer Copilot——用学习错误日志提升大语言模型的微调质量

《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"…详细

大语言模型微调错误日志学习自反思AI

2025-05-28 20:30:20
RIPT-VLA:用简单奖励让机器人更聪明!德克萨斯大学Austin分校开创视觉-语言-动作模型的互动式后训练新范式

德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能…详细

机器人学习强化学习视觉语言动作模型

2025-05-28 20:29:28
时间洞察:北京大学和华为诺亚方舟实验室联合打造真实场景下大语言模型时间推理的多层级基准

北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖…详细

大语言模型时间推理基准测试

2025-05-28 20:28:17
正交残差更新:为深度网络提供稳定高效的更新机制

这篇研究论文提出了一种称为"正交残差更新"的新方法,解决了深度神经网络中标准残差连接的局限性。研究人员发现,在传统残差连接中,模块输出与输入流直接相加可能导致冗余特征学习。他们的创新方法将模块输出分解为…详细

深度学习残差连接神经网络稳定性

2025-05-28 19:54:42
顽固的智能:KAIST研究团队揭示大型推理模型如何任性"修改"用户指令

韩国科学技术院(KAIST)的研究团队发现了大型语言模型中一个令人担忧的现象:"推理刚性"。这种现象表现为即使是最先进的AI模型,如GPT-4o或Qwen3,也会在解决问题时固执地坚持熟悉的推理模式,甚至会"修改"用户明确…详细

人工智能推理模型认知偏见

2025-05-28 19:54:23
旋转位置编码之舞:比尔肯特大学研究团队开创无需训练的视频动作迁移新技术

比尔肯特大学研究团队提出RoPECraft,一种无需训练的视频动作迁移方法,通过巧妙操作扩散变换器中的旋转位置编码实现。该方法首先从参考视频提取光流信息,用于扭曲RoPE张量;再通过流匹配优化和相位约束正则化,确保…详细

人工智能视频生成动作迁移

2025-05-28 19:54:03
修复"伤害"模型表现的数据:级联LLM技术重标注负面样本,提升信息检索的稳健性

这项来自加拿大滑铁卢大学的研究挑战了"更多训练数据总是更好"的观念,发现某些数据集反而会损害信息检索模型性能。研究者提出了RLHN方法,使用级联LLM技术识别并重标注训练数据中的"假负样本"。实验表明,这种方法显…详细

信息检索大语言模型数据质量优化

2025-05-28 19:53:48
WebAgent-R1:通过端到端多回合强化学习训练网页智能体

这项研究介绍了WebAgent-R1,一种用于训练网页智能体的端到端多回合强化学习框架。不同于传统方法,它直接通过在线交互学习,仅依靠二元任务成功奖励信号指导。实验表明,该方法显著提升了Qwen-2.5-3B和Llama-3.1-8B…详细

强化学习网页智能体大型语言模型

2025-05-28 19:53:33
Think-RM:用长程思考推理提升生成式奖励模型的全新思路——来自乔治亚理工和亚马逊的联合研究

Think-RM是一项创新研究,通过使奖励模型具备"长程思考"能力来提升AI系统对人类偏好的理解。传统的奖励模型要么仅提供分数(BT RM),要么依赖浅层思考(GenRM),而Think-RM则模拟人类深度分析问题的过程,支持自我…详细

人工智能强化学习大型语言模型

2025-05-28 18:51:22
在欧洲之门马德里,我们再次见证了SAP激活企业增长的“飞轮”

SAP全球CEO柯睿安(Christian Klein)在马德里蓝宝石大会拿出了 “飞轮效应”理论,讲述起企业如何通过AI、数据和应用协同驱动,释放持续增长动能。…详细

SAP

2025-05-28 18:37:30
SAKURA:探索大型音频语言模型如何"听懂"并"思考"——首个评估音频多跳推理能力的基准测试

台湾国立大学研究团队开发了SAKURA,首个专门评估大型音频语言模型多跳推理能力的基准测试。研究发现,即使最先进的模型也面临两大挑战:一是在识别某些音频属性(如情绪)时准确率不高;二是即使能正确识别音频信息…详细

人工智能音频处理多跳推理

2025-05-28 18:37:07
用形式验证工具训练推理验证器:宾夕法尼亚州立大学研究团队让AI自动检查每一步推理是否正确

这项由宾夕法尼亚州立大学研究团队开发的FOVER方法解决了AI推理验证器训练中的两大难题:数据标注成本高和应用范围有限。研究者利用形式验证工具(如Z3和Isabelle)自动检查AI在形式逻辑和定理证明任务中的每一步推理…详细

人工智能形式验证推理验证器

2025-05-28 18:36:30
多空间理解新突破:Meta研究团队打造多帧空间理解的多模态大语言模型

这篇研究介绍了Meta团队开发的Multi-SpatialMLLM,一种能够理解多帧图像空间关系的多模态大语言模型。研究者创建了首个大规模多帧空间理解数据集MultiSPA,包含超过2700万个样本,并在此基础上训练模型掌握深度感知、…详细

人工智能多模态大语言模型空间理解

2025-05-28 18:35:42
RAVENEA: 哥本哈根大学团队开创多模态检索增强视觉文化理解新基准

RAVENEA是哥本哈根大学研究团队开发的首个多模态检索增强视觉文化理解基准,集成了超过10,000份人工标注的维基百科文档,用于评估视觉语言模型的文化敏感性。研究发现,轻量级视觉模型在配备文化感知检索功能后,在文…详细

视觉文化理解多模态检索检索增强生成

2025-05-28 18:35:19
安全交易也能抗风险:斯科尔科沃研究团队的伊塔库拉-赛托损失函数突破性研究

斯科尔科沃科技学院研究团队开发了一种新型损失函数——基于伊塔库拉-赛托散度的损失函数,用于解决风险敏感强化学习中的数值不稳定性问题。与传统方法相比,该损失函数不仅数值稳定,还保持尺度不变性,同时保留指数…详细

强化学习风险规避算法金融建模

2025-05-28 18:30:16
Nvidia 与瑞典财团合作:AI 工厂重新定义经济

本文介绍了 AI 工厂如何通过整合芯片制造、超级计算及数据中心部署,推动全球企业转型升级。文中详细阐述了 NVIDIA 与国际伙伴在技术创新、产业变革和可持续发展方面的探索与挑战。…详细

人工智能超级计算全栈平台

2025-05-28 18:29:08
VAST Data 挑战企业 AI 工厂

VAST Data 推出了一款集成 AI 操作系统,通过整合存储、实时数据处理、向量数据库和原生代理编排等功能,旨在简化复杂的 AI 基础设施部署。该方案有望降低部署难度及延时,但其与 Nvidia 深度绑定以及封闭式整合可能…详细

人工智能大语言模型统一操作系统

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章