近日,噢易云与曙光云正式签署战略合作协议,双方将围绕核心技术攻关、产品生态共建及行业解决方案创新展开深度协同。噢易云副总裁张惠、噢易云总裁助理兼战略合作部总监赵利飞、曙光云副总裁孙会首、曙光云总裁助理兼…详细
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依…详细
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"…详细
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能…详细
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖…详细
这篇研究论文提出了一种称为"正交残差更新"的新方法,解决了深度神经网络中标准残差连接的局限性。研究人员发现,在传统残差连接中,模块输出与输入流直接相加可能导致冗余特征学习。他们的创新方法将模块输出分解为…详细
韩国科学技术院(KAIST)的研究团队发现了大型语言模型中一个令人担忧的现象:"推理刚性"。这种现象表现为即使是最先进的AI模型,如GPT-4o或Qwen3,也会在解决问题时固执地坚持熟悉的推理模式,甚至会"修改"用户明确…详细
比尔肯特大学研究团队提出RoPECraft,一种无需训练的视频动作迁移方法,通过巧妙操作扩散变换器中的旋转位置编码实现。该方法首先从参考视频提取光流信息,用于扭曲RoPE张量;再通过流匹配优化和相位约束正则化,确保…详细
这项来自加拿大滑铁卢大学的研究挑战了"更多训练数据总是更好"的观念,发现某些数据集反而会损害信息检索模型性能。研究者提出了RLHN方法,使用级联LLM技术识别并重标注训练数据中的"假负样本"。实验表明,这种方法显…详细
这项研究介绍了WebAgent-R1,一种用于训练网页智能体的端到端多回合强化学习框架。不同于传统方法,它直接通过在线交互学习,仅依靠二元任务成功奖励信号指导。实验表明,该方法显著提升了Qwen-2.5-3B和Llama-3.1-8B…详细
Think-RM是一项创新研究,通过使奖励模型具备"长程思考"能力来提升AI系统对人类偏好的理解。传统的奖励模型要么仅提供分数(BT RM),要么依赖浅层思考(GenRM),而Think-RM则模拟人类深度分析问题的过程,支持自我…详细
SAP全球CEO柯睿安(Christian Klein)在马德里蓝宝石大会拿出了 “飞轮效应”理论,讲述起企业如何通过AI、数据和应用协同驱动,释放持续增长动能。…详细
台湾国立大学研究团队开发了SAKURA,首个专门评估大型音频语言模型多跳推理能力的基准测试。研究发现,即使最先进的模型也面临两大挑战:一是在识别某些音频属性(如情绪)时准确率不高;二是即使能正确识别音频信息…详细
这项由宾夕法尼亚州立大学研究团队开发的FOVER方法解决了AI推理验证器训练中的两大难题:数据标注成本高和应用范围有限。研究者利用形式验证工具(如Z3和Isabelle)自动检查AI在形式逻辑和定理证明任务中的每一步推理…详细
这篇研究介绍了Meta团队开发的Multi-SpatialMLLM,一种能够理解多帧图像空间关系的多模态大语言模型。研究者创建了首个大规模多帧空间理解数据集MultiSPA,包含超过2700万个样本,并在此基础上训练模型掌握深度感知、…详细
RAVENEA是哥本哈根大学研究团队开发的首个多模态检索增强视觉文化理解基准,集成了超过10,000份人工标注的维基百科文档,用于评估视觉语言模型的文化敏感性。研究发现,轻量级视觉模型在配备文化感知检索功能后,在文…详细
斯科尔科沃科技学院研究团队开发了一种新型损失函数——基于伊塔库拉-赛托散度的损失函数,用于解决风险敏感强化学习中的数值不稳定性问题。与传统方法相比,该损失函数不仅数值稳定,还保持尺度不变性,同时保留指数…详细
本文介绍了 AI 工厂如何通过整合芯片制造、超级计算及数据中心部署,推动全球企业转型升级。文中详细阐述了 NVIDIA 与国际伙伴在技术创新、产业变革和可持续发展方面的探索与挑战。…详细
VAST Data 推出了一款集成 AI 操作系统,通过整合存储、实时数据处理、向量数据库和原生代理编排等功能,旨在简化复杂的 AI 基础设施部署。该方案有望降低部署难度及延时,但其与 Nvidia 深度绑定以及封闭式整合可能…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。