科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-05 11:05:15
拼图解密:KU Leuven团队探索视觉拼图的强化学习之旅

这项来自KU Leuven、中科大和上海Memory Tensor公司的研究探索了如何利用拼图游戏训练多模态大型语言模型的视觉推理能力。研究发现,现有模型在未经训练时表现近似随机猜测,但通过强化学习能达到近乎完美的准确率并…详细

人工智能多模态大型语言模型视觉推理

2025-06-05 11:04:58
LoHoVLA:一个统一长时序实体任务的视觉-语言-动作模型——复旦大学和上海交通大学联合突破

这项研究提出了LoHoVLA,一种用于长时序实体任务的统一视觉-语言-动作模型,融合了高层任务规划和低层动作控制功能。与传统方法不同,它利用单一预训练视觉语言模型同时生成语言子任务和机器人动作,并采用分层闭环控…详细

机器人学习视觉语言模型长时序任务

2025-06-05 11:04:31
学习率调度神器:北京大学研究团队推出统一预算迭代训练调度框架,适用于任何训练任务

这项研究提出了统一预算感知(UBA)学习率调度器,解决了深度学习训练中的关键问题:如何在有限迭代次数下获得最佳模型性能。北京大学的研究团队通过构建理论框架,推导出一种只需单一超参数φ的学习率调度方法,实现…详细

深度学习学习率调度预算迭代训练

2025-06-05 11:04:02
MagiCodec:突破性音频编码器如何同时提升重建质量与生成能力

MagiCodec是一种由上海交通大学与字节跳动联合开发的创新音频编解码器,通过高斯噪声注入和多阶段训练策略,成功解决了音频编码领域的关键挑战:如何同时实现高保真重建和优秀的下游生成能力。研究团队通过理论分析证…详细

人工智能神经音频编码语音生成技术

2025-06-05 11:03:37
"背水一战":马里兰大学研究团队开发防范LLM测试集污染的"染料包"技术

马里兰大学研究团队开发了DyePack,一种检测大型语言模型测试集污染的创新框架。该方法灵感来源于银行染料包,通过在测试数据中植入带随机目标的后门样本,当模型训练时使用了这些数据,会显示出特定行为模式而被标记…详细

人工智能后门攻击基准测试污染

2025-06-05 10:57:30
谷歌再次在融合能源领域押注 TAE Technologies

TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。…详细

融合能源机器学习反应堆设计创新

2025-06-05 10:56:29
2025-06-05 10:29:15
看懂视频异常:VAU-R1如何通过强化学习提升异常理解

澳大利亚国立大学和广湾大学研究团队开发的VAU-R1系统通过强化学习显著提升了视频异常理解能力。该研究不仅创建了第一个专门用于训练和评估视频异常理解的思维链基准数据集VAU-Bench,还提出了一种数据高效的强化微调…详细

视频异常理解强化学习多模态大语言模型

2025-06-05 10:28:12
从视频中学习3D世界:香港中文大学研究团队用3D视觉几何先验增强多模态大语言模型

这项研究由香港中文大学团队提出了视频-3D几何大语言模型(VG LLM),一种无需依赖显式3D数据输入,仅通过普通视频就能理解3D世界的创新方法。通过集成3D视觉几何编码器,该模型能从视频序列中提取3D先验信息,显著提升…详细

3D视觉理解多模态大语言模型空间推理

2025-06-05 10:27:54
DINO-R1:博世与德州农工大学联手打造具备推理能力的视觉基础模型

DINO-R1是博世与德州农工大学研究团队开发的创新视觉基础模型,首次将强化学习应用于增强视觉模型的推理能力。该模型通过群组相对查询优化(GRQO)技术,解决了视觉提示检测中高方差问题,实现对多样化视觉示例的有效理…详细

视觉基础模型强化学习目标检测

2025-06-05 10:27:08
MoDoMoDo:多领域数据混合训练与多模态大语言模型强化学习的完美结合

MoDoMoDo研究提出了一种创新的多领域数据混合框架,用于多模态大语言模型的强化学习。研究团队从布朗大学、Salesforce等机构组成,通过整合五个不同领域的视觉-语言数据集并设计可验证奖励函数,成功开发了预测最优数…详细

人工智能多模态学习数据混合优化

2025-06-05 10:26:25
AI 科研自动化的新里程碑:EXP-Bench 评估 AI 能否自主开展 AI 研究实验

EXP-Bench是一项开创性研究,旨在评估AI是否能够自主进行AI研究实验。来自密歇根大学等机构的研究团队创建了这个基准测试,从51篇顶级论文中提取461个研究任务,挑战AI代理完成从实验设计到结果分析的全过程。评估结…详细

人工智能AI代理科研自动化

2025-06-05 10:26:08
SiLVR:北卡罗来纳大学教堂山分校团队打造的简单高效视频推理框架

这篇博客介绍了北卡罗来纳大学教堂山分校研究团队开发的SiLVR框架,这是一个简单而高效的视频推理系统。该框架将视频理解分为两个阶段:先将视频转换为语言描述,再用推理型大语言模型解决复杂问题。实验表明,这种无…详细

视频理解大语言模型推理多模态AI

2025-06-05 10:25:45
全方位保护:华盛顿大学与微软联合开发的OMNIGUARD,一种跨模态AI安全防护的高效方法

这项由华盛顿大学和微软联合开发的OMNIGUARD研究,提出了一种高效的AI安全检测方法,能够跨越语言和模态(文本、图像、音频)识别有害内容。该方法通过发现大型语言模型内部的通用表示,构建轻量级分类器,比现有方法…详细

人工智能安全跨模态防护大型语言模型

2025-06-05 10:20:28
ReasonGen-R1:微软使用监督微调与强化学习让图像生成模型先思考后创作

这篇研究论文介绍了ReasonGen-R1,一个由微软与上海科技大学合作开发的创新框架,首次将链式思考(CoT)与强化学习(RL)应用到自回归图像生成模型中。研究通过两阶段方法实现:先用监督微调(SFT)教会模型生成推理文本,…详细

人工智能自回归图像生成链式思考

2025-06-05 10:13:35
Nvidia 表示其 Blackwell 芯片在训练 AI 大语言模型基准测试中领跑

Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。…详细

人工智能深度学习新型芯片架构

2025-06-05 10:11:10
HP ZBook Ultra 与 AMD Ryzen AI Max:移动工作站的转折点

HP新款ZBook Ultra G1a搭载AMD最新Ryzen AI Max+ PRO 395处理器,实现轻薄机身与高性能AI加速和创作需求的完美结合,为专业用户提供全新移动办公体验。…详细

人工智能集成显卡AI加速

2025-06-05 10:09:37
数据中心的绿色存储

随着 AI 应用不断增多,数据中心的电力需求急剧上升,企业正借助绿色存储方案降低能耗和成本,实现环保与经济效益的双重提升。…详细

人工智能绿色存储高投资回报率

2025-06-05 10:07:16
Klarna CEO 表示公司将使用人工提供 VIP 客户服务

在伦敦SXSW大会上,Klarna首席执行官西米亚特科夫斯基表示,公司在利用AI自动处理繁琐任务以降低成本、提升效率的同时,仍将为VIP客户保留专属人工服务。他透露,公司正通过技术与业务整合、数据集中管理及防范金融科…详细

人工智能人机协作数据整合

2025-06-05 10:06:45
Hugging Face 表示其新型机器人模型高效到可在 MacBook 上运行

Hugging Face 推出轻量机器人模型 SmolVLA,基于共享数据训练,支持异步推理,能在低成本硬件上运行,加速通用机器人研发。…详细

机器人开源模型轻量高效

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章