清华大学研究团队提出RLVR-World框架,通过可验证奖励的强化学习直接优化世界模型的预测质量,而非传统的最大似然估计。这一方法在文本游戏状态预测和网页导航中显著提升了准确率,在机器人视频预测中改善了视觉质量…详细
这项研究揭示了强化微调(RFT)在提升大语言模型推理能力的同时,会产生一种意外副作用——"幻觉税":模型拒绝回答不可回答问题的能力显著下降,导致提供虚构答案的倾向增强。南加州大学的研究者通过创建"合成不可回…详细
这篇研究介绍了"视觉指令瓶颈调优"(Vittle)方法,该方法通过应用信息瓶颈原理,增强多模态大语言模型应对分布偏移的能力。研究不依赖增加数据量或模型规模,而是教会模型像人类一样进行"概念压缩",在保留关键信息…详细
这篇研究论文介绍了"GeoRanker",这是一种突破性的全球图像地理定位方法,由香港城市大学和威斯康星大学麦迪逊分校研究人员联合开发。不同于传统方法,GeoRanker采用了距离感知排序框架,利用大型视觉语言模型对查询…详细
Anthropic CEO Amodei 在旧金山 Code with Claude 活动的新闻发布会上表示,目前 AI 模型的幻觉发生频率或低于人类,并认为这不阻碍通向 AGI 的进程。…详细
AWE 2025将于2025年6月10日至12日在长滩举行,预计吸引5000余人、250家展商参与。会议聚焦XR与AI的深度融合,展示沉浸式技术如何走向大众市场。…详细
这项研究揭示了大语言模型中存在"空域"——在推理过程中几乎不活跃的神经网络层。研究者开发了L2自适应计算方法,无需额外训练即可准确识别这些空域。惊人的是,在Qwen2.5-7B模型上,跳过70%的层后性能反而从69.24%提…详细
Vox-Profile是南加州大学和约翰霍普金斯大学联合开发的语音特征全面分析基准测试系统,能从语音中识别说话者的静态特征(如年龄、性别、口音)和动态特征(如情绪、语流)。研究团队使用15个以上的公开语音数据集和多…详细
CoIn是马里兰大学研究团队开发的创新框架,旨在解决大型语言模型商业API不透明计费问题。这些API隐藏推理过程只显示最终答案,却仍对所有"看不见"的令牌收费。CoIn通过令牌数量验证和语义有效性验证两大组件,使用户…详细
Teddy Warner 创办 Intempus,致力于为现有机器人赋予类似人类情感的生理状态,通过运动表现情绪,优化人机交互和 AI 模型训练。…详细
本文讨论了基于 MoE(混合专家)架构与压缩技术优化大语言模型性能和成本的方案,包括内存带宽、量化及剪枝等关键技术,展示了不同硬件平台对模型运行的影响。…详细
近年来,视频内容创作与消费显著增长,而协调视听元素对于打造优质内容至关重要。罗切斯特大学的Chao Huang及合作者开发了视觉引导的声音高亮(visually-guided acoustic highlighting)技术,解决了视觉与声音不协调…详细
这篇研究首次系统探索了验证粒度对大型语言模型测试时扩展的影响。研究团队通过提出可变粒度搜索(VG-Search)算法,挑战了传统的固定验证频率范式。实验表明,根据任务难度和计算预算动态调整验证粒度,可以在减少超…详细
这项研究开发了LITMUSVALUES框架,通过道德困境测试揭示AI模型的价值观优先排序,并证明这些排序能预测风险行为。研究发现所有旗舰模型都高度重视隐私,但在关怀等其他价值观上存在分歧;同时发现诚实、尊重和自由能…详细
意大利理工学院与英国阿伯丁大学联合研究团队发布了一项突破性研究,提出通过合成数据训练视觉语言模型实现机器人的视觉视角采纳能力。研究团队创建了一个包含RGB图像、语言描述和精确空间变换矩阵的合成数据集,使机…详细
这篇研究揭示了检索增强生成(RAG)系统中的"干扰效应"问题:当检索到的段落虽与查询相关但不包含正确答案时,会误导语言模型生成错误回答。研究团队提出了量化段落干扰效应的方法,并发现这种效应在不同模型间具有高相…详细
2025年5月26日,BOE(京东方)成功举办主题为“屏启未来 智显无界”的量产交付活动,开启第6代新型半导体显示器件生产线由建设转向运营的崭新篇章。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。