科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-05-27 11:12:02
夸克健康大模型通过副主任医师考试,12门学科超合格线

大模型在严肃医疗场景中迈出了从“知识记忆”向“临床推理”跃迁的关键一步。…详细

夸克大模型

2025-05-27 11:07:05
RLVR-World:用强化学习训练世界模型,突破视觉和语言边界的突破性研究

清华大学研究团队提出RLVR-World框架,通过可验证奖励的强化学习直接优化世界模型的预测质量,而非传统的最大似然估计。这一方法在文本游戏状态预测和网页导航中显著提升了准确率,在机器人视频预测中改善了视觉质量…详细

世界模型强化学习预测优化

2025-05-27 11:05:56
强化微调的幻觉税:如何通过合成不可回答数据解决大语言模型的过度自信问题

这项研究揭示了强化微调(RFT)在提升大语言模型推理能力的同时,会产生一种意外副作用——"幻觉税":模型拒绝回答不可回答问题的能力显著下降,导致提供虚构答案的倾向增强。南加州大学的研究者通过创建"合成不可回…详细

强化学习大语言模型幻觉缓解技术

2025-05-27 10:46:02
KADC 2025 东方通与鲲鹏深化合作 共筑RAG解决方案与出海新生态

5月23—24日,鲲鹏昇腾开发者大会2025在北京中关村国际创新中心盛大召开。…详细

2025-05-27 10:26:51
视觉指令瓶颈调优:通过信息压缩提升多模态大语言模型的鲁棒性

这篇研究介绍了"视觉指令瓶颈调优"(Vittle)方法,该方法通过应用信息瓶颈原理,增强多模态大语言模型应对分布偏移的能力。研究不依赖增加数据量或模型规模,而是教会模型像人类一样进行"概念压缩",在保留关键信息…详细

多模态大语言模型信息瓶颈原理鲁棒性优化

2025-05-27 10:26:01
GeoRanker:基于距离感知排序的全球图像地理定位新方法——威斯康星大学与香港城市大学联合研究突破

这篇研究论文介绍了"GeoRanker",这是一种突破性的全球图像地理定位方法,由香港城市大学和威斯康星大学麦迪逊分校研究人员联合开发。不同于传统方法,GeoRanker采用了距离感知排序框架,利用大型视觉语言模型对查询…详细

全球图像地理定位大型视觉语言模型距离感知排序

2025-05-27 10:17:36
Anthropic 首席执行官声称 AI 模型幻觉比人类少

Anthropic CEO Amodei 在旧金山 Code with Claude 活动的新闻发布会上表示,目前 AI 模型的幻觉发生频率或低于人类,并认为这不阻碍通向 AGI 的进程。…详细

人工智能大语言模型新型算法

2025-05-27 10:14:33
开场序幕:AWE 2025 让 XR 跨入主流

AWE 2025将于2025年6月10日至12日在长滩举行,预计吸引5000余人、250家展商参与。会议聚焦XR与AI的深度融合,展示沉浸式技术如何走向大众市场。…详细

增强现实生成式 AI空间计算整合

2025-05-27 10:14:04
深潜大语言模型的"真空地带":不是所有层都在全力工作,偷懒的层竟然越过越好?

这项研究揭示了大语言模型中存在"空域"——在推理过程中几乎不活跃的神经网络层。研究者开发了L2自适应计算方法,无需额外训练即可准确识别这些空域。惊人的是,在Qwen2.5-7B模型上,跳过70%的层后性能反而从69.24%提…详细

大语言模型计算优化模型解释性

2025-05-27 10:12:27
Vox-Profile:USC和约翰霍普金斯大学联合打造的全面语音特征分析基准测试

Vox-Profile是南加州大学和约翰霍普金斯大学联合开发的语音特征全面分析基准测试系统,能从语音中识别说话者的静态特征(如年龄、性别、口音)和动态特征(如情绪、语流)。研究团队使用15个以上的公开语音数据集和多…详细

语音基础模型说话者特征分析多维语音识别

2025-05-27 10:11:23
揭秘"隐形推理令牌":马里兰大学研究团队开发CoIn系统,为大模型API计费提供透明保障

CoIn是马里兰大学研究团队开发的创新框架,旨在解决大型语言模型商业API不透明计费问题。这些API隐藏推理过程只显示最终答案,却仍对所有"看不见"的令牌收费。CoIn通过令牌数量验证和语义有效性验证两大组件,使用户…详细

人工智能可信赖AI服务计费审计

2025-05-27 10:06:14
为何 Intempus 认为机器人应具备人类生理状态

Teddy Warner 创办 Intempus,致力于为现有机器人赋予类似人类情感的生理状态,通过运动表现情绪,优化人机交互和 AI 模型训练。…详细

机器人人机交互情感计算

2025-05-27 10:03:59
事实证明,全程充分利用 AI 大脑并非运行模型的最高效方式

本文讨论了基于 MoE(混合专家)架构与压缩技术优化大语言模型性能和成本的方案,包括内存带宽、量化及剪枝等关键技术,展示了不同硬件平台对模型运行的影响。…详细

人工智能混合专家量化与剪枝 AI

2025-05-27 10:02:23
获得大科技公司支持的核裂变初创企业

受AI推动用电需求激增,大科技公司纷纷投资核裂变初创企业,通过小型模块化反应堆及创新设计保障数据中心全天候稳定供电。…详细

核能小模块反应堆新型反应堆设计

2025-05-27 09:40:44
看电影学音频高亮:让你的视频声音更符合画面重点

近年来,视频内容创作与消费显著增长,而协调视听元素对于打造优质内容至关重要。罗切斯特大学的Chao Huang及合作者开发了视觉引导的声音高亮(visually-guided acoustic highlighting)技术,解决了视觉与声音不协调…详细

视听体验音频处理电影音效

2025-05-27 09:39:54
重新思考验证粒度:打造高效大型语言模型测试时扩展的新方案

这篇研究首次系统探索了验证粒度对大型语言模型测试时扩展的影响。研究团队通过提出可变粒度搜索(VG-Search)算法,挑战了传统的固定验证频率范式。实验表明,根据任务难度和计算预算动态调整验证粒度,可以在减少超…详细

大型语言模型测试时扩展验证粒度优化

2025-05-27 09:38:59
AI会撒谎救助病童吗?探索人工智能价值观排序的LITMUSVALUES框架

这项研究开发了LITMUSVALUES框架,通过道德困境测试揭示AI模型的价值观优先排序,并证明这些排序能预测风险行为。研究发现所有旗舰模型都高度重视隐私,但在关怀等其他价值观上存在分歧;同时发现诚实、尊重和自由能…详细

人工智能价值观研究AI安全

2025-05-27 09:37:56
让机器人理解他人视角:意大利理工学院和阿伯丁大学联合开发的空间感知训练新方法

意大利理工学院与英国阿伯丁大学联合研究团队发布了一项突破性研究,提出通过合成数据训练视觉语言模型实现机器人的视觉视角采纳能力。研究团队创建了一个包含RGB图像、语言描述和精确空间变换矩阵的合成数据集,使机…详细

人机交互视觉视角采纳具身人工智能

2025-05-27 09:36:17
"干扰效应":理解RAG系统中的不相关段落如何影响AI决策

这篇研究揭示了检索增强生成(RAG)系统中的"干扰效应"问题:当检索到的段落虽与查询相关但不包含正确答案时,会误导语言模型生成错误回答。研究团队提出了量化段落干扰效应的方法,并发现这种效应在不同模型间具有高相…详细

人工智能检索增强生成干扰段落优化

2025-05-27 09:20:02
BOE(京东方)第6代新型半导体显示器件生产线全面量产 打造全球显示产业新引擎

2025年5月26日,BOE(京东方)成功举办主题为“屏启未来 智显无界”的量产交付活动,开启第6代新型半导体显示器件生产线由建设转向运营的崭新篇章。…详细

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章