Vox-Profile是南加州大学和约翰霍普金斯大学联合开发的语音特征全面分析基准测试系统,能从语音中识别说话者的静态特征(如年龄、性别、口音)和动态特征(如情绪、语流)。研究团队使用15个以上的公开语音数据集和多…详细
CoIn是马里兰大学研究团队开发的创新框架,旨在解决大型语言模型商业API不透明计费问题。这些API隐藏推理过程只显示最终答案,却仍对所有"看不见"的令牌收费。CoIn通过令牌数量验证和语义有效性验证两大组件,使用户…详细
Teddy Warner 创办 Intempus,致力于为现有机器人赋予类似人类情感的生理状态,通过运动表现情绪,优化人机交互和 AI 模型训练。…详细
本文讨论了基于 MoE(混合专家)架构与压缩技术优化大语言模型性能和成本的方案,包括内存带宽、量化及剪枝等关键技术,展示了不同硬件平台对模型运行的影响。…详细
近年来,视频内容创作与消费显著增长,而协调视听元素对于打造优质内容至关重要。罗切斯特大学的Chao Huang及合作者开发了视觉引导的声音高亮(visually-guided acoustic highlighting)技术,解决了视觉与声音不协调…详细
这篇研究首次系统探索了验证粒度对大型语言模型测试时扩展的影响。研究团队通过提出可变粒度搜索(VG-Search)算法,挑战了传统的固定验证频率范式。实验表明,根据任务难度和计算预算动态调整验证粒度,可以在减少超…详细
这项研究开发了LITMUSVALUES框架,通过道德困境测试揭示AI模型的价值观优先排序,并证明这些排序能预测风险行为。研究发现所有旗舰模型都高度重视隐私,但在关怀等其他价值观上存在分歧;同时发现诚实、尊重和自由能…详细
意大利理工学院与英国阿伯丁大学联合研究团队发布了一项突破性研究,提出通过合成数据训练视觉语言模型实现机器人的视觉视角采纳能力。研究团队创建了一个包含RGB图像、语言描述和精确空间变换矩阵的合成数据集,使机…详细
这篇研究揭示了检索增强生成(RAG)系统中的"干扰效应"问题:当检索到的段落虽与查询相关但不包含正确答案时,会误导语言模型生成错误回答。研究团队提出了量化段落干扰效应的方法,并发现这种效应在不同模型间具有高相…详细
2025年5月26日,BOE(京东方)成功举办主题为“屏启未来 智显无界”的量产交付活动,开启第6代新型半导体显示器件生产线由建设转向运营的崭新篇章。…详细
2025年台北电脑展于5月20日如期举办,本届展会以“AI Next”为核心主题,吸引来自世界各地用户的目光。…详细
在数字化浪潮席卷全球的今天,企业数字化转型已成为推动商业创新与增长的核心动力。而开发者生态作为数字化转型的重要支撑,成为企业战略布局的关键环节。金蝶云·苍穹开发者生态运营负责人钟伟纯表示,作为企业级云…详细
在人工智能技术狂飙突进的时代,超大规模 AI 训练成为推动行业变革的核心引擎。然而,传统计算架构在面对千亿级乃至万亿级参数模型训练时,逐渐显露出性能瓶颈、能耗高企以及生态适配性不足等问题。近日,浪潮计算机…详细
heck Point 软件技术有限公司,纳斯达克股票代码:CHKP),成功在上海举办了Check Point Engage 2025中国用户与合作伙伴大会。…详细
本文探讨了AI从单个模型向多专长代理协作转变,通过健壮架构应对通信、状态同步与容错挑战,以构建弹性企业AI系统。…详细
这项研究介绍了神经符号扩散模型(NESYDMs),一种创新融合神经网络感知与符号推理的框架,克服了传统神经符号系统中概念独立性假设的局限。通过离散扩散技术建模概念间依赖关系,该模型在高维视觉路径规划和自动驾驶等…详细
腾讯和浙江大学研究团队提出了"认知专家增强"(RICE)方法,无需额外训练即可提升MoE推理模型性能。通过归一化点态互信息识别关键认知专家后,仅增强两个专家的权重就能显著提高模型在数学和科学推理任务上的准确率,…详细
这篇研究介绍了一种新型"逆效能驱动多模态融合"(IEMF)技术,灵感来自大脑处理多感官信息的方式。当单一感觉信号较弱时,大脑会增强多感官整合效果;信号强时则降低融合依赖。中国科学院研究团队将这一机制应用于AI…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。