一款支持100多种语言的语音输入软件从Windows、Mac延伸到iOS,提供键盘语音双模式,体验流畅并能自动学习专有名词,订阅模式也颇具竞争优势。…详细
许多企业因遗留系统和陈旧数据架构积累技术债,致使自动化和AI转型步履维艰。Pegasystems调查显示,庞大的老旧应用和分散数据正阻碍新技术落地,其推出的数据集成平台和Pega Agentic Process Fabric为此提供了解决方…详细
PwC 分析近十亿招聘广告发现,掌握 AI 技能的员工平均薪资提升 11%,并推动行业生产力与收入大幅增长,促使岗位技能迅速转变并创造新机遇。…详细
SailPoint将agentic AI技术融入其身份安全平台,推出新工具以管理和保护企业中不断增长的AI代理,实现身份治理和访问控制合规。…详细
这项研究提出了KronSAE,一种新型稀疏自编码器架构,通过克罗内克积分解显著降低了训练成本。研究者引入了模拟二进制AND操作的mAND激活函数,在减少参数量的同时提高了重建质量和特征可解释性。实验证明,KronSAE在各…详细
这项由加州大学伯克利分校研究团队开发的REOrder框架,通过重新排列图像块的处理顺序,显著提升了视觉模型性能。研究发现,传统的行主序排列并非最优选择,而通过信息论先验和强化学习寻找最佳排序,可在不修改模型架…详细
这篇研究介绍了香港科技大学团队开发的难度感知提示法(DAP),一种能够根据问题难度智能调整推理链长度的创新方法。通过这一方法,研究者构建了LiteCoT数据集,包含10万个简洁推理样本,平均仅720个标记,比传统方法减…详细
格罗宁根大学和哈佛大学的研究团队发现,当前大型推理模型在被要求用非英语语言"思考"时,面临严重的语言匹配与准确性权衡。他们通过评估六个先进模型,揭示即使最强大的32B参数模型也经常默认使用英语推理,而非用户…详细
这篇研究综述探讨了大语言模型(LLMs)与知识图谱(KGs)在问答系统中的结合方式。研究者提出新的分类法,根据问答类型和KG角色将方法分为:KG作为背景知识、推理指南或验证器。文章系统性分析了各种复杂问答类型(多文档…详细
AIRI研究院团队开发的cadrille是一款突破性多模态CAD重建模型,能同时处理点云、多视角图像和文本描述输入,并生成精确的Python代码来构建CAD模型。该研究首次将在线强化学习应用于CAD重建任务,采用两阶段训练策略:…详细
这项研究提出了一种可微分求解器搜索方法,通过优化时间步长和求解器系数,显著加速扩散模型的采样过程。在仅使用10步采样的情况下,该方法使修正流模型和DDPM模型在ImageNet数据集上的FID得分分别达到2.40和2.33,大…详细
《Afterburner: Reinforcement Learning Facilitates Self-Improving Code Efficiency Optimization》这篇论文提出了一种创新的代码效率优化框架,通过强化学习技术让大语言模型能够自我改进生成代码的计算效率。研究…详细
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型…详细
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最…详细
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使…详细
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图…详细
5月23日至24日,鲲鹏昇腾开发者大会2025(KADC 2025)在北京中关村国际创新中心成功举办。…详细
在这个人机协作时代,人类的智慧和机器的能力将以前所未有的方式结合在一起,共同创造一个更加美好的世界。…详细
新型栅极驱动器集成电路集成了自举二极管和电阻器,有助于简化无刷电机、电动工具和DC-DC转换器的高速设计。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。