伊利诺伊大学厄巴纳-香槟分校研究发现,强化学习在微调大型语言模型时,实际上只更新了模型中5%-30%的参数,而非整个模型。这种"参数更新稀疏性"在各种RL算法和模型中普遍存在,且仅微调这个子网络就能达到与完全微调…详细
武汉大学研究团队提出了FRANK模型,一种无需训练的方法,能让视觉语言大模型获得推理和反思能力。研究发现多模态模型中,浅层解码器负责视觉理解,深层负责文本推理,据此设计了一种层次化权重合并策略,将视觉模型与…详细
ByteDance和中国科学院的研究团队提出了Diffusion ConvNet (DiCo),一种完全基于卷积神经网络的扩散模型架构,实现了图像生成任务中质量与效率的双重突破。研究发现DiT模型中的全局自注意力机制存在冗余,通过引入紧…详细
本次推出的新品,除了Air系列、V3系列这两大热销产品外,更有全彩AI+AR眼镜雷鸟X3 Pro,产品突破芯片、交互、空间计算、重量与光学显示五大核心技术难题,并开创性地引入可视化Live AI和安卓虚拟机,带来全新的眼镜应…详细
WiseTech以21亿美元收购E2open,借其云平台支持6000多家企业、跟踪180亿笔交易,旨在增强物流软件竞争力,预计2025年底完成交易并提升盈利水平。…详细
本文探讨如何借助人工智能和数据科学实现医疗研发、生产及护理的极速升级,通过提高数据采集、处理与解读能力,为患者带来精准诊疗和创新药物,同时解决技术普及难题。…详细
湖北大学将深化F5G-A与教育教学融合,推进人工智能、大数据等技术的创新应用,探索通感一体等应用场景,全面赋能学生学习、教师教学、学校治理、教育创新和交流合作。…详细
5月24日,开源鸿蒙开发者大会2025(OHDC.2025)在深圳盛大召开。本次大会由开源鸿蒙项目群工作委员会主办,华为、润开鸿、中软国际、开鸿智谷、九联开鸿、鸿湖万联、深开鸿、诚迈科技、中国南方电网、中国科学院软件…详细
SAP今日宣布与阿里巴巴集团达成战略合作,共同加速云转型。根据合作协议,阿里巴巴集团将采用 SAP ERP私有云版本,来构建其企业基础架构。同时,双方还将开展联合市场拓展战略,旨在助力全球客户加速实现价值转化。…详细
微软为记事本、画图和截屏工具引入了 AI 增强功能,可实现文本生成、贴纸创作和自动优化截屏。记事本和画图的新功能仅面向 Microsoft 365、Copilot Pro 用户及 Copilot Plus PC,而截屏工具功能对所有人均开放。…详细
本文介绍了微软最新开源协议 NLWeb,它利用现有结构化数据,将网站转变为支持自然语言交互的 AI 应用,为企业构建 agentic AI 提供新路径,同时对比了当前其他 AI 协议的特性与优劣。…详细
文章详细分析了企业在推广代理型人工智能时面临的基础设施高投入、技术整合、专才匮乏以及后续管理等挑战,并探讨了如何构建完善生态系统以实现实际业务价值。…详细
文章探讨了人工智能如何瓦解知识工作者的传统职业与身份,促使他们重新定义自我、发掘机器难以替代的人文优势。…详细
英伟达为应对出口限制,正在研发基于 Blackwell 架构但规格较低、成本较低的新型 AI 芯片,计划6月开始量产,抢占中国市场。…详细
这项研究揭示了熵最小化作为单独目标可显著提升大型语言模型在数学、物理和编程任务上的推理能力,无需任何标记数据。伊利诺伊大学厄巴纳-香槟分校的研究团队提出三种方法:无监督微调(EM-FT)、基于熵奖励的强化学习…详细
大联大成功跻身英国品牌评估机构Brand Finance 5月9日发布的“2025中国品牌价值500强”榜单并位列第218位。…详细
2025年5月19日,新加坡国立大学研究团队发表最新研究Thinkless,就像是给"内耗"的AI朋友配了一个心理咨询师,教会它什么时候该深度思考,什么时候可以快速回答。…详细
这篇文章介绍了马里兰大学研究团队开发的BLEUBERI方法,该方法惊人地发现被认为过于简单的BLEU评分系统在指导大语言模型遵循指令方面非常有效。研究表明,当使用高质量参考答案时,BLEU与人类偏好的一致率可达74.2%,…详细
VerifyBench是首个专门评估大语言模型基于参考的奖励系统的基准测试,填补了现有奖励评估基准的关键空白。由浙江大学、美团等机构联合开发,包含VerifyBench和更具挑战性的VerifyBench-Hard两个数据集。研究发现虽然…详细
BANDITSPEC是一项创新研究,将多臂赌博机算法应用于大型语言模型的推测解码过程,实现了无需训练的自适应超参数选择。研究团队通过理论分析和实验证明,该方法能在各种基准测试中显著提升模型推理速度,比现有方法快…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。