这项研究提出了一种创新的"生命长久安全对齐"框架,使大语言模型能够持续适应不断进化的越狱攻击策略。框架核心是元攻击者与防御者之间的对抗演化循环:元攻击者不断发现新的攻击策略,防御者则学习抵御这些攻击。实…详细
Enigmata是一项突破性研究,通过合成可验证的拼图训练大语言模型的逻辑推理能力。该研究创建了包含36种任务、7大类推理能力的完整训练系统,每项任务都配备了可控难度生成器和自动验证器。基于此训练的Qwen2.5-32B-E…详细
这项来自新加坡国立大学等机构的研究引入了REASONMAP,一个用于评估多模态大语言模型细粒度视觉理解能力的基准测试。研究团队使用来自13个国家30个城市的高分辨率交通地图,构建了1,008个问答对,设计了两级评估框架…详细
Nvidia公布2026财年一季度业绩,营收441亿美元,同比增长69%;新AI超算与显卡产品陆续亮相,尽管出口管控对H20业务造成影响,但整体AI市场前景依然乐观。…详细
Cerebras WSE 芯片拥有 40 亿晶体管,推理速度达到 NVIDIA 集群的约 2.5 倍,刷新了全球 AI 推理速度记录,为复杂 AI 代理应用提供高性能计算支持。…详细
这项研究提出了"B-score",一种新指标用于检测大语言模型中的偏见。研究人员发现,当模型能看到自己之前对同一问题的回答时(多轮对话),它能够减少偏见并给出更平衡的答案。B-score计算单轮与多轮对话中答案概率的…详细
这篇论文探讨了强化微调(RFT)如何增强多模态大语言模型(MLLMs)的推理能力。研究指出,作为一种后训练算法,RFT已在各种模态(视觉、音频、GUI等)、任务和领域中取得显著成功。论文详细分析了现有工作,总结了RF…详细
上海人工智能实验室研究团队提出了"RaML"框架,首次从元学习视角解释大语言模型的推理机制。研究将推理轨迹解析为模型参数的"伪梯度下降"更新,揭示了不同训练方法的内在联系,并证明了更长推理轨迹和多样化训练能显…详细
近期,由南洋理工大学和上海人工智能实验室等机构组成的研究团队在arXiv上发布了一项重要研究成果。这项名为"MOOSE-Chem2"的研究提出了精细化科学假设发现的全新任务,并通过层级搜索方法探索了大语言模型在该任务中…详细
浙江大学研究团队提出的Omni-R1是一种创新型全模态AI框架,它采用"双系统"协作架构解决了长时间视频理解与精细像素处理之间的根本矛盾。全局推理系统处理低分辨率完整视频并选择关键帧,细节理解系统则对高分辨率关键…详细
本期“众智有为 致敬同路人”系列采访,走进了一家有着胡杨精神的公司——中天乾坤,公司发展至今已有18年,研发人员占比超6成,业务覆盖全国20余城,一直投身于数智化征途中。…详细
本期“众智有为 致敬同路人”系列采访,走进了一家有着胡杨精神的公司——中天乾坤,公司发展至今已有18年,研发人员占比超6成,业务覆盖全国20余城,一直投身于数智化征途中。…详细
清华大学研究团队提出了一种名为"硬负样本对比学习"的创新方法,显著提升了大型多模态模型在几何理解与推理方面的能力。通过构建图像和文本两类负样本,以及开发MMCLIP训练策略,他们的MMGeoLM模型在四个几何基准测试…详细
《离散马尔可夫桥》研究提出了一种新型离散数据表示学习框架,克服了传统离散扩散模型使用固定转移矩阵的局限。该框架包含矩阵学习和分数学习两个核心组件,能够自适应学习转移率矩阵并有效重建原始数据分布。理论分…详细
这项由华盛顿大学和新加坡国立大学研究团队提出的ScaleKV技术,针对视觉自回归模型中的内存瓶颈问题提供了创新解决方案。研究发现不同变压器层具有不同的缓存需求,将它们分为需要大量历史信息的"起草者"和专注于当前…详细
这项研究提出了一种名为INTUITOR的创新方法,让大语言模型无需外部奖励即可自主学习推理能力。研究者利用模型自身的"自我确定性"作为唯一奖励信号,替代传统需要人工标注或答案验证的方法。实验表明,该方法在数学推…详细
新加坡科技设计大学和字节跳动研究团队提出了"语音反向翻译"方法,解决语音识别中的数据稀缺问题。研究表明,仅用几十小时的标注语音数据就能训练TTS模型生成数万小时高质量合成语音,将数据扩充数百倍。他们引入归一…详细
WINA是一种由微软等机构研究人员开发的训练无关稀疏激活框架,它通过同时考虑隐藏状态大小和权重矩阵的列式l2范数来加速大型语言模型推理。与仅基于隐藏状态选择神经元的现有方法不同,WINA能更精确识别影响模型输出…详细
这篇研究论文提出机械可解释性研究应优先考虑稀疏自编码器(SAE)的特征一致性问题。研究人员观察到SAE在不同训练运行中常学习到不一致的特征集,这削弱了研究可靠性。他们提出使用成对字典平均相关系数(PW-MCC)来量化…详细
近日,云从科技自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中,以80.7分的综合成绩登顶榜首。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。