科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-05-29 17:21:17
B-score:利用响应历史检测大语言模型中的偏见

这项研究提出了"B-score",一种新指标用于检测大语言模型中的偏见。研究人员发现,当模型能看到自己之前对同一问题的回答时(多轮对话),它能够减少偏见并给出更平衡的答案。B-score计算单轮与多轮对话中答案概率的…详细

人工智能大语言模型偏见检测

2025-05-29 17:20:12
强化微调赋能多模态大语言模型的推理能力:从清华来的新研究揭示AI进化新阶段

这篇论文探讨了强化微调(RFT)如何增强多模态大语言模型(MLLMs)的推理能力。研究指出,作为一种后训练算法,RFT已在各种模态(视觉、音频、GUI等)、任务和领域中取得显著成功。论文详细分析了现有工作,总结了RF…详细

人工智能强化学习多模态推理

2025-05-29 17:19:25
解构大模型的推理轨迹:上海人工智能实验室揭示大语言模型推理背后的优化机制

上海人工智能实验室研究团队提出了"RaML"框架,首次从元学习视角解释大语言模型的推理机制。研究将推理轨迹解析为模型参数的"伪梯度下降"更新,揭示了不同训练方法的内在联系,并证明了更长推理轨迹和多样化训练能显…详细

人工智能元学习大语言模型推理

2025-05-29 17:17:40
突破极限:科学家通过层级搜索让大模型实现精细化科学假设发现

近期,由南洋理工大学和上海人工智能实验室等机构组成的研究团队在arXiv上发布了一项重要研究成果。这项名为"MOOSE-Chem2"的研究提出了精细化科学假设发现的全新任务,并通过层级搜索方法探索了大语言模型在该任务中…详细

人工智能科学假设生成层级搜索

2025-05-29 17:16:55
Omni-R1:浙大团队打造全模态推理新范式,让AI同时掌握视频、音频和精细像素理解能力

浙江大学研究团队提出的Omni-R1是一种创新型全模态AI框架,它采用"双系统"协作架构解决了长时间视频理解与精细像素处理之间的根本矛盾。全局推理系统处理低分辨率完整视频并选择关键帧,细节理解系统则对高分辨率关键…详细

人工智能多模态理解强化学习

2025-05-29 17:15:25
众智有为 致敬同路人 | 风沙砺金,胡杨为骨:中天乾坤的18年数智征途

本期“众智有为 致敬同路人”系列采访,走进了一家有着胡杨精神的公司——中天乾坤,公司发展至今已有18年,研发人员占比超6成,业务覆盖全国20余城,一直投身于数智化征途中。…详细

数智化中天乾坤华为同路人创业AI

2025-05-29 16:59:42
众智有为 致敬同路人 | 风沙砺金,胡杨为骨:中天乾坤的18年数智征途

本期“众智有为 致敬同路人”系列采访,走进了一家有着胡杨精神的公司——中天乾坤,公司发展至今已有18年,研发人员占比超6成,业务覆盖全国20余城,一直投身于数智化征途中。…详细

华为中天乾坤数智化同路人创业

2025-05-29 16:17:03
用"难题负样本"教大型视觉语言模型如何读懂几何图形——清华大学开发全新对比学习方法提升几何推理能力

清华大学研究团队提出了一种名为"硬负样本对比学习"的创新方法,显著提升了大型多模态模型在几何理解与推理方面的能力。通过构建图像和文本两类负样本,以及开发MMCLIP训练策略,他们的MMGeoLM模型在四个几何基准测试…详细

人工智能几何理解对比学习

2025-05-29 16:16:35
离散马尔可夫桥:一种全新框架,让离散数据模型学习能力飞跃

《离散马尔可夫桥》研究提出了一种新型离散数据表示学习框架,克服了传统离散扩散模型使用固定转移矩阵的局限。该框架包含矩阵学习和分数学习两个核心组件,能够自适应学习转移率矩阵并有效重建原始数据分布。理论分…详细

离散数据建模变分推断生成模型

2025-05-29 15:56:32
效率大提升!华盛顿大学和新加坡国立大学联合研究突破视觉自回归模型内存瓶颈

这项由华盛顿大学和新加坡国立大学研究团队提出的ScaleKV技术,针对视觉自回归模型中的内存瓶颈问题提供了创新解决方案。研究发现不同变压器层具有不同的缓存需求,将它们分为需要大量历史信息的"起草者"和专注于当前…详细

视觉自回归模型KV缓存压缩内存优化

2025-05-29 15:56:10
直觉力:无需外部奖励的大语言模型自主推理学习

这项研究提出了一种名为INTUITOR的创新方法,让大语言模型无需外部奖励即可自主学习推理能力。研究者利用模型自身的"自我确定性"作为唯一奖励信号,替代传统需要人工标注或答案验证的方法。实验表明,该方法在数学推…详细

人工智能强化学习大语言模型

2025-05-29 15:55:56
从数十小时到数万小时:突破语音识别的数据瓶颈,新加坡科技设计大学和字节跳动联合研发突破性方案

新加坡科技设计大学和字节跳动研究团队提出了"语音反向翻译"方法,解决语音识别中的数据稀缺问题。研究表明,仅用几十小时的标注语音数据就能训练TTS模型生成数万小时高质量合成语音,将数据扩充数百倍。他们引入归一…详细

语音识别零样本文本转语音数据增强

2025-05-29 15:53:39
WINA:微软推出权重感知神经元激活技术,让大语言模型推理速度提升60%以上

WINA是一种由微软等机构研究人员开发的训练无关稀疏激活框架,它通过同时考虑隐藏状态大小和权重矩阵的列式l2范数来加速大型语言模型推理。与仅基于隐藏状态选择神经元的现有方法不同,WINA能更精确识别影响模型输出…详细

人工智能大语言模型推理稀疏激活技术

2025-05-29 15:53:24
机械可解释性研究应优先关注SAE中的特征一致性:卡内基梅隆大学的发现

这篇研究论文提出机械可解释性研究应优先考虑稀疏自编码器(SAE)的特征一致性问题。研究人员观察到SAE在不同训练运行中常学习到不一致的特征集,这削弱了研究可靠性。他们提出使用成对字典平均相关系数(PW-MCC)来量化…详细

机械可解释性稀疏自编码器特征一致性

2025-05-29 15:27:31
中国自研AI实现历史性突破 云从科技超越谷歌OpenAI登顶多模态榜首

近日,云从科技自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中,以80.7分的综合成绩登顶榜首。…详细

2025-05-29 15:26:57
不仅618更是宏碁专属开门“宏”,叠加国补购机正当时

一年一度的618大促如约将至,宏碁携旗下全明星产品阵容,率先引爆“开门宏”——即日20点起,宏碁京东官方旗舰店多款明星产品限时放利,涵盖轻薄本、游戏本、商用办公与家庭桌面产品(台式机、一体机、mini PC、闺蜜机)等…详细

2025-05-29 14:50:38
数学和代码推理力的关键数据特征是什么?上海交通大学团队用影响函数揭示跨领域学习的奥秘

上海交通大学研究团队利用影响函数揭示了数据特征如何刺激大型语言模型的数学和代码推理能力。研究发现高难度数学问题能同时提升数学和代码推理,而低难度编程任务对代码推理最有效。基于此,他们提出了"任务难度翻转…详细

人工智能影响函数推理能力

2025-05-29 14:50:15
重新思考大型语言模型推理的采样标准:基于能力-难度对齐的视角

本研究提出了"能力-难度对齐采样"方法(CDAS),革新了大型语言模型强化学习训练中的数据采样策略。与传统方法不同,CDAS通过聚合历史表现差异实现更稳定的问题难度估计,并将模型能力与问题难度动态匹配。在多个数学…详细

大型语言模型强化学习采样能力难度对齐

2025-05-29 14:49:59
多模态通才:InfantAgent-Next如何让AI更智能地操作你的电脑

InfantAgent-Next是一款突破性的多模态通用型AI助手,能通过文本、图像、音频和视频与计算机进行交互。不同于现有方法,它采用高度模块化架构,将基于工具和纯视觉的代理技术融为一体,让不同模型能逐步协作解决分散…详细

人工智能多模态代理计算机自动化交互

2025-05-29 14:49:02
覆盖原则:理解组合泛化能力的统一框架——KAIST研究团队揭示大语言模型的推理局限

KAIST等机构研究团队提出的"覆盖原则"框架揭示了大语言模型在组合泛化能力上的基本局限。研究表明,依赖模式匹配的模型只能泛化到那些可以通过替换功能等价片段到达的输入。实验证实,两步推理任务的训练数据需求与词…详细

人工智能组合泛化大语言模型

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章