科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-05-29 15:56:10
直觉力:无需外部奖励的大语言模型自主推理学习

这项研究提出了一种名为INTUITOR的创新方法,让大语言模型无需外部奖励即可自主学习推理能力。研究者利用模型自身的"自我确定性"作为唯一奖励信号,替代传统需要人工标注或答案验证的方法。实验表明,该方法在数学推…详细

人工智能强化学习大语言模型

2025-05-29 15:55:56
从数十小时到数万小时:突破语音识别的数据瓶颈,新加坡科技设计大学和字节跳动联合研发突破性方案

新加坡科技设计大学和字节跳动研究团队提出了"语音反向翻译"方法,解决语音识别中的数据稀缺问题。研究表明,仅用几十小时的标注语音数据就能训练TTS模型生成数万小时高质量合成语音,将数据扩充数百倍。他们引入归一…详细

语音识别零样本文本转语音数据增强

2025-05-29 15:53:39
WINA:微软推出权重感知神经元激活技术,让大语言模型推理速度提升60%以上

WINA是一种由微软等机构研究人员开发的训练无关稀疏激活框架,它通过同时考虑隐藏状态大小和权重矩阵的列式l2范数来加速大型语言模型推理。与仅基于隐藏状态选择神经元的现有方法不同,WINA能更精确识别影响模型输出…详细

人工智能大语言模型推理稀疏激活技术

2025-05-29 15:53:24
机械可解释性研究应优先关注SAE中的特征一致性:卡内基梅隆大学的发现

这篇研究论文提出机械可解释性研究应优先考虑稀疏自编码器(SAE)的特征一致性问题。研究人员观察到SAE在不同训练运行中常学习到不一致的特征集,这削弱了研究可靠性。他们提出使用成对字典平均相关系数(PW-MCC)来量化…详细

机械可解释性稀疏自编码器特征一致性

2025-05-29 15:27:31
中国自研AI实现历史性突破 云从科技超越谷歌OpenAI登顶多模态榜首

近日,云从科技自主研发的从容大模型在国际权威评测平台OpenCompass最新全球多模态榜单中,以80.7分的综合成绩登顶榜首。…详细

2025-05-29 15:26:57
不仅618更是宏碁专属开门“宏”,叠加国补购机正当时

一年一度的618大促如约将至,宏碁携旗下全明星产品阵容,率先引爆“开门宏”——即日20点起,宏碁京东官方旗舰店多款明星产品限时放利,涵盖轻薄本、游戏本、商用办公与家庭桌面产品(台式机、一体机、mini PC、闺蜜机)等…详细

2025-05-29 14:50:38
数学和代码推理力的关键数据特征是什么?上海交通大学团队用影响函数揭示跨领域学习的奥秘

上海交通大学研究团队利用影响函数揭示了数据特征如何刺激大型语言模型的数学和代码推理能力。研究发现高难度数学问题能同时提升数学和代码推理,而低难度编程任务对代码推理最有效。基于此,他们提出了"任务难度翻转…详细

人工智能影响函数推理能力

2025-05-29 14:50:15
重新思考大型语言模型推理的采样标准:基于能力-难度对齐的视角

本研究提出了"能力-难度对齐采样"方法(CDAS),革新了大型语言模型强化学习训练中的数据采样策略。与传统方法不同,CDAS通过聚合历史表现差异实现更稳定的问题难度估计,并将模型能力与问题难度动态匹配。在多个数学…详细

大型语言模型强化学习采样能力难度对齐

2025-05-29 14:49:59
多模态通才:InfantAgent-Next如何让AI更智能地操作你的电脑

InfantAgent-Next是一款突破性的多模态通用型AI助手,能通过文本、图像、音频和视频与计算机进行交互。不同于现有方法,它采用高度模块化架构,将基于工具和纯视觉的代理技术融为一体,让不同模型能逐步协作解决分散…详细

人工智能多模态代理计算机自动化交互

2025-05-29 14:49:02
覆盖原则:理解组合泛化能力的统一框架——KAIST研究团队揭示大语言模型的推理局限

KAIST等机构研究团队提出的"覆盖原则"框架揭示了大语言模型在组合泛化能力上的基本局限。研究表明,依赖模式匹配的模型只能泛化到那些可以通过替换功能等价片段到达的输入。实验证实,两步推理任务的训练数据需求与词…详细

人工智能组合泛化大语言模型

2025-05-29 14:48:32
干掉完美主义:多轮分解如何让大语言模型推理更高效

这项研究提出了"多轮分解"(MinD)方法,将大型推理模型的冗长思维链重构为结构化的多轮对话形式,每轮包含一个思考单元和一个答案。通过监督微调和强化学习相结合的训练策略,MinD在MATH等基准测试上实现了高达70%的标…详细

人工智能大型推理模型强化学习

2025-05-29 14:02:06
NVIDIA 发布 2026 财年第一季度财务报告

NVIDIA季度收入达 441 亿美元,较 2025 财年第四季度增长 12%,较去年同期增长 69%;数据中心季度收入达 391 亿美元,较 2025 财年第四季度增长 10%,较去年同期增长 73%…详细

2025-05-29 13:20:36
交织式思考与应答:让大语言模型通过强化学习实现更快响应和更准确推理

这项研究提出了"交织式推理"方法,通过强化学习训练大语言模型在复杂推理过程中穿插输出中间答案。与传统的"先思考后回答"模式不同,这种方式让模型像人类一样边思考边给出阶段性结论,不仅将首词响应时间平均减少80…详细

人工智能强化学习大语言模型推理

2025-05-29 13:20:10
DoctorAgent-RL:广州国家实验室研发的多智能体协作式强化学习医疗对话系统,让AI医生问诊更像真人医生

冯轶春、王嘉伟等研究人员开发了DoctorAgent-RL,一种基于强化学习的多智能体协作医疗对话系统,彻底改变了AI医疗咨询模式。与传统单轮问答系统不同,该系统通过医生智能体与患者智能体间的多轮互动,动态优化提问策…详细

人工智能医疗对话系统强化学习

2025-05-29 13:19:33
更智能的小模型推理:数据视角下的思维链蒸馏基准研究——北卡罗来纳大学

这篇研究介绍了DC-CoT,首个专门评估数据操作如何影响思维链(CoT)知识蒸馏的基准系统。北卡罗来纳大学教堂山分校等机构的研究者使用多种教师模型(如Gemini-Pro、Claude-3.5)和学生架构(3B-7B参数),系统评估了数据增…详细

人工智能知识蒸馏语言模型推理

2025-05-29 13:19:17
当网络犯罪更智能:动态评估攻击性网络安全AI助手的风险

这项由普林斯顿大学和加州大学欧文分校研究人员完成的研究揭示了一个令人担忧的发现:恶意行为者可以利用多种自由度来增强AI网络安全助手的攻击能力,且无需外部帮助。研究表明,即使只有约36美元的计算预算,这些改…详细

人工智能安全网络安全评估动态风险分析

2025-05-29 13:18:22
G1项目:Moonshot AI通过强化学习提升视觉语言模型的感知与推理能力

这篇研究介绍了Moonshot AI团队开发的G1模型,该模型通过强化学习显著提升了视觉语言模型在游戏环境中的决策能力。研究团队首创了VLM-Gym训练环境,包含多种视觉游戏与统一接口,并开发了两代模型:G0通过纯强化学习…详细

视觉语言模型强化学习智能体决策

2025-05-29 12:48:40
让AI判断推理中的错误更精准:PathFinder-PRM如何通过分步解析优化大语言模型的数学推理过程

这项研究提出了PathFinder-PRM,一种创新的层次化过程奖励模型,通过先分类数学和一致性错误,再估算步骤奖励分数,从而提升大语言模型的数学推理能力。研究团队构建了40万样本的数据集,使用细粒度错误标签训练模型…详细

人工智能数学推理过程奖励模型

2025-05-29 12:07:30
从直觉式编码到智能体编码:Cornell大学研究团队揭示AI辅助软件开发的两种范式

这篇论文比较了AI辅助软件开发中的两种新兴范式:"直觉式编码"(Vibe Coding)和"智能体编码"(Agentic Coding)。Cornell大学研究团队的综述揭示了两种方法的根本区别:直觉式编码强调开发者与AI的对话式交互和创意探索…详细

人工智能软件开发智能体技术

2025-05-29 12:07:12
RankNovo:上海人工智能实验室开发全能蛋白质序列重排序框架,显著提升从质谱数据解析肽段准确率

RankNovo是由上海人工智能实验室和复旦大学等机构联合开发的创新框架,通过列表式重排序方法整合多个肽段测序模型的优势,提出PMD和RMD两种新指标精确评估肽段差异。实验证明它在9-species基准测试中超越所有单一模型…详细

蛋白质组学深度学习序列重排序

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章