科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-06 09:18:07
SenseFlow:香港科技大学团队突破性提升大规模文本生成图像模型的高效蒸馏技术

SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别…详细

人工智能流匹配模型模型蒸馏

2025-06-06 09:17:46
MASKSEARCH:通过通用预训练框架,让你的AI更会搜索与思考

MASKSEARCH是阿里巴巴集团同义实验室开发的新型预训练框架,通过创新的"检索增强掩码预测"任务,训练大型语言模型像人类一样主动使用搜索工具获取信息。这项框架包含两个阶段:首先在掩码预测任务上预训练,然后在下…详细

人工智能检索增强生成大型语言模型

2025-06-06 09:17:31
SmolVLA:为低成本高效机器人打造的视觉-语言-动作模型

SmolVLA是由Hugging Face、巴黎索邦大学等机构联合开发的小型视觉-语言-动作模型,专为低成本机器人设计。与现有模型相比,它仅有4.5亿参数(小10倍),却能达到相当性能。SmolVLA采用精巧架构设计,可在单GPU训练、…详细

机器人学习视觉语言模型异步推理

2025-06-06 09:17:16
AREAL:突破传统,完全异步强化学习如何让大语言模型的推理能力飞跃

AREAL是一个由清华大学和蚂蚁研究院开发的全新异步强化学习系统,专为提升大语言模型的推理能力而设计。与传统同步系统不同,AREAL完全解耦了生成和训练过程,推理工作器持续生成新输出,训练工作器则在收集到足够数…详细

强化学习系统大语言模型推理异步训练架构

2025-06-06 09:16:23
EarthMind:基于大型多模态模型的多尺度多传感器地球观测系统

EarthMind是一个创新的视觉-语言框架,专为解决地球观测领域的多尺度和多传感器理解挑战而设计。由多所国际知名大学联合开发的这一系统引入了两项关键技术:空间注意力提示(SAP)机制重新分配大型语言模型内部的注意力…详细

人工智能多模态融合地球观测

2025-06-06 09:15:59
CodeV-R1:让推理增强型Verilog生成变得简单高效,中科院计算所团队带来硬件描述语言自动生成的突破性进展

CodeV-R1是中科院计算所团队开发的专用于Verilog硬件描述语言自动生成的推理增强型大语言模型框架。该研究克服了三大关键挑战:缺乏自动化验证环境、高质量数据稀缺和计算成本高昂。研究团队通过开发自动测试台生成框…详细

人工智能硬件描述语言强化学习

2025-06-05 18:19:12
强化学习存在推理效率问题,阿里千问团队发明推理二八法则,解决AI选择困难症

强化学习存在推理效率问题,阿里千问团队发明推理二八法则,解决AI选择困难症…详细

2025-06-05 18:04:10
zip2zip:通过令牌压缩实现大语言模型的推理时自适应词汇表

zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将…详细

人工智能模型优化大语言模型

2025-06-05 18:02:59
LLM循环助力:创建PARADEHATE数据集实现仇恨言论无毒化

这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集…详细

人工智能自然语言处理仇恨言论无毒化

2025-06-05 18:02:28
Pro3D-Editor:一种实现3D模型一致精准编辑的渐进式视角方法

这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽…详细

3D编辑视觉一致性渐进式视角范式

2025-06-05 18:02:02
ComposeAnything:来自INRIA的人工智能新突破,让AI图像生成理解复杂空间关系

这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深…详细

人工智能图像生成空间关系理解

2025-06-05 18:01:39
OmniResponse:打破对话隔阂的全方位响应系统——KAUST团队实现在线多模态对话生成重大突破

OmniResponse是由KAUST和埃克塞特大学研究团队开发的创新系统,首次实现了在线多模态对话响应生成(OMCRG)任务。该系统能够实时处理说话者的视频和音频输入,并生成与之同步的听众面部表情和语音反馈,通过引入文本…详细

多模态对话系统人机交互实时响应生成

2025-06-05 18:00:51
思考再三!测试时计算对大型语言模型偏好、观点和信念的影响

IBM研究院AI团队开发的POBs基准测试揭示了大型语言模型在主观话题上表现出明显偏好,尤其倾向于进步-集体主义观点。研究发现,增加测试时计算(思考时间)对减少模型偏见效果有限,且更新版本的模型反而表现出更强烈…详细

人工智能大型语言模型AI偏见

2025-06-05 17:53:53
Victoria’s Secret 遭遇服务中断,正应对安全事件

时尚零售巨头维多利亚的秘密因安全事件导致网站和线上订单服务中断,已立即启动应急响应、邀请第三方专家协助恢复运营,实体店仍正常营业。…详细

网络安全应急响应快速恢复策略

2025-06-05 17:29:25
中国将迎来全球科技领袖齐聚 2025 MWC 上海

GSMA 2025 MWC 上海将于2025年6月18日至20日在上海新国际博览中心(SNIEC)及浦东嘉里大酒店举行,届时全球创新者、政策制定者及商业领袖将齐聚一堂,见证亚太科技市场的重要时刻。…详细

MWC上海2025GSMA

2025-06-05 15:33:07
诺基亚贝尔亮相2025中国光网络研讨会,探讨AI在网络基础设施中的潜能

6月4日至5日,以“万兆光网 协同智算”为主题的2025中国光网络研讨会(OptiNet China)在北京盛大召开。…详细

2025-06-05 15:25:34
WebChoreArena:东京大学研究团队推出更具挑战性的网页代理任务评估基准

东京大学研究团队开发的WebChoreArena是一个全新的网页代理评估基准,它包含532个精心设计的任务,专注于测试AI代理处理繁琐、复杂网页任务的能力。研究结果显示,即使是最先进的语言模型(如Gemini 2.5 Pro)在这些…详细

人工智能网页代理基准测试

2025-06-05 15:25:03
低秩矩阵揭示真相:利用主要权重提升大语言模型的推理能力

这项研究提出了一种名为LIFT的新型微调方法,通过在低秩近似后识别大语言模型中的主要权重进行稀疏微调。研究表明,仅更新5%的主要权重就能在推理任务上超越全参数微调,同时保持与LoRA相当的内存效率。LIFT在常识推…详细

人工智能大语言模型稀疏微调

2025-06-05 15:24:40
从理论到实践:阿拉伯语言模型评估的新范式

这篇研究从王子苏丹大学的学者团队提出了阿拉伯语言模型评估的新范式,首先建立了全面的理论指南,然后分析了现有评估数据集的不足,并引入了阿拉伯深度迷你数据集(ADMD)作为解决方案。ADMD包含490个涵盖10个领域的挑…详细

人工智能自然语言处理多语言评估

2025-06-05 15:21:11
SRPO:通过反思增强强化学习,让多模态大语言模型推理能力更上一层楼

该研究提出了SRPO框架,一种两阶段反思感知强化学习方法,用于增强多模态大语言模型的推理能力。通过构建高质量的反思数据集进行监督微调,并设计专门的奖励机制鼓励有效反思,SRPO成功解决了现有模型在复杂推理任务…详细

多模态大语言模型反思增强强化学习推理能力提升

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章