科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-06 17:27:57
FlowMo:一种无需额外训练即可增强视频生成运动连贯性的突破性方法

特拉维夫大学研究团队开发了FlowMo,一种无需重训练即可提升AI视频生成连贯性的创新方法。该技术通过分析模型内部潜在表示中的时序方差,找出并修正运动不自然的区域,有效解决了视频中物体突然变形、消失或出现额外…详细

人工智能视频生成运动连贯性

2025-06-06 17:27:40
RelationAdapter:用扩散变换器学习和传递视觉关系

这项由浙江大学和新加坡国立大学合作开发的RelationAdapter研究提出了一种新型轻量级模块,使扩散变换器(DiT)模型能从视觉示例对中学习并应用视觉转换关系。研究团队创建了包含218种多样编辑任务的Relation252K数据集…详细

视觉关系学习扩散变换器图像编辑

2025-06-06 17:27:28
数据表单不够用:DATARUBRICS来了!自动化数据集质量评估与问责框架

这篇研究介绍了DATARUBRICS,一个专为评估机器学习数据集质量而设计的创新框架。研究团队发现现有的数据表单工具缺乏可量化的质量评估标准,因此开发了基于十个关键维度(包括数据来源、标注方法、质量保证等)的结构…详细

人工智能数据质量评估大语言模型

2025-06-06 17:27:14
AnimeShooter:香港大学与腾讯ARC实验室联合开发的多镜头动画数据集,为参考引导式视频生成开辟新天地

香港大学与腾讯ARC实验室联合推出的AnimeShooter数据集,解决了AI动画生成面临的角色一致性和多镜头连贯性问题。该数据集提供层次化注释和准确角色参考图像,配套的AnimeShooterGen模型能自回归生成连贯多镜头动画。…详细

人工智能计算机视觉动画生成

2025-06-06 17:26:26
从零开始构建开源推理模型:解决大语言模型推理能力冷启动的关键数据集

这项研究解决了开源推理大模型领域的关键挑战:如何从零开始构建高质量的长思维链数据集,以解决大语言模型在强化学习中的冷启动问题。研究团队开发了一个创新管道,使普通大语言模型能够产生长思维链推理,方法是先…详细

人工智能推理大模型长思维链数据集

2025-06-06 17:25:16
加速扩散大语言模型:UCLA研究团队提出自适应并行解码新方法

UCLA计算机科学系研究团队提出的"自适应并行解码"(APD)方法,成功解决了扩散大语言模型面临的速度与质量权衡难题。该方法通过动态调整并行生成的词数,结合一个小型辅助自回归模型来评估生成质量,并引入KV缓存和掩码…详细

人工智能语言模型扩散模型

2025-06-06 15:52:56
Acloudear司享网络出席SAP Emarsys峰会:破解流量困局,驱动精准增长

当流量红利褪去,品牌如何从“抢眼球”转向“懂人心”?…详细

2025-06-06 15:52:21
AMD联合生态伙伴启动中国行业生态共建计划,共拓企业级市场新机遇

北京,2025年6月5日——AMD今日在北京望京凯悦酒店成功举办2025行业生态合作伙伴大会。大会发布“AMD中国行业生态共建计划” ,AMD全球及大中华区管理层、及生态伙伴:Ansys、并行科技、锐捷网络、深信服、星辰天合(XSK…详细

2025-06-06 15:51:48
英特尔携手香港大学“菁英聚·港大”,推动中学人工智能教育普及

香港,2025年6月5 日 – 英特尔与香港大学(以下简称“港大”)“菁英聚·港大”(HKU Academy for the Talented,以下简称“HKU AcT”)达成合作,携手成立“AIM Lab: AI Mentors for All”(AI导师全民创新实验室)。双方将…详细

2025-06-06 14:16:17
R?ec:思考与推荐融为一体,香港理工大学研究团队打造新一代大型推荐系统

这项研究由香港理工大学和新加坡国立大学的团队共同完成,提出了R?ec,首个将推理能力内置于大型推荐模型的统一框架。与传统方法不同,R?ec在单一自回归过程中实现了推理生成和物品预测的无缝整合。研究者还设计了Re…详细

人工智能大型推荐模型强化学习

2025-06-06 14:16:01
多模态深度研究员:基于代理架构从零开始生成图文交织报告

这项由浙江大学CAD&CG国家重点实验室研究团队开发的"多模态深度研究员"系统,能够自动生成包含精美图表和文本的专业报告。研究者提出了"可视化的形式化描述"(FDV)方法,使AI能够理解和生成高质量可视化内容。该系统…详细

人工智能多模态系统数据可视化

2025-06-06 14:15:25
共同进化的魔法:让AI既会写代码又会检验代码,一个团队让计算机学会自我完善的故事

这项研究提出了CURE框架,通过强化学习让大语言模型同时学习编写代码和生成单元测试两种能力,无需使用标准代码作为监督。团队开发的ReasonFlux-Coder模型在仅用4.5K编程问题训练后,便在多个基准测试中超越了同类模…详细

人工智能强化学习代码生成

2025-06-06 14:15:05
视觉"动感眼":南京大学团队打造的多模态大模型细粒度动作理解增强系统

南京大学与字节跳动联合团队开发的MotionSight系统,为多模态大语言模型提供了"动态视觉增强"能力,解决了现有AI系统在理解视频细粒度动作方面的困难。这一零样本方法通过对象中心的视觉聚光灯和动态模糊技术,显著提…详细

计算机视觉多模态大语言模型视频理解

2025-06-06 14:14:42
深度解读M?FinMeeting:探索多语言、多行业、多任务的金融会议理解评估数据集

M?FinMeeting是由苏州大学和阿里云研究团队开发的创新性金融会议理解评估数据集,支持英语、中文和日语三种语言,涵盖全球行业分类标准(GICS)定义的11个行业部门,包含摘要生成、问答对提取和问题回答三项任务。研究…详细

金融科技自然语言处理大型语言模型

2025-06-06 14:14:03
解决视觉语言模型的"眼见为实"难题:布朗大学团队开发像素与先验知识控制技术

这项研究创建了"Visual CounterFact"数据集,通过展示与常识相悖的图像(如蓝色草莓)测试视觉语言模型如何平衡视觉输入与记忆知识。研究发现,模型往往会被视觉输入左右,即使被问及通用知识问题。团队开发了"像素与…详细

视觉语言模型多模态理解可解释AI

2025-06-06 13:26:12
天工超级智能体问世,掀起了全球“AI Office智能体”时代的变革浪潮

5月22日,昆仑万维正式发布全球首款基于AI Agent架构的Office智能体——天工超级智能体(Skywork Super Agents)网页端,引发火爆体验热潮。5月26日,昆仑万维天工超级智能体(Skywork Super Agents)APP正式上线。这…详细

2025-06-06 13:22:37
智汇湾区 算聚韶关:第四届粤港澳大湾区算力产业大会暨第三届中国算力网大会即将盛大启幕

本次大会以“智汇湾区 算聚韶关”为主题 ,旨在深度融入国家“东数西算”工程战略,加速全国一体化算力网络粤港澳大湾区国家枢纽节点韶关数据中心集群(以下简称“韶关集群”)的建设步伐,广邀大数据领域企业共商发…详细

2025-06-06 12:25:05
SEALQA:提升搜索增强型语言模型推理能力的新挑战

SEALQA是维吉尼亚理工大学研究团队开发的新型基准测试,旨在评估搜索增强型语言模型在面对矛盾、嘈杂或无用搜索结果时的推理能力。它包含三种测试:SEAL-0(极具挑战性的核心问题集)、SEAL-HARD(更广泛的困难问题集…详细

人工智能搜索增强型语言模型推理能力评估

2025-06-06 12:24:49
计划与预算:大型语言模型推理的高效测试时优化方案

这篇论文提出了"计划与预算"框架,解决大型语言模型在推理任务中的效率问题。研究者发现模型存在"推理失调"现象——简单问题上过度思考,复杂问题上思考不足。他们开发了贝叶斯预算分配模型(BBAM)作为理论基础,将推…详细

人工智能效率大型语言模型计算资源优化

2025-06-06 12:24:28
解密神秘语言模型:康奈尔大学研究团队突破性融合自回归与扩散技术

康奈尔大学团队提出的"神秘语言模型"(Eso-LMs)创新性地融合了自回归和掩码扩散模型的优势,实现了两种范式间的平滑过渡。研究最大突破在于首次为掩码扩散模型引入KV缓存技术,同时保留并行生成能力,使推理速度比标准…详细

人工智能语言模型扩散模型

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章