特拉维夫大学研究团队开发了FlowMo,一种无需重训练即可提升AI视频生成连贯性的创新方法。该技术通过分析模型内部潜在表示中的时序方差,找出并修正运动不自然的区域,有效解决了视频中物体突然变形、消失或出现额外…详细
这项由浙江大学和新加坡国立大学合作开发的RelationAdapter研究提出了一种新型轻量级模块,使扩散变换器(DiT)模型能从视觉示例对中学习并应用视觉转换关系。研究团队创建了包含218种多样编辑任务的Relation252K数据集…详细
这篇研究介绍了DATARUBRICS,一个专为评估机器学习数据集质量而设计的创新框架。研究团队发现现有的数据表单工具缺乏可量化的质量评估标准,因此开发了基于十个关键维度(包括数据来源、标注方法、质量保证等)的结构…详细
香港大学与腾讯ARC实验室联合推出的AnimeShooter数据集,解决了AI动画生成面临的角色一致性和多镜头连贯性问题。该数据集提供层次化注释和准确角色参考图像,配套的AnimeShooterGen模型能自回归生成连贯多镜头动画。…详细
这项研究解决了开源推理大模型领域的关键挑战:如何从零开始构建高质量的长思维链数据集,以解决大语言模型在强化学习中的冷启动问题。研究团队开发了一个创新管道,使普通大语言模型能够产生长思维链推理,方法是先…详细
UCLA计算机科学系研究团队提出的"自适应并行解码"(APD)方法,成功解决了扩散大语言模型面临的速度与质量权衡难题。该方法通过动态调整并行生成的词数,结合一个小型辅助自回归模型来评估生成质量,并引入KV缓存和掩码…详细
北京,2025年6月5日——AMD今日在北京望京凯悦酒店成功举办2025行业生态合作伙伴大会。大会发布“AMD中国行业生态共建计划” ,AMD全球及大中华区管理层、及生态伙伴:Ansys、并行科技、锐捷网络、深信服、星辰天合(XSK…详细
香港,2025年6月5 日 – 英特尔与香港大学(以下简称“港大”)“菁英聚·港大”(HKU Academy for the Talented,以下简称“HKU AcT”)达成合作,携手成立“AIM Lab: AI Mentors for All”(AI导师全民创新实验室)。双方将…详细
这项研究由香港理工大学和新加坡国立大学的团队共同完成,提出了R?ec,首个将推理能力内置于大型推荐模型的统一框架。与传统方法不同,R?ec在单一自回归过程中实现了推理生成和物品预测的无缝整合。研究者还设计了Re…详细
这项由浙江大学CAD&CG国家重点实验室研究团队开发的"多模态深度研究员"系统,能够自动生成包含精美图表和文本的专业报告。研究者提出了"可视化的形式化描述"(FDV)方法,使AI能够理解和生成高质量可视化内容。该系统…详细
这项研究提出了CURE框架,通过强化学习让大语言模型同时学习编写代码和生成单元测试两种能力,无需使用标准代码作为监督。团队开发的ReasonFlux-Coder模型在仅用4.5K编程问题训练后,便在多个基准测试中超越了同类模…详细
南京大学与字节跳动联合团队开发的MotionSight系统,为多模态大语言模型提供了"动态视觉增强"能力,解决了现有AI系统在理解视频细粒度动作方面的困难。这一零样本方法通过对象中心的视觉聚光灯和动态模糊技术,显著提…详细
M?FinMeeting是由苏州大学和阿里云研究团队开发的创新性金融会议理解评估数据集,支持英语、中文和日语三种语言,涵盖全球行业分类标准(GICS)定义的11个行业部门,包含摘要生成、问答对提取和问题回答三项任务。研究…详细
这项研究创建了"Visual CounterFact"数据集,通过展示与常识相悖的图像(如蓝色草莓)测试视觉语言模型如何平衡视觉输入与记忆知识。研究发现,模型往往会被视觉输入左右,即使被问及通用知识问题。团队开发了"像素与…详细
5月22日,昆仑万维正式发布全球首款基于AI Agent架构的Office智能体——天工超级智能体(Skywork Super Agents)网页端,引发火爆体验热潮。5月26日,昆仑万维天工超级智能体(Skywork Super Agents)APP正式上线。这…详细
本次大会以“智汇湾区 算聚韶关”为主题 ,旨在深度融入国家“东数西算”工程战略,加速全国一体化算力网络粤港澳大湾区国家枢纽节点韶关数据中心集群(以下简称“韶关集群”)的建设步伐,广邀大数据领域企业共商发…详细
SEALQA是维吉尼亚理工大学研究团队开发的新型基准测试,旨在评估搜索增强型语言模型在面对矛盾、嘈杂或无用搜索结果时的推理能力。它包含三种测试:SEAL-0(极具挑战性的核心问题集)、SEAL-HARD(更广泛的困难问题集…详细
这篇论文提出了"计划与预算"框架,解决大型语言模型在推理任务中的效率问题。研究者发现模型存在"推理失调"现象——简单问题上过度思考,复杂问题上思考不足。他们开发了贝叶斯预算分配模型(BBAM)作为理论基础,将推…详细
康奈尔大学团队提出的"神秘语言模型"(Eso-LMs)创新性地融合了自回归和掩码扩散模型的优势,实现了两种范式间的平滑过渡。研究最大突破在于首次为掩码扩散模型引入KV缓存技术,同时保留并行生成能力,使推理速度比标准…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。