Google研究团队推出Atlas,一种革命性的AI记忆优化模型,解决传统Transformer架构在处理长文本时的计算复杂度问题。Atlas通过三大创新:超线性容量的记忆模块、基于上下文而非单词的记忆优化、及使用Muon优化器的高效…详细
LoRAShop是弗吉尼亚理工大学研究团队开发的突破性框架,首次实现了无需额外训练的多概念图像编辑。该技术通过在整流流变换器中识别概念特定区域,创建分离的潜在掩码,并仅在相应区域混合LoRA权重,有效解决了"LoRA交…详细
NVIDIA联合麻省理工学院和香港大学的研究团队提出Fast-dLLM,一种无需重新训练即可显著加速扩散大语言模型的新方法。该技术通过两大创新解决了扩散模型的主要性能瓶颈:首先设计了适用于双向注意力机制的块式近似KV缓…详细
毫无疑问,当下数字化正在改变整个世界。而数字世界的底层,则是庞大且不断产生、汇集、运算的数据,特别是以人工智能、大模型、大数据、云计算为代表的数字技术的一系列革命性突破,让数据“指数级”增长的步伐仍在加快…详细
北京大学与小红书公司联合研究团队提出的Uni-Instruct框架,成功统一了10多种现有单步扩散蒸馏方法。该框架基于新颖的f-散度扩散扩展理论,通过可计算的等价损失函数训练单步扩散模型。实验表明,Uni-Instruct在CIFA…详细
5月29日,由友达光电(苏州)有限公司与友达数位科技服务(苏州)有限公司(ADT)携手主办的 2025 友达数位智能制造年度峰会,在苏州友达光电国际会议厅圆满落幕。…详细
5月29日,由友达光电(苏州)有限公司与友达数位科技服务(苏州)有限公司(ADT)携手主办的 2025 友达数位智能制造年度峰会,在苏州友达光电国际会议厅圆满落幕。…详细
随着现代化技术的兴起,当今数据中心正面临日益增长的新需求。为高效应对主流与加速型工作负载,企业亟需采用可扩展、高效与高性能的解决方案。…详细
今年微软Build 2025大会上,微软CEO萨提亚-纳德拉(Satya Nadella)在AI成为人类智能副驾的目标和梦想已经实现的前提下,又提出了开放智能体网络(Open Agentic Web)。他认为,未来的企业、组织和个人社会将是一个更…详细
这篇研究介绍了KVzip,一种创新的查询无关KV缓存压缩方法,通过上下文重建机制为大型语言模型提供高效存储解决方案。该技术能将KV缓存大小减少394倍,同时提高解码速度约2倍,在各种任务上性能几乎不受影响。不同于传…详细
腾讯与上海交通大学联合推出的DeepTheorem研究突破了大型语言模型在数学定理证明领域的限制。该项目创建了包含12.1万个IMO级别非形式化定理的大规模数据集,开发了专门的RL-Zero强化学习策略,并设计了全面的评估框架…详细
MAGREF是字节跳动智能创作团队开发的多主体视频生成框架,能从多张参考图像和文本提示生成高质量视频。该技术引入了区域感知动态遮罩机制,使单一模型灵活处理人物、物体和背景,无需架构变化;并采用像素级通道拼接…详细
这项研究揭示了大型语言模型(LLMs)偏好决策的内在机制。以色列理工学院和IBM研究院的团队开发了一种自动化方法,不需人工预设即可发现和解释影响AI判断的关键概念。研究横跨八个领域(从一般问答到安全评估),分析…详细
PATIENTSIM是韩国科学技术院等机构最新研发的医患交流模拟系统,它突破了传统模拟器的限制,通过四个维度(性格、语言水平、记忆能力和认知混乱程度)构建了37种独特的患者角色。基于MIMIC数据集中的真实临床资料,系…详细
UniTEX是香港科技大学与Light Illusion团队联合开发的创新3D纹理生成框架,彻底突破了传统UV映射的限制。该技术引入了"纹理函数"概念,将纹理定义为3D空间中的连续函数,完全绕过了拓扑歧义问题。配合精心设计的大型…详细
研究人员训练了13,440个大型语言模型,发现熵最小化方法仅需一个未标记数据和10步优化,就能实现比传统强化学习更好的性能提升。这种"单样本熵最小化"完全无监督,基于两个简单假设:语言模型生成过程本质上是随机的…详细
这项研究首次从图论视角探索大语言模型的知识结构模式,揭示了模型知识的三峰分布特性、节点度数与知识水平的正相关关系,以及知识同质性现象——拓扑位置相近的实体往往具有相似的知识水平。基于这些发现,研究团队…详细
大模型时代,玛丽·米克尔(Mary Meeker)的名字可能大家不一定熟悉,但是在互联网时代,这位被可被誉为“互联网女皇”的。她是美国风险投资家和前华尔街证券分析师,专注于互联网及新兴技术领域。玛丽·米克尔(Mar…详细
毫无疑问,Agent,也就是智能体已经预定了今年的最火AI关键词。不知道明年会不会是AGI呢,既然OpenAI和Anthropic的预测都是在2027年左右。而在Agent领域,非常有发言权的一位就是吴恩达。LangChain前不久的开发者活动…详细
本文评测了 Google 最新 AI 视频生成工具 Veo 3,从音频生成、功能局限、等待时长及费用限制等方面展示其优劣,适合 AI 爱好者体验,但专业创作者可能会感到不便。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。