阿里巴巴通义实验室开发的AgentScaler是一个能够智能使用工具的AI助手模型系列。通过创新的两阶段训练和自动化环境构建技术,AgentScaler在多个权威测试中表现优异,40亿参数的小模型就达到了300亿参数模型的性能。该…详细
重庆大学团队提出MHIM-MIL框架,通过"屏蔽困难实例挖掘"策略解决传统医学AI过度依赖简单特征的问题。该方法采用"老师-学生"协作机制,强制AI学习困难病例,在癌症诊断等多个医学任务中显著超越现有方法,同时大幅提升…详细
斯坦福大学研究团队开发出名为"投机采样"的AI训练新方法,通过引入小型草稿模型提供候选方案,让主模型无需从零开始计算,训练速度提升2-640倍,同时将能源消耗降低80%以上。这项技术大幅降低了AI模型训练成本,让普…详细
这项研究开发了首个轻量级物理推理评估框架,测试四种主流视觉语言模型在抛射运动、碰撞动力学、力学和流体动力学四个领域的表现。结果显示中等规模的Qwen2.5-VL-7B意外击败最大模型获得最高分0.815,揭示了当前AI模…详细
Meta AI团队开发的AggLM技术突破了传统AI多数投票的局限,通过强化学习训练模型学会智能聚合多个候选答案。在数学竞赛测试中,该技术将正确率从35%提升至50%,相比传统方法提升45%。AggLM不仅能选择正确答案,还能创…详细
中科院自动化所团队开发出Reflection-V视觉推理模型,首次让AI学会在推理过程中主动回顾检查图像信息。该模型通过创新的多智能体训练数据构建和视觉注意力奖励机制,解决了传统AI视觉推理中"看一眼就算数"的问题,在…详细
心理健康挑战已达史无前例的水平,2024年美国近6000万成年人患有心理疾病,但仅半数接受治疗。专家正探索智能AI代理系统作为解决方案,这些自主代理具备独立决策、持续学习和主动干预能力。未来应用包括自主治疗代理…详细
上海人工智能实验室发布OmniWorld,这是首个专为4D世界建模设计的大规模多领域数据集。该数据集包含超过3亿帧数据,涵盖游戏、机器人、人类活动等多个领域,配备深度、相机位置、文本等多种标注。研究证明现有AI模型…详细
阿里通义实验室与浙江大学联合发布UI-S1系统,通过创新的半在线强化学习方法,让AI掌握了复杂的手机操作能力。该系统在多个测试平台上表现优异,相比基础模型在AndroidWorld上提升12%,在AITW上提升23.8%,为实现真正…详细
港科大研究团队开发的LazyDrag系统创新性地解决了图片拖拽编辑中的核心难题。该系统摒弃传统的隐式匹配方法,采用显式对应地图技术,实现了无需训练的高精度图片编辑。LazyDrag支持文字引导功能,能智能理解用户意图…详细
MIT研究团队发现,AI图像生成模型的"局部思维"并非来自网络结构限制,而是源于训练数据中像素间的统计关联。通过巧妙实验证明,即使改变数据中的微妙模式,AI也会相应调整注意力策略。这一发现为开发更可解释、高效的…详细
哥伦比亚大学研究团队通过精巧实验发现,经济稀缺性会像"认知病毒"一样占用大脑资源,导致注意力、工作记忆和认知灵活性下降,使人们更易做出短视决策。研究开发了注意力训练、认知重构等有效干预方法,并在就业援助…详细
Spotify宣布已从其目录中删除7500万首"垃圾"音乐,作为打击日益泛滥的欺诈性音频内容和"AI垃圾"的努力。公司发布新政策禁止冒充、垃圾提交和欺诈版税生成。目前流媒体服务每日收到约15万首新曲目,其中28%为纯AI生成…详细
Meta公司推出名为"Vibes"的全新信息流功能,专门展示由创作者使用AI技术制作的视频内容。该功能将人工智能生成的视频内容进行整合和分类,为用户提供更加个性化的AI视频浏览体验,标志着Meta在AI内容分发领域的又一重…详细
YouTube正在测试一项全新的AI实验功能,为用户的音乐体验添加AI虚拟主播。这项创新技术将人工智能与音乐内容相结合,让AI主播能够为用户介绍和解说音乐内容,提供更加个性化和互动性的音乐收听体验。该功能目前处于实…详细
北京大学团队发现AI训练中的"个性化"秘密:不同词汇在推理过程中承担不同角色,传统方法一视同仁效率低下。研究团队开发HAPO方法,根据词汇重要性动态调整训练策略,在数学推理任务上准确率提升16.6%,为AI训练的精细…详细
据报道,Meta正在研发机器人技术,但与苹果、谷歌和特斯拉不同,Meta的重点不在硬件竞争。虽然公司正在开发"Metabot",但真正目标是创建可供其他公司授权使用的软件平台,类似谷歌的安卓系统。Meta首席技术官表示"软…详细
Meta研究团队推出MetaEmbed技术,通过创新的"元标记"设计解决了AI搜索中速度与精度难以兼得的问题。该技术将内容分层组织成多个智能向量,用户可根据需求灵活选择搜索精度。在大规模测试中,MetaEmbed显著超越现有方…详细
阿里巴巴达摩院联合南洋理工大学的研究团队发现,当前AI模型在几何推理中频繁出错的根本原因是视觉感知能力不足。他们提出了分阶段训练框架,先强化AI的基础视觉感知能力,再进行复杂推理训练。实验显示,这种方法使…详细
澳大利亚研究团队开发出首个专门识别古希腊陶器的AI系统VaseVL,通过创新的"诊断式强化学习"方法,在材质识别、工艺判断等任务上达到专家级水平。该系统基于超过3万张陶器图片训练,准确率最高达99.95%,为文化遗产保…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。