人工智能 关键字列表
包子AI训练师:让智能助手从练习中学会更聪明

包子AI训练师:让智能助手从练习中学会更聪明

蚂蚁集团与西湖大学联合开发的AWORLD开源框架,通过分布式并行训练将AI助手的练习效率提升14.6倍,成功将Qwen3-32B模型在GAIA测试中的准确率从21.59%提升至32.23%,在最困难任务上甚至超越了GPT-4o等商业AI产品,为"从练习中学习"的AI训练理念提供了实用解决方案。

Zoom推出TCIA框架:AI指令训练的革命性突破

Zoom推出TCIA框架:AI指令训练的革命性突破

Zoom公司研究团队开发的TCIA框架通过"拆解-重组"策略解决AI指令训练中的多样性不足和任务漂移问题,将指令分解为基础查询和约束条件后智能重组,在四个真实任务中平均性能提升8.7%,某些场景甚至超越GPT-4o,同时保持通用能力不受损,为企业低成本定制专业AI应用提供了新方案。

哈工大团队让机器人学会"聪明偷懒":像人脑一样高效处理复杂指令

哈工大团队让机器人学会"聪明偷懒":像人脑一样高效处理复杂指令

哈工大研究团队开发的CogVLA系统通过模仿人脑认知机制,让机器人学会"智能筛选"信息,根据任务指令只关注重要内容。该系统采用三阶段渐进式处理架构,在LIBERO基准测试中达到97.4%成功率,同时训练成本降低2.5倍,推理速度提升2.8倍,为机器人技术的实用化和普及化奠定了重要基础。

乔治亚理工学院开发AI聊天界面,让机器人明白你真正想要什么

乔治亚理工学院开发AI聊天界面,让机器人明白你真正想要什么

乔治亚理工学院联合Adobe Research开发的OnGoal系统,通过智能目标追踪和可视化反馈,解决了用户与AI长对话时目标混乱、沟通低效的问题。20人实验证明,该系统让用户完成任务更快、压力更小,还能学会更有效的AI沟通策略,为未来人机协作指明了透明化、个性化的发展方向。

AI变身魔法师:伊利诺伊大学团队让你穿上任何衣服,跳出任何舞步

AI变身魔法师:伊利诺伊大学团队让你穿上任何衣服,跳出任何舞步

伊利诺伊大学研究团队开发出Dress&Dance系统,这是首个能生成高清虚拟试衣视频的AI技术。用户只需提供个人照片、服装图片和参考动作视频,即可生成1152×720分辨率、24帧每秒的5秒试衣视频。该系统通过CondNet技术统一处理多模态信息,采用分阶段训练策略,支持单件及多件服装同时试穿,在服装细节保真度和动作自然度方面显著优于现有商业产品。

多模态AI的"视力"和"文字理解"为何不在一个频道上?多伦多大学重磅发现

多模态AI的"视力"和"文字理解"为何不在一个频道上?多伦多大学重磅发现

多伦多大学研究团队通过开发SEAM基准测试系统,发现当前最先进的视觉-语言AI模型存在显著的"模态失衡"现象。即便面对语义完全相同的信息,这些模型在处理视觉输入和文字输入时表现差异明显。研究涵盖国际象棋、化学、音乐、图论四个领域,测试了21个主流模型,揭示了分词错误和视觉幻觉两大根本原因。这项工作为评估和改进AI跨模态理解能力提供了重要基准,对推进通用人工智能发展具有重要意义。

亚马逊Lens Live AI可识别并购买任何可见物品

亚马逊Lens Live AI可识别并购买任何可见物品

亚马逊发布Lens Live AI功能,用户可通过手机摄像头扫描任何物品进行实时购物。该技术利用人工智能识别用户拍摄的物品,并在亚马逊平台上匹配相关商品,提供即时购买选项。这一创新功能将大幅简化购物流程,用户只需"看到即可购买",为在线购物体验带来革命性改变。

NotebookLM新增AI辩论功能,可基于笔记生成多种音频总结

NotebookLM新增AI辩论功能,可基于笔记生成多种音频总结

谷歌AI研究助手NotebookLM宣布推出三种全新音频摘要格式:简要、评论和辩论模式。这一更新将为用户提供更多选择,让已经备受欢迎的音频概览功能更加丰富多样。简要模式提供1-2分钟的精简概述,评论模式对材料进行建设性反馈,辩论模式则让两个AI主持人就内容展开深入讨论。这些新格式有助于用户从不同角度理解学习材料,使NotebookLM成为更加细致入微的学习工具。

赛诺菲运用AI技术优化患者护理服务

赛诺菲运用AI技术优化患者护理服务

法国生物制药公司赛诺菲正在大规模应用AI技术进行数字化转型,将AI整合到从新分子识别到药物配送的整个价值链中。公司通过数字加速器项目,结合预测模型和机器学习算法,可预测80%的物流中断。与谷歌云等合作伙伴携手,开发内部AI应用plai。巴塞罗那全球创新中心将创造300多个高技能岗位,专注于临床分析和预测模型开发,旨在提供更快速、精准的医疗解决方案。

科技领导者如何平衡AI转型与员工需求?

科技领导者如何平衡AI转型与员工需求?

AI是一把双刃剑,既能解放员工免于繁重工作,也可能夺走创造性任务。虽然今年已有超过8万名科技员工被裁,但企业领导者正寻求通过AI增强而非替代员工的策略。Parsons等公司投资培训项目,提升员工技能,实现了十年来最佳留任率。汤森路透采用"AI优先、人类主导"策略,部署Open Arena平台供员工实验AI工具。专家认为,AI将创造新就业机会,关键是企业要有积极愿景,通过技能提升帮助员工适应新角色。

Cato Networks收购Aim Security强化AI安全防护能力

Cato Networks收购Aim Security强化AI安全防护能力

云网络公司Cato Networks宣布收购以色列AI安全公司Aim Security,收购金额未披露。Aim Security成立于2022年,专注保护员工、应用程序和组织与AI的交互,提供AI使用的可见性、控制和治理。该平台可监控ChatGPT、微软Copilot等公共AI应用的使用,发现影子AI使用情况并降低风险。此次收购将使Cato Networks的SASE云平台扩展新的AI安全功能。

巴黎理工学院发现AI换脸新危机:让人类检测准确率下降30%的"局部伪造"技术

巴黎理工学院发现AI换脸新危机:让人类检测准确率下降30%的"局部伪造"技术

巴黎理工学院研究团队发现了比传统深度伪造更隐蔽的"局部伪造"技术威胁。这种只修改视频局部区域的新型AI造假技术让人类检测准确率下降30%以上,AI检测系统性能下降高达43%。研究团队构建了包含25000个样本的全球首个局部伪造检测数据库FakePartsBench,揭示了现有防御体系面对精细化伪造攻击的脆弱性,为未来开发更强大的检测技术奠定重要基础。

大语言模型的"外挂"时代:Meta等机构揭秘为什么AI要学会借助工具而非死记硬背

大语言模型的"外挂"时代:Meta等机构揭秘为什么AI要学会借助工具而非死记硬背

Meta等机构研究发现,让大语言模型学会使用外部工具比死记硬背所有知识更高效。研究通过数学证明和实验验证,传统的参数记忆存在严格容量限制,而工具学习能实现无限扩展且不损害原有能力。这为AI发展提供了新思路:从堆叠参数转向构建智能工具协作系统。

ROSE:让视频中的物体彻底"消失",连阴影也不留痕迹的神奇技术

ROSE:让视频中的物体彻底"消失",连阴影也不留痕迹的神奇技术

ROSE是一项突破性的视频编辑技术,能够彻底移除视频中的物体及其环境影响。由浙江大学等机构研发,该系统不仅删除目标物体,还智能处理阴影、反射、光照等五种副作用。通过3D渲染生成训练数据,采用引用式擦除和差异掩码预测等创新方法,ROSE在各项性能指标上全面超越现有技术,为视频编辑领域带来了新的可能。

微软开发的14B参数AI:用510步训练就能媲美6710亿参数模型的数学推理能力

微软开发的14B参数AI:用510步训练就能媲美6710亿参数模型的数学推理能力

微软研究院开发的rStar2-Agent是一个仅140亿参数的AI数学推理模型,通过创新的智能体强化学习方法,在AIME24数学竞赛中达到80.6%准确率,超越了6710亿参数的DeepSeek-R1等大型模型。该模型的核心创新包括GRPO-RoC算法、分布式代码执行环境和渐进式训练策略,仅用510个训练步骤和一周时间就达到顶级性能,展示了"小模型大能力"的技术路径,为AI发展提供了高效替代方案。

Accenture研究团队推出MCP-Bench:让AI助手在复杂现实任务中接受终极考验

Accenture研究团队推出MCP-Bench:让AI助手在复杂现实任务中接受终极考验

Accenture研究团队推出MCP-Bench评估基准,通过连接28个真实服务器和250个工具构建复杂任务生态系统,测试AI助手处理现实多步骤任务的综合能力。研究发现即使顶级模型在基本工具使用上已趋成熟,但在多工具协调和长期规划方面仍面临重大挑战,为AI助手发展指明新方向。

AI推理链条真的在推理,还是只是在自我催眠?英国谢菲尔德大学揭秘思维链的真相

AI推理链条真的在推理,还是只是在自我催眠?英国谢菲尔德大学揭秘思维链的真相

英国谢菲尔德大学研究团队通过分析三类AI模型在软推理任务中的表现,发现了思维链推理的两面性:影响力和忠实性。蒸馏推理模型高度依赖推理过程并能纠错,而指令调优模型更多进行事后解释。研究揭示不同训练方法造就不同推理风格,对AI可解释性应用具有重要指导意义。

快手团队打造MIDAS:让AI数字人能像真人一样实时对话互动

快手团队打造MIDAS:让AI数字人能像真人一样实时对话互动

快手团队联合清华、浙大推出MIDAS数字人系统,通过创新的自回归视频生成框架实现多模态实时交互。系统采用深度压缩自编码器将视频压缩64倍,结合大语言模型处理音频、姿态、文本等多种输入,配合轻量级扩散头生成高质量视频。可支持双人对话、跨语言合成等应用,生成视频长达4分钟无明显质量下降,为数字人实时交互应用奠定重要技术基础。

AI智能助手终于学会像人类一样操作电脑软件:上海AI实验室团队打造大脑分工新模式

AI智能助手终于学会像人类一样操作电脑软件:上海AI实验室团队打造大脑分工新模式

上海AI实验室等机构联合开发了CODA系统,这是一个能够操作复杂专业软件的AI助手。它模仿人类大脑分工,分为负责规划的"大脑皮层"和负责执行的"小脑"两个部分,通过两阶段训练策略实现专业化和通用化。在四个科学软件的测试中,CODA平均成功率达到21.04%,显著超过传统方法,展现出良好的学习和适应能力。

谷歌DeepMind重磅发布:AI如何像人类一样学会"举一反三"?

谷歌DeepMind重磅发布:AI如何像人类一样学会"举一反三"?

谷歌DeepMind团队开发出突破性的AI元学习技术,让人工智能首次具备了类似人类的"举一反三"能力。通过结合元学习和神经网络架构自动搜索,AI系统能够快速适应全新任务,仅需传统方法十分之一的训练数据就能达到相似性能。这项技术在医疗诊断、个性化推荐等领域展现出巨大应用潜力,为AI从简单模式识别向真正智能学习的转变奠定了重要基础。