商业办公-第24页-频道-至顶网

2025-07-22 13:23:34

计算机视觉新突破：斯坦福大学让视频生成模型学会"追踪"物体运动

斯坦福大学研究团队开发了KL-tracing方法，能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记，利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中，相比传…详细

视频生成模型光流估计零样本学习

2025-07-22 13:23:16

Amazon推出BYOKG-RAG：让智能问答系统能够自如运用任何知识图谱的突破性技术

Amazon研究团队开发的BYOKG-RAG技术通过多策略检索和迭代优化，解决了传统知识图谱问答系统难以适应不同图谱结构的问题。该技术将大语言模型与专业检索工具结合，在五个基准测试中平均提升4.5个百分点，特别适用于企…详细

知识图谱问答多策略检索迭代优化机制

2025-07-22 13:22:38

用音频"修复"残缺音乐：斯坦福团队让AI学会"脑补"音乐空白

这项来自斯坦福大学等机构的研究首次将离散扩散模型应用于音频修复领域，通过将音频转换为词汇序列，实现了对长达500毫秒音频空白的有效修复。该方法显著优于传统技术，在处理音频中断、损坏录音恢复等场景中展现出广…详细

音频修复离散扩散模型 AI音频生成

2025-07-22 13:22:22

当TikTok遇上AI：布里斯托大学团队如何让机器真正"看懂"短视频的声音与画面

布里斯托大学和Memories.ai Research联合开发了UGC-VideoCaptioner，这是首个专门针对短视频音画同步理解的AI系统。该研究构建了包含1000个TikTok视频的基准测试，采用创新的两阶段训练策略，仅用2000个样本就达到了…详细

短视频AI理解音画同步分析多模态大语言模型

2025-07-22 13:22:04

AI管家团队合作新突破：当多个机器人学会互相信任后，诊断准确率提升77%

康奈尔大学和希腊伯罗奔尼撒大学的研究团队开发了一种新型AI协作框架，让多个AI代理像人类团队一样互相信任和协作。通过建立信任评估机制和重新思考流程，在苹果叶片疾病诊断任务中，系统准确率从48.13%提升到85.63%…详细

人工智能多代理协作信任机制

2025-07-22 13:21:43

EXAONE 4.0：LG AI Research让AI能动能静，一个模型搞定快速回答和深度思考

LG AI Research发布EXAONE 4.0大型语言模型，创新性地在单一模型中集成了快速回答和深度思考两种模式。该模型支持英语、韩语、西班牙语三种语言，具备智能工具使用能力，能处理12.8万字长文本，在数学推理和编程能力…详细

人工智能大型语言模型多模态推理

2025-07-22 13:21:16

苹果公司与索邦大学联合突破：AI训练数据配方终于有了科学公式

这项由苹果公司与索邦大学合作的研究首次为AI模型训练中的数据混合问题提供了科学的数学解决方案。研究团队建立了预测公式，能够通过小规模实验准确预测大规模模型的最优数据配方，在语言、多模态和视觉三种AI模型上…详细

数据混合优化缩放定律 AI模型训练

2025-07-22 13:20:52

斯坦福大学首次揭秘：AI如何像人类一样"闲聊"却不泄露秘密

斯坦福大学研究团队开发出革命性的"差分隐私对话训练"方法，首次解决了AI训练中性能与隐私保护的矛盾。该技术通过在训练过程中添加精心计算的噪音，让AI既能流畅对话又无法泄露训练数据中的敏感信息。实验显示，使用…详细

人工智能差分隐私对话系统

2025-07-22 13:20:29

多智能体协作的新突破：ETH和Google联手让AI们学会"团队合作"

这项由ETH和Google联合开展的研究开发了AGENTSNET基准测试工具，专门评估多个AI智能体的协作能力。通过五个分布式计算问题测试，研究发现即使最先进的AI模型在大规模协作方面仍存在显著局限性，但为未来开发能够真正…详细

多智能体协作分布式计算基准测试工具

2025-07-22 11:39:08

Chrome iOS版简化工作与个人谷歌账户切换功能

谷歌宣布为Chrome iOS版推出新功能，用户可在工作和个人谷歌账户间轻松切换，无需反复登录登出。该功能支持托管账户浏览，实现严格的数据分离，工作账户的标签页、历史记录和密码等本地数据与个人浏览完全隔离。随着…详细

商用办公账户管理数据分离

2025-07-22 11:26:30

诚邀报名参会｜2025开放原子开源生态大会开源鸿蒙主题演讲即将举办

近日，北京国家会议中心二期即将迎来一场开源生态的顶级盛会——2025开放原子开源生态大会，汇聚全球开源智慧与力量，展示开源成果，促进开源协作，已吸引众多开源从业者、企业代表、开发者的高度关注。…详细

2025-07-22 10:33:15

戴尔科技数据分层策略，现代化存储的智胜之道

戴尔科技发布全新PowerScale混合与归档系列节点，面向未来存储升级，可支持更高存储密度的HAMR技术和升级计算模块。…详细

2025-07-22 10:21:40

大语言模型的认知偏见从何而来？以色列理工学院和希伯来大学揭示AI模型的"成长烦恼"

以色列理工学院和希伯来大学研究团队通过创新的"对调训练"实验，首次系统性地揭示了大语言模型认知偏见的真正来源。研究发现，AI模型的32种认知偏见主要源于预训练阶段而非微调阶段，这一发现颠覆了此前的认知，为开…详细

人工智能认知偏见预训练模型

2025-07-22 10:21:17

省钱高手的AI秘诀：约翰霍普金斯大学让千元预算生成专业级图像描述

约翰霍普金斯大学团队开发了VLV系统，仅用1000美元成本就能达到GPT-4o级别的AI图像描述效果。该系统巧妙组合现有的视觉编码器、扩散模型和语言模型，通过两阶段训练实现高质量图像描述。测试显示VLV在重建质量和人类…详细

人工智能图像描述低成本训练

2025-07-22 10:20:58

AI能否真正理解科学图表？耶鲁大学团队首次评估多模态模型的科学图表理解能力

耶鲁大学团队构建了首个科学图表理解评估基准MISS-QA，测试AI模型解读科学论文示意图的能力。通过评估18个前沿模型发现，即使最先进的AI模型准确率也仅达78.3%，远低于人类专家的89%。研究揭示了AI在图表理解、信息检…详细

人工智能多模态基准测试科学图表理解

2025-07-22 10:20:40

AI病毒变种：普渡大学团队揭示大语言模型生成恶意软件变种的惊人能力

普渡大学团队开发出LLMalMorph框架，利用大语言模型生成恶意软件变种，通过六种代码变形策略成功生成618个样本，平均检测率降低10-31%。研究揭示了AI在网络安全攻防中的双刃剑作用，为理解新兴威胁和开发防御技术提供…详细

恶意软件生成大语言模型网络安全防护

2025-07-22 10:20:20

NVIDIA发布OCR-2：用"自我批评"让AI写代码更聪明的新方法

NVIDIA研究团队开发了OCR-2系统，让AI能够像程序员一样对自己编写的代码进行"自我批评"和改进。他们构建了包含250万个编程问题-解决方案-批评组合的史上最大代码推理数据集，采用两阶段训练方法，让AI既能写代码又能…详细

人工智能代码生成自我批评机制

2025-07-22 10:19:46

哈希水印过滤器：中科院研究团队破解神经网络伪造攻击的新武器

中科院团队开发NeuralMark神经网络水印保护技术，通过哈希水印过滤器有效防止AI模型被伪造和盗用。该方法在13种架构上实现100%检测率，同时保持模型性能不受影响，为价值数千万美元的AI模型提供了强有力的知识产权保…详细

人工智能神经网络水印哈希过滤器

2025-07-22 10:19:30

让大语言模型学会理性思考：阿姆斯特丹大学团队的逻辑推理新突破

阿姆斯特丹大学团队提出突破性方法，通过双向事实评估和副一致逻辑，让大语言模型在存在矛盾信息时仍能进行可靠推理。研究创新性地将LLM知识直接整合到逻辑推理核心，构建了首个能够处理不确定性和矛盾的"贝尔纳普计…详细

神经符号学习副一致逻辑 LLM推理优化

2025-07-22 10:19:12

ByteDance突破性AI技术：DreamPoster让每个人都能设计出专业级海报

ByteDance智能创作实验室开发的DreamPoster系统，能够根据用户提供的图片和文字描述自动生成专业级海报设计。该系统通过创新的数据处理管道、渐进式训练策略和多模态架构，在用户满意度测试中达到88.55%的高分，远超…详细

人工智能海报设计图像生成

华为云数字化转型秘籍调研

业界热点: