斯科尔科夫科技学院等机构联合开发的G-CUT3R是一种创新的3D重建技术,通过巧妙融合相机参数、深度信息等辅助数据,显著提升了传统仅依赖RGB图像重建方法的准确性和速度。该技术采用轻量级设计和零卷积融合策略,在多…详细
这项由蚂蚁集团和浙江大学合作完成的研究,通过构建超过10000个评分表的创新训练系统,成功让30B参数的AI模型在开放性任务上超越了671B参数的顶级模型。该方法仅用5000个样本就实现了显著的性能提升,特别在情感表达…详细
谷歌DeepMind研究团队开发出革命性AI训练方法,让AI学会深度思考。通过"连续推理空间"技术,AI能在回答前进行内部分析和规划,一次性提供高质量解决方案。新方法在数学推理、逻辑分析等任务中表现显著提升,错误率明…详细
自鸿蒙5正式推送更新以来,用户在核心性能与交互体验方面均感受到显著提升,尤其对其诸多“小而美”的精细化设计赞誉有加。这些提升并非简单叠加功能,而是围绕真实使用场景,以用户体验为中心进行的深度打磨。全新控…详细
博通宣布对VMware Cloud Foundation平台进行重大升级,将私有AI服务集成到核心订阅中,并为vSAN存储虚拟化软件添加云原生对象存储支持。此举旨在满足企业对简化基础设施、高效AI采用和网络安全的需求。升级包括与英伟…详细
Google正式发布Gemini 2.5 Flash Image模型,该模型此前在测试版中被称为nanobanana。新模型为企业创意项目提供更多选择,能够快速修改图像外观并提供比以往模型更强的控制能力。该模型在保持人物相似度和编辑一致性…详细
华为即将发布AI固态硬盘,配合统一缓存管理软件,将键值缓存数据从GPU高带宽内存中转移到SSD存储,避免重复计算以提升AI处理速度。该方案采用分层缓存架构,整合GPU内存、CPU内存和SSD存储。华为还将运用XtremeLink技…详细
谷歌发布Gemini 2.5 Flash Image升级版,支持语音和文本提示生成图像,可替换照片中的人物、更改服装或合并真实图像与新背景。该工具目前仅在Gemini移动应用中提供。测试显示其处理速度极快,能在几秒内完成复杂的图…详细
Anthropic发布基于Claude AI模型的浏览器智能体研究预览版,目前向1000名Max计划订阅用户开放。用户可通过Chrome扩展与Claude在侧边栏窗口中交互,Claude能够理解浏览器上下文并代表用户执行任务。随着谷歌反垄断案临…详细
这项研究展示了一种革命性的AI技术,能够仅通过音频生成高度逼真的说话视频。滑铁卢大学研究团队开发的Audio2Photoreal系统巧妙结合了深度学习、扩散模型等先进技术,实现了声音到面部动作的精准转换。该技术在影视制…详细
腾讯和深圳大学联合开发的多视角语言理解技术取得重大突破,通过创新的训练方法让人工智能具备接近人类水平的语言理解能力。系统能准确识别讽刺、情感变化等复杂语言现象,在多项测试中表现优异,已在客服、教育、医…详细
UNC Chapel Hill研究团队发现,即使是GPT-5、o3等顶级多模态大语言模型也无法可靠识别图像旋转。通过RotBench基准测试,研究揭示这些AI模型虽能识别正常朝向和倒置图片,却完全无法区分90度与270度旋转,暴露出当前A…详细
腾讯AI Lab等机构联合研究解决了AI大语言模型的"幻觉"问题。他们开发的"迭代自调优"方法教会AI诚实承认不确定性,而非编造错误信息。实验证明该方法显著提升了AI的诚实度和可靠性,同时保持了有用性。这项突破将让AI…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。