这项由上海人工智能实验室、南京大学和中科院深圳先进技术研究院联合完成的研究,开发了全球首个专门测试AI长视频推理能力的评估平台VRBench。该平台包含1010个多语言长视频和超过9000个多步推理问答对,创新性地采用…详细
下一波数字化转型浪潮由智能体AI驱动。与简单回答问题或生成内容不同,AI智能体能够以最少的人工干预执行复杂的多步骤任务。它们可以执行从日常任务协助到创建和自动化新业务流程的广泛任务。最好的是几乎任何人都能…详细
中国AI初创公司MiniMax发布最新开源大语言模型MiniMax-M1,采用Apache 2.0许可证,支持商业应用。该模型拥有100万输入token和8万输出token的超大上下文窗口,采用创新的混合专家架构和强化学习技术。训练成本仅53.47…详细
企业数据基础设施正从回答"发生了什么"转向支持AI实时决策。传统架构无法满足AI对语义理解的需求,知识图谱通过节点和边的方式组织信息,提供实体间的关系和上下文。谷歌十多年的知识图谱实践表明,从"字符串到实体"…详细
LibreOffice项目准备削减部分Windows支持,并鼓励用户转向Linux。文档基金会在博客中强调Windows 10即将终止支持,建议考虑Linux和LibreOffice。即将发布的LibreOffice 25.8版本将取消Windows 7和8/8.1支持,并弃用3…详细
安全研究人员发现,Salesforce行业云客户容易因配置错误导致攻击者获取加密客户信息、会话数据、凭证和业务逻辑。该平台的低代码工具OmniStudio存在20个配置风险,包括访问控制检查缺失、工作流可被外部用户执行、缓…详细
韩国KAIST团队首次提出文字感知图像修复技术,解决了传统图像修复无法准确恢复文字内容的难题。研究构建了包含10万张图像的SA-Text数据集,开发了TeReDiff模型,通过三阶段训练和智能提示机制,实现图像修复与文字识…详细
斯坦福研究员发现,AI模型无需复杂"改造"就能获得新技能,只需观察少量例子即可模仿专业训练效果。这种"情境学习"方法大幅降低了AI应用门槛,文本生成需数千例子,分类任务仅需数百例子,有望让普通用户轻松定制专属…详细
中山大学研究团队开发了SWE-Factory自动化系统,通过四个AI助手协作完成GitHub问题解决环境构建。系统利用程序退出码实现自动评分,解决了传统手工方法费时费力的问题。实验显示能以低成本自动构建数百个有效测试实例…详细
清华大学研究团队提出VERIF方法,通过结合代码验证和大语言模型验证解决AI指令遵循中的验证难题。该方法构建22000实例数据集VERINSTRUCT,将约束分为硬性和软性两类分别处理,在多个基准测试中显著提升模型性能,同时…详细
这项由西南大学和新加坡国立大学联合完成的研究,首次建立了全球最大规模的验证码攻防测试平台MCA-Bench。研究发现AI在简单视觉识别任务上成功率超96%,但在交互式操作任务上仅为2.5-55%,揭示了当前AI技术的能力边界…详细
FuriosaAI团队提出突破性的Draft-based Approximate Inference框架,通过小模型预测指导大模型智能管理资源。研究开发了SpecKV和SpecPC两种方法,分别用于KV缓存管理和文本压缩,在保持高准确性的同时显著降低内存使…详细
上海交大团队发现多模态AI在数学推理中存在视觉信息利用不充分的问题,纯文本模型配合图像描述竟能超越直接处理图像的多模态模型。研究提出三种视觉扰动策略:分心物拼接、保持主导混合和随机旋转,通过增加适当的视…详细
CrowdStrike在AWS re:Inforce 2025大会上发布Falcon for AWS Security Incident Response服务,为AWS客户提供AI驱动的网络安全事件响应。该服务基于CrowdStrike Falcon平台,可检测威胁速度提升96%,事件调查速度快6…详细
研究人员专注创新而不受商业约束限制,这种思维对企业和首席信息官具有重要价值。CoVent联合创始人兼首席技术官Krishna Dubba结合研究背景和商业实践经验,从AI研究到创业公司,展示了研究思维如何帮助快速验证假设、…详细
英国卫生大臣宣布,作为NHS十年计划的一部分,将在NHS应用中整合临床试验注册功能,让数百万英国民众能够通过应用搜索并参与临床研究。该举措旨在扭转英国在全球临床研究领域地位下滑的趋势,2017至2021年间新研究启…详细
NTT Data 2024年调查显示,80%的企业认为过时技术阻碍了创新能力。战略科技合作伙伴可通过六种方式加速创新:明确创新战略、优化现有流程、替换过时技术、识别新市场机会、快速获取新兴技术、缩短产品上市时间。合作…详细
记者近日获悉,中国联通软件研究院(以下简称“联通软研院”)通过采用OceanBase一体化数据库,完成数据库智能专家ChatDBA的底层架构升级。…详细
这项研究揭示了大语言模型推理中的一个重要问题:数值精度会显著影响结果的可重现性。研究团队发现,即使使用相同设置,不同硬件配置下模型输出可能截然不同,准确率差异可达9%。他们提出了LayerCast解决方案,在保持…详细
UC伯克利大学研究团队发现,当前先进的视觉语言AI模型虽然拥有强大的视觉识别能力,但在实际应用中却无法有效利用这些视觉信息。研究通过对比AI视觉系统的直接表现与完整系统的表现,发现存在巨大的性能差距,AI往往…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。