耶鲁大学团队构建了首个科学图表理解评估基准MISS-QA,测试AI模型解读科学论文示意图的能力。通过评估18个前沿模型发现,即使最先进的AI模型准确率也仅达78.3%,远低于人类专家的89%。研究揭示了AI在图表理解、信息检…详细
普渡大学团队开发出LLMalMorph框架,利用大语言模型生成恶意软件变种,通过六种代码变形策略成功生成618个样本,平均检测率降低10-31%。研究揭示了AI在网络安全攻防中的双刃剑作用,为理解新兴威胁和开发防御技术提供…详细
NVIDIA研究团队开发了OCR-2系统,让AI能够像程序员一样对自己编写的代码进行"自我批评"和改进。他们构建了包含250万个编程问题-解决方案-批评组合的史上最大代码推理数据集,采用两阶段训练方法,让AI既能写代码又能…详细
中科院团队开发NeuralMark神经网络水印保护技术,通过哈希水印过滤器有效防止AI模型被伪造和盗用。该方法在13种架构上实现100%检测率,同时保持模型性能不受影响,为价值数千万美元的AI模型提供了强有力的知识产权保…详细
阿姆斯特丹大学团队提出突破性方法,通过双向事实评估和副一致逻辑,让大语言模型在存在矛盾信息时仍能进行可靠推理。研究创新性地将LLM知识直接整合到逻辑推理核心,构建了首个能够处理不确定性和矛盾的"贝尔纳普计…详细
ByteDance智能创作实验室开发的DreamPoster系统,能够根据用户提供的图片和文字描述自动生成专业级海报设计。该系统通过创新的数据处理管道、渐进式训练策略和多模态架构,在用户满意度测试中达到88.55%的高分,远超…详细
AMD Ryzen 5 PRO 8600G(以下简称“8600G”)与Intel Core i5-14500(以下简称“14500”),探寻谁才是主流商用办公场景下的更优选择?…详细
全球关键数字基础设施领导者维谛 (Vertiv, NYSE: VRT) 于2025年7月21日宣布,任命沈威为大中华区总裁,此任命自2025年7月22日起生效。…详细
PeopleTec公司研究人员发现了一种新型网络攻击方式,能够在网站图标的透明度通道中隐藏恶意代码。这种攻击完全无声无息,利用浏览器自动下载图标的标准行为,在用户访问网站时自动执行恶意程序。研究显示全球每天有数…详细
清华大学研究团队在IEEE Transactions on Affective Computing发表突破性研究,提出双重学习策略让AI准确识别人类面部情感。新方法结合判别性和生成性学习,在多个标准数据集上准确率显著提升3-4个百分点,特别在处理…详细
OpenAI宣布其最新实验性推理大语言模型在2025年国际数学奥林匹克竞赛中达到金牌水平。尽管机器在数学推理、代码生成等认知任务上表现卓越,但这并不意味着它们具备真正的智能。机器缺乏知识迁移能力、情感理解、自我…详细
最新研究显示,通过运用心理学技巧和巧妙措辞,可以有效操控生成式AI突破其原有约束。研究发现,使用权威性、互惠性等7种心理学说服原理,能让AI违规回应的几率从33.3%提升至72%。心理学专业人士在操控AI方面可能具有…详细
人工智能技术正经历重大转变,从传统的聊天机器人形态逐步向浏览器集成发展。这种趋势反映了AI应用场景的扩展,用户可以在浏览器环境中直接体验智能功能,无需依赖独立的聊天界面。浏览器作为用户日常工作的核心平台…详细
复旦大学研究团队通过深入调查发现,广受关注的Qwen模型在数学推理任务中的异常表现实际上源于数据污染问题。研究证实,当使用未污染的测试数据时,只有准确的奖励信号才能真正提升模型性能,揭示了AI评估体系中的重…详细
清华大学与上海人工智能实验室联合开展的这项研究发现,即使是最先进的AI模型如DeepSeek-R1,在同时处理多个问题时性能也会显著下降。研究团队开发了REST压力测试框架,通过对34个大型推理模型的测试,揭示了AI在多任…详细
电商平台Pietra推出AI助手套件,旨在帮助创始人管理品牌运营的复杂性。这些AI工具可处理供应商联系、库存跟踪、营销推广、订单履约和数据分析等电商核心环节,全年无休运转。系统通过品牌数据库积累知识,将原本需要…详细
LG AI研究院发布了两个全新的韩国AI专业能力测试基准KMMLU-REDUX和KMMLU-PRO,通过真实的职业资格考试题目评估AI的专业能力。研究发现AI在医学领域表现较好,但在法律等地域性强的专业领域仍有不足,为AI的专业化发展…详细
这项由东京大学、京都Rist公司和Sakana AI合作完成的研究提出了一种创新的AI数学推理训练方法。通过将监督学习和强化学习巧妙结合,先用长期监督学习提高准确率,再用强化学习优化效率,成功实现了"又准又快"的目标。…详细
香港大学团队开发了EmbRACE-3K数据集,专门训练AI系统在复杂环境中进行推理和行动。该数据集包含超过3000个任务和26000个决策步骤,每步都有详细的推理标注。实验显示,现有先进AI模型在需要主动探索和环境交互的任务…详细
斯坦福大学对超过100种职业的15000名员工进行调研,了解他们对AI在工作场所应用的真实看法。研究发现45%的受访者担心AI可靠性,23%担心失业。员工倾向于将重复性、繁琐的任务交给AI处理,以腾出时间专注其他工作。研…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。