人工智能 关键字列表
从保护到攻击:卡内基梅隆大学团队让AI模型学会"藏私"的巧妙方法

从保护到攻击:卡内基梅隆大学团队让AI模型学会"藏私"的巧妙方法

卡内基梅隆大学研究团队开发出"反蒸馏采样"技术,能让AI模型在保持正常性能的同时,阻止竞争对手通过观察推理过程来复制模型能力。这种方法巧妙地在模型输出中加入"毒性"内容,对人类用户无害但会干扰机器学习过程,为AI公司提供了新的知识产权保护手段。

新加坡国立大学最新突破:让AI当法官,推理能力决定评判准确性

新加坡国立大学最新突破:让AI当法官,推理能力决定评判准确性

新加坡国立大学研究团队开发了JudgeLRM,一个专门用于评判AI系统表现的模型。研究发现传统训练方法在需要复杂推理的评判任务上效果较差,因此采用强化学习训练JudgeLRM,使其具备真正的推理能力。JudgeLRM-3B甚至超越GPT-4,JudgeLRM-7B击败DeepSeek-R1,在推理密集型任务上表现尤为突出,为AI评估领域带来范式转变。

Anthropic推出专为金融服务设计的Claude专业版

Anthropic推出专为金融服务设计的Claude专业版

Anthropic推出首个行业定制版AI产品Claude for Financial Services,专为金融行业打造。该服务基于Claude企业版,提供更高使用限制、内置数据连接器以及提示词库。新版本预装了连接FactSet、PitchBook等金融数据提供商的MCP连接器,并包含实施支持。针对金融分析师工作负载大的特点,该服务显著提升了速率限制,同时提供提示词库帮助用户更好地构建查询。

AI编程工具正向终端转移:生成式AI的新趋势

AI编程工具正向终端转移:生成式AI的新趋势

多年来,Cursor、Windsurf和GitHub Copilot等代码编辑工具一直是AI编程的标准。但随着代理AI能力增强,AI系统正从处理代码转向直接与系统终端交互。Anthropic、DeepMind和OpenAI都推出了命令行编程工具。终端工具采用更广阔视角,不仅关注代码,还涉及整个程序运行环境,包括DevOps任务。研究显示传统代码助手可能降低效率,而Warp等终端工具在TerminalBench基准测试中表现出色,能够自主处理开发者的非编码工作。

研究领导者呼吁科技行业监控AI的"思维"过程

研究领导者呼吁科技行业监控AI的"思维"过程

来自OpenAI、谷歌DeepMind、Anthropic等公司的AI研究人员发表联合立场文件,呼吁深入研究监控AI推理模型"思维链"的技术。思维链是AI模型解决问题的外化过程,类似人类使用草稿纸解题。研究人员认为思维链监控可能是控制AI智能体的核心方法,但这种透明度可能是脆弱的,需要更多研究来保持其可监控性。

Broadcom推出Tomahawk Ultra:以太网能否取代UALink?

Broadcom推出Tomahawk Ultra:以太网能否取代UALink?

博通推出Tomahawk Ultra交换芯片,主张以太网技术可替代新兴的UALink协议。该51.2 Tbps交换ASIC专门针对高性能网络调优,延迟低至250纳秒,支持1024个加速器的扩展系统。博通认为以太网在监控、遥测和调试工具方面具有优势,无需等待UALink硬件开发完成。相比之下,AMD等厂商仍在推进UALink协议,目前通过以太网隧道传输UALink来实现机架级系统部署。

自主性、服务区域、通用性 - 真正机器人出租车的核心要素

自主性、服务区域、通用性 - 真正机器人出租车的核心要素

随着多家公司进入机器人出租车领域,如何判断其技术成熟度成为关键问题。真正的机器人出租车需要满足五个基本要求:无需人工监督的安全自主驾驶、在公共道路运营、商业可行的服务区域、向公众开放服务,以及提供点对点的通用出行服务。其中最关键的是实现"押注生命"级别的安全自主驾驶,这要求系统能连续完成10万次驾驶而无重大事故。

C-Gen.AI推出GPU编排平台,旨在提升AI数据中心效率

C-Gen.AI推出GPU编排平台,旨在提升AI数据中心效率

人工智能基础设施初创公司C-Gen.AI推出新平台,帮助数据中心运营商自动化部署并最大化利用昂贵的AI硬件资源。该GPU编排平台能够在几分钟内自动部署AI集群,实时监控并确保最高效率运行。通过动态重新分配闲置GPU资源处理推理任务,平台确保资源零浪费,为AI初创企业、数据中心运营商和大型企业提供可扩展的成本效益解决方案。

Nextdoor推出AI推荐功能重新设计应用界面

Nextdoor推出AI推荐功能重新设计应用界面

邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。

英国生物银行完成NHS全身成像项目创纪录成就

英国生物银行完成NHS全身成像项目创纪录成就

英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。

北京大学团队首次全面评估GPT-4o图像生成能力:AI绘画竞赛中的新冠军诞生

北京大学团队首次全面评估GPT-4o图像生成能力:AI绘画竞赛中的新冠军诞生

这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。

Meta推出ReasonIR-8B:让AI"懂推理"的智能检索系统问世

Meta推出ReasonIR-8B:让AI"懂推理"的智能检索系统问世

Meta推出首个专门针对推理任务的智能检索系统ReasonIR-8B,突破传统关键词匹配局限,能真正理解复杂问题并找到有助解决问题的信息。该系统通过创新的ReasonIR-Synthesizer训练方法,在推理密集型检索任务上创下新纪录,计算效率比传统方法提升200倍。技术已开源,为教育、医疗等领域带来智能化信息检索新可能。

仅需9美元:南加州大学团队开发"超小型"推理模型,挑战大型AI的成本壁垒

仅需9美元:南加州大学团队开发"超小型"推理模型,挑战大型AI的成本壁垒

南加州大学团队开发出革命性的"Tina"AI模型,仅用9美元训练成本就能达到与昂贵大型模型相媲美的数学推理能力。通过LoRA技术和15亿参数的精简设计,该研究将AI推理模型的训练成本降低了260倍,实现了真正的AI技术民主化,让个人研究者和小型团队也能负担得起高质量推理模型的开发。

突破传统边界:上海AI实验室提出首个完全无监督的大模型推理自我训练框架

突破传统边界:上海AI实验室提出首个完全无监督的大模型推理自我训练框架

本研究提出了Genius框架,这是首个完全无监督的大语言模型推理自训练方法。该框架通过前瞻性重采样策略让模型在推理时"深谋远虑",并使用优势校准优化损失函数处理训练噪声。仅用25K无标注数据,Genius就将LLaMA3.1-8B在推理任务上的平均性能提升超过7%,为AI推理能力的大规模提升开辟了新道路。

AI奖励模型也能"临时抱佛脚"?DeepSeek团队发现让AI在推理时多动脑筋,效果竟比增加训练数据更好

AI奖励模型也能"临时抱佛脚"?DeepSeek团队发现让AI在推理时多动脑筋,效果竟比增加训练数据更好

DeepSeek团队联合清华大学开发了一种革命性的AI评判方法——自主原则批评调优(SPCT),该方法让AI在推理时"多动脑筋",通过制定评判原则并进行多角度分析来提升评判准确性。研究发现,这种"慢思考"方式的效果竟然比简单增加模型规模更好,在多个评测基准上都取得了显著性能提升,为AI发展提供了新的技术路径。

Meta首次突破:AI注意力机制终于学会"一心多用",让计算机能同时关注多个线索

Meta首次突破:AI注意力机制终于学会"一心多用",让计算机能同时关注多个线索

Meta公司FAIR实验室的研究团队提出了多令牌注意力机制,这是一种突破性的AI注意力计算方法。通过引入卷积操作,新机制让AI能够同时关注文本中的多个位置并协调整合信息,解决了传统注意力机制"一心一用"的根本局限。在大规模语言模型和长文本任务中,该技术显著提升了AI的信息检索和理解能力。

海外AI实验室首次破解R1-Zero训练谜题:原来这些神奇的AI推理能力是这样炼成的

海外AI实验室首次破解R1-Zero训练谜题:原来这些神奇的AI推理能力是这样炼成的

新加坡联合研究团队首次全面解析R1-Zero训练方法,发现传统算法存在隐藏偏差,提出改进版Dr. GRPO算法。研究揭示AI"自我反思"能力的真相,并用极简配方在7B模型上创造AIME 2024新纪录,为AI推理训练提供重要洞察和实用改进方案。

Meta建设5GW超大规模AI数据中心抢占AI竞赛先机

Meta建设5GW超大规模AI数据中心抢占AI竞赛先机

Meta正在建设名为Hyperion的数据中心,预计提供5千兆瓦算力支持其AI实验室。该项目占地面积足以覆盖曼哈顿大部分区域,位于路易斯安那州东北部,将在数年内扩展至5GW规模。此外,Meta还计划在2026年启用1GW的Prometheus超级集群。这些项目旨在提升Meta在AI竞赛中对抗OpenAI和谷歌的竞争力,但也将消耗大量电力和水资源。

Google为NotebookLM添加精选笔记本功能,涵盖多元化主题内容

Google为NotebookLM添加精选笔记本功能,涵盖多元化主题内容

谷歌为其AI驱动的NotebookLM平台新增"精选笔记本"功能,与全球知名作者、研究人员、出版物和非营利组织合作创建高质量互动资源。首批精选笔记本涵盖长寿建议、2025年预测、人生建议和莎士比亚作品等主题。用户可通过聊天界面提问、查看AI生成的摘要、音频概览或流程图与内容互动。该功能在桌面版NotebookLM中已上线,未来将持续增加更多精选内容。

GPT-4o真的能统一图像生成和理解吗?UCLA研究团队揭示多模态AI的"阿喀琉斯之踵"

GPT-4o真的能统一图像生成和理解吗?UCLA研究团队揭示多模态AI的"阿喀琉斯之踵"

UCLA研究团队通过三个维度的测试发现,GPT-4o虽然能生成高质量图像,但在抽象推理、规则遵循和逻辑判断方面存在严重局限。研究揭示了当前多模态AI"表面聪明,深层糊涂"的问题,挑战了关于统一视觉理解与生成能力的假设,为AI发展提供了重要警示。