人工智能 关键字列表
中科院让AI做数学题更聪明:一种像教师和教练双重指导的新训练方法

中科院让AI做数学题更聪明:一种像教师和教练双重指导的新训练方法

中科院团队提出SRFT新方法,通过同时进行监督学习和强化学习,并使用熵感知机制动态平衡两种训练方式,让AI在数学推理任务中取得显著提升,准确率达59.1%,为AI训练提供了新的有效范式。

企业智能体扩展面临的隐形挑战与解决方案

企业智能体扩展面临的隐形挑战与解决方案

Writer首席执行官May Habib指出,企业在构建和扩展AI智能体时面临重大挑战。智能体在构建、运行和改进方式上与传统软件截然不同,需要抛弃传统软件开发生命周期。智能体不会可靠地遵循规则,而是结果导向、具备解释和适应能力。企业需要采用目标导向方法,设计业务逻辑蓝图而非工作流程。质量保证也需要评估非二元行为和实际应用表现。智能体维护需要新的版本控制系统,涵盖提示、模型设置等所有影响行为的因素。

Salesforce首席执行官:AI已承担公司近半数工作

Salesforce首席执行官:AI已承担公司近半数工作

Salesforce首席执行官马克·贝尼奥夫表示,公司正大力推进人工智能应用,AI代理现在承担了公司30%至50%的工作。他认为员工应适应AI替代人工的趋势,转向更高价值的工作。然而,这一变化导致约1000名员工被裁,虽然公司计划招聘同等数量新员工,但主要专注于销售AI技术。这一趋势在科技行业普遍存在,今年已有超过63000个科技岗位消失,AI被认为是重要原因之一。

谷歌推出AI虚拟试衣应用Doppl,让你可视化穿搭效果

谷歌推出AI虚拟试衣应用Doppl,让你可视化穿搭效果

谷歌发布实验性应用Doppl,利用AI技术让用户在数字化身上虚拟试穿不同服装。用户上传全身照片后,可通过拍摄或截图的服装图片进行虚拟试穿,应用会生成穿着该服装的虚拟形象,甚至可转换为AI视频展示效果。该应用基于谷歌购物的虚拟试衣功能开发,目前仅在美国iOS和Android平台提供。

AI初创工作室计划每年推出十万家公司

AI初创工作室计划每年推出十万家公司

亨里克·韦德林通过其新创立的Audos公司,计划利用AI技术将创业孵化规模从每年"数十家"扩展到"数十万家"。该平台专门帮助非技术背景的"普通创业者"创建百万美元AI公司,采用15%收入分成模式而非股权投资。Audos提供AI工具、最高2.5万美元资金支持和社交媒体推广服务,已在测试阶段帮助数百家企业启动,获得1150万美元种子轮融资。

浙江大学重磅发布KnowRL:让AI大模型拥有"知识边界"意识,告别胡编乱造时代

浙江大学重磅发布KnowRL:让AI大模型拥有"知识边界"意识,告别胡编乱造时代

浙江大学联合腾讯AI实验室提出KnowRL方法,通过在强化学习中集成事实性奖励机制,有效解决慢思维AI模型在推理过程中的幻觉问题。该方法在保持原有推理能力的同时,显著提升了模型的事实准确性,为构建更可靠的AI系统提供了新思路。

Amazon团队推出FiSCo:首个能揪出AI语言模型微妙偏见的"神探"系统

Amazon团队推出FiSCo:首个能揪出AI语言模型微妙偏见的"神探"系统

Amazon研究团队开发了FiSCo系统,首次实现对AI语言模型长篇回答中微妙偏见的精准检测。该系统通过分解语义声明和统计分析,能发现传统方法无法捕捉的隐性偏见,在准确率上比现有方法提升15%。实验显示主流AI模型普遍存在不同程度的群体偏见,为AI公平性评估提供了重要工具。

英伟达新突破:让电脑自己设计芯片,75%工作量不再需要人工干预

英伟达新突破:让电脑自己设计芯片,75%工作量不再需要人工干预

英伟达等机构联合开发出Spec2RTL-Agent智能系统,能直接从复杂芯片设计文档自动生成硬件代码,减少75%人工干预。该系统采用多代理协作方式,包含理解规划、渐进编程和智能反思三大模块,成功验证了人工智能在硬件设计自动化领域的重大突破。

密歇根大学新发现:给大脑装"方向盘",让AI按你的意思写代码

密歇根大学新发现:给大脑装"方向盘",让AI按你的意思写代码

密歇根大学研究团队首次破解AI编程语言选择机制,开发出G-ACT智能控制系统。该技术能精确引导AI选择C++等高性能语言,解决科学计算中AI语言偏好不当问题。实验显示控制准确率提升15%,为构建可靠AI智能体奠定基础。这项发表于2025年6月的研究标志着从"训练AI"向"控制AI"的重要转变。

YouTube推出AI轮播功能,Premium用户专享智能视频推荐

YouTube推出AI轮播功能,Premium用户专享智能视频推荐

YouTube为Premium会员推出AI生成的搜索轮播功能,可在购物和地点查询时显示相关视频序列。同时,此前仅限Premium用户的AI对话助手开始向美国普通用户开放,用户可通过"询问"按钮获得视频摘要和内容问答服务。该AI工具基于YouTube平台和网络信息运行,但准确性仍待观察。

Vertesia推出面向多步骤业务任务的自主智能体构建器

Vertesia推出面向多步骤业务任务的自主智能体构建器

企业级生成式AI应用低代码平台开发商Vertesia推出全新自主代理构建器,为业务用户提供AI代理开发部署方案。该平台让业务用户能够建立可自主完成目标的AI代理,具备思考、规划和执行复杂业务流程的能力。平台提供企业级安全性、可观测性和控制能力,支持智能内容处理和配置化生成AI任务,可处理PDF、电子表格等非结构化内容,适用于金融、零售、医疗等多个行业应用场景。

Google Gemini AI现在可以帮你填充电子表格空白单元格

Google Gemini AI现在可以帮你填充电子表格空白单元格

谷歌宣布其人工智能助手Gemini现已具备自动填充电子表格空白单元格的功能。这项新功能将帮助用户更高效地处理数据表格,通过智能分析现有数据模式,自动推断并填入缺失信息,大幅提升办公效率和数据处理准确性。

YouTube推出两款AI工具改变用户观看体验

YouTube推出两款AI工具改变用户观看体验

YouTube宣布推出两项AI功能:AI驱动的搜索工具和对话式AI助手。新搜索工具采用轮播形式,可根据用户搜索推荐相关视频片段和描述,目前仅Premium会员可测试。对话式AI工具此前仅向美国Android端Premium用户开放,现将扩展至部分非付费用户,用户可通过视频底部的Ask图标询问视频相关问题并获得内容推荐,无需中断播放。该工具将在未来几天内上线。

香港理工大学团队突破医学AI黑盒:让机器"边看边想"诊断胸片,准确率堪比专家还能解释推理过程

香港理工大学团队突破医学AI黑盒:让机器"边看边想"诊断胸片,准确率堪比专家还能解释推理过程

香港理工大学研究团队开发了突破性医学AI系统GEMeX-ThinkVG,让人工智能在分析胸片时能像医生一样详细解释诊断过程。该系统不仅能准确回答医学问题,还能标注具体的影像区域并提供完整的推理链条,解决了传统医学AI"黑盒子"问题。通过创新的强化学习训练方法,仅用八分之一数据就达到了传统方法的性能水平,为可解释医学AI开辟了新方向。

芝加哥大学突破性发现:AI模型为何越训练越"不敢冒险"?

芝加哥大学研究团队通过创新的"分支因子"测量工具,发现经过对齐训练的AI模型生成选择比原始模型减少近十倍,解释了现代AI助手回答相似的原因。研究还发现这种"保守化"在复杂推理中反而提升了稳定性,并提出了通过引导方式平衡AI可靠性与创造性的方法,为AI技术发展提供重要指导。

TPTT:让AI大模型变身"记忆超人"的神奇技术

TPTT:让AI大模型变身"记忆超人"的神奇技术

法国研究者提出TPTT框架,通过混合注意力机制和智能记忆管理,让现有AI大模型无需重训练就能获得超长文本处理能力。该技术在多个10亿参数模型上验证有效,Llama-3.2-1B精确匹配率提升20%,已开源供社区使用。

多模态AI的"审美偏见":德州农工大学团队发现,有时候糊一点的图片反而让AI表现更好

多模态AI的"审美偏见":德州农工大学团队发现,有时候糊一点的图片反而让AI表现更好

德州农工大学研究团队发现多模态AI存在"视觉质量悖论",即AI在处理略显模糊或有噪点的图片时,在推理任务上反而表现更好。研究开发了VQ-TTT技术,能动态调整图片特征以匹配AI偏好,最高提升8.6%准确率且计算开销极小。这一发现挑战了"高画质对AI更好"的传统认知,为AI优化提供新思路。

如何为AI模型部署选择合适的云GPU实例

如何为AI模型部署选择合适的云GPU实例

随着GPU成为AI工作负载训练和运营的关键,越来越多的云服务提供商开始提供云GPU实例。这为希望避免部署GPU硬件费用和复杂性的组织带来好消息。云GPU实例可按超大规模与专业化提供商、通用与专用实例、共享与独占服务器进行分类。选择时需考虑工作负载类型、GPU类型、成本、延迟和控制级别等因素。

IFS为"工业AI"劳动力戴上安全帽

IFS为"工业AI"劳动力戴上安全帽

企业云服务平台IFS收购硅谷代理AI专家theLoops,推出"工业AI"概念。该技术旨在创建具备语义环境感知能力的自主AI代理,专门服务于制造、能源、建筑等资产密集型行业。这些工业AI代理能够理解业务职责,遵循行业规则,与人类协同工作,执行实际工作任务而非简单的聊天或辅助功能,为企业带来可衡量的生产力提升和投资回报。

AI如何重塑数据中心软件架构堆栈

AI如何重塑数据中心软件架构堆栈

数据中心行业往往专注于生成式AI的物理需求,如密集GPU机架和散热需求,但却忽视了GenAI对整个软件堆栈的颠覆性影响。专家指出,软件实际上是推动变革的核心驱动力。AI将在编程自动化、企业软件重构、存储需求提升和网络安全等多个层面带来深刻变革,传统SaaS厂商面临AI原生初创企业的挑战。