人工智能 关键字列表
科学家找到让AI模型变聪明的新方法:哈佛团队发现记忆也需要"忘记"的艺术

科学家找到让AI模型变聪明的新方法:哈佛团队发现记忆也需要"忘记"的艺术

哈佛大学研究团队在NeurIPS 2024上发表重要研究,解决了AI模型在处理敏感数据时面临的隐私保护难题。该研究首次将差分隐私技术与上下文学习结合,开发出自适应隐私保护机制,能够根据数据敏感程度动态调整保护强度。实验证明,新方法在保持严格隐私保护的同时,让AI模型学习效果提升15-20%,为医疗、金融、教育等领域的AI应用提供了安全可靠的技术方案。

Intuit如何从聊天机器人失败走向企业智能体成功

Intuit如何从聊天机器人失败走向企业智能体成功

Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。

马斯克的Grok推出新编程模型,主打高速开发

马斯克的Grok推出新编程模型,主打高速开发

马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。

跳过无聊部分:Google Photos AI自动高亮视频精彩瞬间

跳过无聊部分:Google Photos AI自动高亮视频精彩瞬间

谷歌相册推出"关键时刻"新功能,运用AI技术自动识别视频中最精彩的片段。该功能可在时间轴上高亮显示引人入胜的内容,用户只需轻点即可跳转至这些时刻并保存为独立片段。AI能够识别至少10秒视频中的欢乐、怀旧或视觉丰富的瞬间。功能将于9月推出,安卓用户率先体验,iOS版本稍后跟进。

AI能读取思维——脑机接口技术实现74%准确率解码内心语言

AI能读取思维——脑机接口技术实现74%准确率解码内心语言

最新研究显示,脑机接口技术成功解码内心语言,准确率达74%。该系统直接接入运动皮层,将想象的句子转换为文本,无需唇部运动或手势。研究对象为ALS患者和瘫痪人群,系统通过关键词触发开始解码私人思维独白。这项突破为失语患者带来尊严恢复的希望,但同时引发思维监控的担忧。技术要求在设计中内置同意机制,保护思维隐私,确保只有用户选择分享的内容才会成为数据。

GSI如何在企业AI竞赛中脱颖而出

GSI如何在企业AI竞赛中脱颖而出

企业AI革命正处于关键转折点,从生成式AI实验转向实际部署,而代理AI成为下一个前沿。然而MIT报告显示95%的生成式AI试点项目未能产生有意义的结果。全球系统集成商(GSI)正成为企业AI运营化的关键连接组织。NTT Data等领先GSI通过行业专业知识、集成能力和全球交付能力,与Google Cloud、Microsoft、Mistral AI等建立战略合作,帮助企业克服技术整合、合规管理和ROI实现等挑战,成为AI规模化部署的重要推动者。

斯坦福大学团队揭秘:AI如何像人类一样"看懂"物理世界的运动规律

斯坦福大学团队揭秘:AI如何像人类一样"看懂"物理世界的运动规律

斯坦福大学研究团队开发出突破性AI系统,能像人类婴儿一样通过观察学习物理规律。该系统采用分层学习策略,先掌握基本物理概念再组合运用,将传统方法的二次内存复杂度大幅降低。在50个物体的复杂场景中,新系统内存消耗仅为传统方法的几分之一,且预测精度更高。系统还能自发发现物理概念如动量守恒,并具备良好的环境适应性和可解释性,为机器人控制、游戏引擎等应用带来新突破。

斯坦福大学突破性发现:AI大模型其实并没有真正"理解"语言

斯坦福大学突破性发现:AI大模型其实并没有真正"理解"语言

斯坦福大学研究团队通过精密实验发现,当前最先进的AI大模型并未真正"理解"语言,而是在进行复杂的模式匹配。当问题表述方式改变时,模型错误率激增至60%以上。这项发表于《Nature Machine Intelligence》的研究揭示了AI智能的本质局限,为合理应用AI技术提供了重要指导,强调在关键决策中仍需人类专家监督。

苹果新研究:让AI模型变身数学天才的神奇训练法

苹果新研究:让AI模型变身数学天才的神奇训练法

苹果研究团队开发了GSM-Symbolic测试框架,揭示了当前先进AI模型在数学推理方面的重大缺陷。通过改变题目表述和添加无关信息,研究发现AI模型更依赖模式记忆而非真正推理,准确率显著下降10-20%。这项研究改变了AI能力评估方式,对教育和商业应用提出新要求,为未来AI发展指明了注重抽象思维培养的方向。

沃尔玛智能体AI战略升级:Element平台与开发者"超级智能体"Wibey亮相

沃尔玛智能体AI战略升级:Element平台与开发者"超级智能体"Wibey亮相

沃尔玛正对其Element机器学习平台进行重大智能代理升级,并推出面向软件开发的"超级代理"Wibey。升级后的Element平台具备状态架构,能够跟踪代理的行为、对话和意图,使代理在跨系统工作流中保持上下文。Wibey作为第五个超级代理,可解释用户意图并将命令路由到适当的工具和API,为开发者提供统一入口。该平台支持标准化通信协议,实现代理间协调,并能管理智能代理的完整生命周期。

英伟达财报后加速推进机器人与自动化布局

英伟达财报后加速推进机器人与自动化布局

英伟达第三季度营收540亿美元,超出分析师预期。尽管对华H20芯片销售面临限制,但公司在自动驾驶和机器人领域持续发力。其Drive AV平台整合传感器融合技术,Jetson AGX Thor机器人平台性能大幅提升,Halos安全认证项目获得权威机构支持,Cosmos世界模拟平台为AI训练提供超逼真环境。英伟达正从硬件供应商转型为自动化解决方案提供商。

软件占据网络安全预算40%,生成式AI攻击速度达毫秒级

软件占据网络安全预算40%,生成式AI攻击速度达毫秒级

Forrester最新报告显示,软件支出已占网络安全预算的40%,超过硬件的15.8%和人员成本的29%。面对生成式AI攻击毫秒级执行速度,而平均识别时间却长达181天的现实,企业正加速整合安全平台。55%的安全决策者预计未来12个月预算将显著增长,其中15%预期增幅超10%。量子计算威胁和机器身份数量激增45:1比例,迫使企业重新构建防御架构。

Sakana AI推出M2N2算法,无需昂贵重训练即可构建强大AI模型

Sakana AI推出M2N2算法,无需昂贵重训练即可构建强大AI模型

日本AI实验室Sakana AI开发出名为M2N2的新型进化技术,让开发者能够在不进行昂贵训练和微调的情况下增强AI模型能力。该技术突破了其他模型融合方法的局限性,甚至可以从零开始进化出全新模型。M2N2适用于大语言模型和文本到图像生成器等不同类型的机器学习模型,为企业构建定制AI解决方案提供了高效途径。

Google Pixel 10系列:AI驱动的智能手机进化

Google Pixel 10系列:AI驱动的智能手机进化

谷歌Pixel 10系列搭载新一代Tensor G5处理器,专为机器学习性能优化。该系列突破传统硬件竞赛思维,将AI深度集成到日常交互中,提供情境感知的智能助手体验。新增Magic Cue功能可主动提供相关建议,Gemini Nano实现设备端AI翻译和实时摄影指导。承诺七年系统更新,让设备随AI模型演进而持续升级,代表智能手机向感知、辅助和适应方向发展的新趋势。

VAST为SK电讯主权AI基础设施提供存储支持

VAST为SK电讯主权AI基础设施提供存储支持

VAST Data宣布SK电信在其主权AI基础设施的GPU即服务(GPUaaS)项目中采用了其存储解决方案。SK电信推出了基于超过1000个英伟达Blackwell GPU的"海印"集群,提供主权AI基础设施服务。该项目是SK电信成为全球AI公司战略的重要组成部分,获得了韩国科学技术情报通信部AI计算资源利用基础增强项目的支持。VAST的AI操作系统帮助SK电信实现了从传统裸机部署向完全虚拟化生产级AI云的转型。

微软推出自研AI模型,欲减少对OpenAI依赖

微软推出自研AI模型,欲减少对OpenAI依赖

微软发布两款内部训练的AI模型:MAI-Voice-1自然语音生成模型和MAI-1-preview大语言模型。后者专门为Copilot聊天机器人设计,使用约15000块英伟达H100 GPU训练。此举被视为微软减少对OpenAI依赖的努力,尽管两家公司仍保持投资关系。新模型更专注于消费者应用场景,MAI-Voice-1已在Copilot Daily使用,MAI-1-preview将逐步部署到Copilot文本功能中。

本地大语言模型崛起:为何用户开始选择自主部署AI

本地大语言模型崛起:为何用户开始选择自主部署AI

随着AI服务成本上升和数据隐私担忧加剧,越来越多用户开始尝试本地部署大语言模型。硬件性能提升和软件工具优化使得在个人设备上运行AI模型变得可行。通过量化技术降低模型精度要求,配合llama.cpp等开源工具,用户可在消费级硬件上运行各类专业模型。虽然本地模型在通用性上仍逊色于云端大模型,但在特定场景下已能满足需求,且在隐私保护和成本控制方面优势明显。

南洋理工大学重磅突破:让AI同时"造梦"第一视角视频和人体动作

南洋理工大学重磅突破:让AI同时"造梦"第一视角视频和人体动作

新加坡南洋理工大学研究团队开发出EgoTwin系统,这是首个能够根据文字描述同时生成第一人称视频和匹配人体动作的AI框架。该系统通过创新的头部中心动作表示方法和因果交互机制,解决了视角对齐和动作画面同步的核心难题,在17万样本的真实数据集上实现了显著性能提升,为VR内容创作、影视制作等领域提供了新的技术可能。

复旦大学团队让机器人学会"速成版"人体姿态计算:从反复试错到一次搞定的神奇突破

复旦大学团队让机器人学会"速成版"人体姿态计算:从反复试错到一次搞定的神奇突破

复旦大学与上海人工智能实验室联合开发的Learnable SMPLify技术,将传统人体姿态计算的耗时从12秒缩短至0.06秒,实现200倍速度提升。该方法通过神经网络学习姿态转换规律,摒弃传统反复优化策略,采用时间序列数据构造、人体中心坐标标准化和残差学习等创新设计,在保持高精度的同时大幅提升计算效率,为VR、游戏制作、体育训练等领域提供实用解决方案。

看不见的语言背后:语音如何透露说话者的种族身份

看不见的语言背后:语音如何透露说话者的种族身份

布朗大学和普林斯顿大学研究团队发现,自动语音识别系统能够仅凭语音特征推测说话者的种族身份,并且对不同种族群体表现出不同的识别准确性。研究揭示了这种现象的技术机制,发现系统在学习语音内容的同时无意中学会了种族特征识别。研究团队提出了包括改进训练数据多样性、开发去偏见算法等多种解决方案,强调了在人工智能发展中考虑公平性的重要性。