人工智能 关键字列表
上海交大团队发布"画图变3D场景"神器:一张照片瞬间生成完整的三维世界

上海交大团队发布"画图变3D场景"神器:一张照片瞬间生成完整的三维世界

上海交通大学团队开发的SceneGen系统能够从单张照片自动生成完整3D场景,包含准确的几何结构、逼真纹理和正确的空间关系。该技术在两分钟内完成场景重建,几何精度比现有方法提升76%,为游戏开发、室内设计、虚拟现实等领域提供了革命性的内容创建工具,代码已开源供研究使用。

阿里云团队突破传统:金融AI如何学会像专家一样思考

阿里云团队突破传统:金融AI如何学会像专家一样思考

阿里云团队开发了Fin-PRM,一个专门针对金融推理的AI评判系统。该系统采用双重评判机制,既检查推理步骤准确性又评估整体合理性,并具备专业知识验证功能。通过3000个高质量样本训练,在三大应用场景中显示出显著性能提升:数据筛选提升12.9%,测试选择提升5.1%,强化学习提升5.2%,为金融AI的专业化发展提供了重要技术支撑。

卡内基梅隆大学让变形金刚学会用"压缩包"思考,AI计算速度暴涨200倍

卡内基梅隆大学让变形金刚学会用"压缩包"思考,AI计算速度暴涨200倍

卡内基梅隆大学研究团队开发出FLARE技术,这是一种革命性的AI计算方法,通过"压缩"思维过程让AI在处理复杂三维模型时速度提升200倍,准确度更高。该技术采用固定长度潜在序列路由注意力,成功突破传统自注意力机制的计算瓶颈,能在单GPU上处理百万级数据点,为工程设计、医疗器械等领域带来重大效率提升。

谷歌DeepMind发布最强AI推理模型:Gemini 2.0 Flash Thinking如何让AI学会"思考"

谷歌DeepMind发布最强AI推理模型:Gemini 2.0 Flash Thinking如何让AI学会"思考"

谷歌DeepMind于2024年12月发布的Gemini 2.0 Flash Thinking模型实现了AI领域的重大突破,让人工智能首次具备了类似人类的"深度思考"能力。该模型通过"推理时计算"技术,能在回答问题前进行内部思考和分析,在编程、数学推理、创意写作等领域表现卓越,标志着AI从"快速反应"向"深度思考"的重要转变。

当街拍照片被AI变成"数字间谍":斯坦福团队发现人脸识别技术的惊人隐私风险

当街拍照片被AI变成"数字间谍":斯坦福团队发现人脸识别技术的惊人隐私风险

斯坦福大学研究团队通过分析超过50000张公开照片,发现商业人脸识别系统能够从普通照片中推断出年龄、性别、种族、职业等大量个人隐私信息,准确率高达95%。研究揭示了不同人群面临的差异化隐私风险,并提出了技术保护、法律规范、个人防护等多层面的应对策略。这项发表于《自然·机器智能》的研究为数字时代的隐私保护提供了重要参考。

麻省理工团队揭秘:AI如何仅靠语音就能"读懂"你在什么地方说话

麻省理工团队揭秘:AI如何仅靠语音就能"读懂"你在什么地方说话

麻省理工学院研究团队开发出革命性AI技术,能够仅通过分析音频信号就准确推断出说话者所处的三维空间环境。该技术利用声音在不同空间中的独特传播特征,让AI系统像声学侦探一样重建完整的空间几何信息。在测试中,系统的空间尺寸预测精度达95%以上,声学特性匹配度超90%。这项创新为智能家居、虚拟现实、音频制作等领域带来广阔应用前景,有望让未来的智能设备真正理解和适应人类的生活环境。

大模型时代的"身份证":浙江大学团队破解AI版权保护终极难题

大模型时代的"身份证":浙江大学团队破解AI版权保护终极难题

浙江大学团队发表关于大型语言模型版权保护的综合性研究,系统梳理了文本水印、模型水印和模型指纹识别技术,提出统一的评估框架。研究涵盖内在和侵入性指纹识别方法,并首次讨论了指纹传输和移除技术,为AI模型版权保护提供了完整的技术指南和未来发展方向。

2025年美国AI初创企业百万美元融资盘点

2025年美国AI初创企业百万美元融资盘点

2025年美国AI行业延续2024年强劲融资势头,已有33家AI创业公司完成亿美元级融资轮次。其中OpenAI以400亿美元刷新融资纪录,估值达3000亿美元;Anthropic融资35亿美元,估值615亿美元。涵盖医疗AI、法律科技、基础设施、编程工具等多个细分领域。

Google AI视频编辑器Vids正式向所有用户开放

Google AI视频编辑器Vids正式向所有用户开放

Google宣布将向所有用户开放其人工智能驱动的视频编辑器Vids。该工具利用AI技术简化视频制作流程,用户可以更轻松地创建和编辑视频内容。此举标志着Google进一步扩大其AI产品的用户覆盖面,让更多人能够享受到智能化视频编辑带来的便利。

Google和Grok正逐步追赶ChatGPT竞争地位

Google和Grok正逐步追赶ChatGPT竞争地位

a16z最新AI报告显示,谷歌Gemini、xAI的Grok以及Meta AI等ChatGPT竞争对手正在缩小与OpenAI热门聊天机器人的差距。该报告展示了两年半来消费者AI产品使用情况的演变数据。谷歌首次凭借Gemini、AI Studio、NotebookLM和Google Labs四款产品进入顶级生成式AI消费网络产品榜单。移动端Gemini排名第二,月活用户约为ChatGPT的一半。

英伟达CEO:更先进AI模型将推动芯片与数据中心持续增长

英伟达CEO:更先进AI模型将推动芯片与数据中心持续增长

英伟达CEO黄仁勋在公司财报电话会议上表示,未来十年将看到显著增长机遇,预计AI基础设施支出到本世纪末可达3-4万亿美元。他指出,采用"推理"技术的新AI模型需要传统大语言模型100倍以上的计算能力,这种"长思考"模式能产生更好答案。随着代理系统和机器人模型的发展,对芯片、能源和数据中心的需求持续上升。

KAIST韩国科技院的新发现:AI能看懂越南考试题吗?答案让人意外

KAIST韩国科技院的新发现:AI能看懂越南考试题吗?答案让人意外

韩国科技院研究团队创建ViExam数据集,首次全面评估视觉语言模型在越南语多模态考试中的表现。通过2548道涵盖七个学科的题目测试,发现顶级AI模型平均准确率仅57.74%,低于人类学生66.54%的水平。研究揭示AI在多模态推理方面的局限性,为多语言AI发展提供重要参考。

AI代理的智慧升级:蚂蚁集团"原子搜索者"如何用细致思考引领深度研究新时代

AI代理的智慧升级:蚂蚁集团"原子搜索者"如何用细致思考引领深度研究新时代

蚂蚁集团研究团队提出了革命性的"原子思考"AI框架Atom-Searcher,通过将复杂推理分解为细粒度功能单元,配合精细化奖励机制,让AI学会像人类专家般深度思考。该系统在七项基准测试中均达到最优表现,不仅能进行更深入的多步推理,还展现出强大的跨领域适应能力,为AI在科研、商业、教育等专业领域的应用开辟了新前景。

卢森堡大学新研究揭秘:AI竟然比人类更善于识别道德内容

卢森堡大学新研究揭秘:AI竟然比人类更善于识别道德内容

卢森堡大学和SWPS大学研究团队通过对三个先进AI模型进行超100万次查询测试,发现AI在道德内容识别方面表现优于75%的人类标注员。研究使用贝叶斯方法处理标注分歧,分析了25万多个道德判断标注。结果显示AI的假阴性率比人类低2-4倍,证明AI具备更敏锐的道德检测能力。

天津大学发布重大突破:让机器人真正学会"用眼看,用手做"的神奇技术

天津大学发布重大突破:让机器人真正学会"用眼看,用手做"的神奇技术

天津大学研究团队开发出Embodied-R1智能机器人系统,通过创新的"指向"技术和强化学习训练,成功解决了机器人视觉理解与实际操作之间的鸿沟。该系统具备四种核心指向能力,在11项基准测试中表现卓越,在未见过的环境中实现56.2%仿真成功率和87.5%真实任务成功率,相比基线模型提升62%,展现出强大的零样本泛化能力和实用潜力。

Spotify科学家破解推荐系统难题:用一套"语义身份证"让搜索和推荐完美融合

Spotify科学家破解推荐系统难题:用一套"语义身份证"让搜索和推荐完美融合

Spotify研究团队通过系统性实验发现,传统为搜索或推荐任务单独优化的语义身份证在统一系统中存在严重的性能冲突。他们提出的多任务训练方法能够同时学习查询匹配和用户行为预测,为每个物品生成既适合搜索又适合推荐的统一身份证,在两个任务中都达到良好平衡效果,为构建下一代生成式推荐系统提供了重要技术路径。

英伟达推出GB10超级芯片 专为本地AI开发设计

英伟达推出GB10超级芯片 专为本地AI开发设计

英伟达推出基于3nm工艺的GB10超级芯片,搭载于DGX Spark工作站中。该芯片采用联发科设计的CPU和英伟达GPU通过NVLink互连,提供600GB/s双向带宽。配备128GB LPDDR5x内存,功耗仅140瓦,可支持700亿参数模型微调和2000亿参数模型推理。通过ConnectX-7网卡可实现多设备协作,为开发者提供从原型设计到生产部署的完整AI开发平台。

Broadcom将私有AI服务集成到VMware云平台

Broadcom将私有AI服务集成到VMware云平台

博通在VMware Explore大会上宣布,将AI功能直接集成到VMware Cloud Foundation软件中,无需额外费用。公司还推出新的数据管理平台,旨在提升私有云平台在AI和现代应用中的采用率。此外,博通扩大了与Canonical的合作,为开发者提供更小巧的容器镜像和预编译虚拟化GPU驱动程序,实现在Ubuntu系统上更快速、简单、安全地部署AI工作负载。

AI对就业影响的三个阶段:员工需要了解的关键信息

AI对就业影响的三个阶段:员工需要了解的关键信息

斯坦福大学新研究显示,AI正深刻影响就业市场。企业AI应用分三个阶段:第一阶段通过提升生产力减少人员需求;第二阶段利用AI提高产品产量和质量,创造更多就业机会;第三阶段开发全新AI驱动产品,建立新团队。员工应评估公司所处阶段,积极学习AI技能,寻找处于第二或第三阶段的公司和团队,提升AI应用能力以适应变化并获得竞争优势。

Anthropic推出实验性Claude AI插件可控制Chrome浏览器

Anthropic推出实验性Claude AI插件可控制Chrome浏览器

AI公司Anthropic宣布推出Claude for Chrome浏览器扩展程序试点版,允许其AI模型控制用户的谷歌Chrome浏览器。该功能仅向1000名付费用户开放测试,可帮助管理日历、安排会议和起草邮件等。然而该技术存在重大安全风险,可能遭受提示注入攻击,导致密码泄露或文件删除。测试显示恶意攻击成功率达23.6%,添加安全措施后降至11.2%。