科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-08-07 11:12:08
为什么机器人最终学会"偷懒"反而更聪明?——田纳西理工大学重新定义探索与利用的关系

田纳西理工大学研究发现,在特定条件下,纯粹追求短期利益的人工智能反而会自发表现出探索行为。研究通过多臂老虎机和网格世界实验证实,当环境具有重复结构且智能体拥有足够记忆时,贪婪策略能够产生类似Thompson采…详细

元强化学习探索利用平衡记忆增强架构

2025-08-07 11:11:55
AI模型也要学会精打细算:宾夕法尼亚大学团队揭示多阶段任务中的智能计算预算分配秘诀

宾夕法尼亚大学研究团队开发了AgentTTS系统,解决多阶段AI任务中的计算资源分配难题。通过发现不同子任务对模型大小的偏好差异、最优预算点存在性和子任务间相互依赖关系三个关键规律,该系统能智能分配计算预算,在…详细

人工智能测试时缩放优化模型

2025-08-07 11:11:38
港科大团队让AI注意力机制学会"挑重点":动态掩码稀疏注意力让大模型更聪明更高效

港科大团队提出的动态掩码稀疏注意力机制通过内容感知的动态掩码生成和位置感知的稀疏计算,让大语言模型学会智能分配注意力资源。该方法在保持完整信息的同时大幅降低计算复杂度,在长序列处理中实现10倍以上加速,…详细

人工智能稀疏注意力计算优化

2025-08-07 11:11:25
腾讯AI实验室打造全新开源智能体框架:让AI助手真正走向免费开放

腾讯AI实验室推出认知内核-专业版,这是首个完全开源且几乎免费的AI智能体框架。该框架通过创新的分层架构和统一接口设计,最大化利用大语言模型能力,避免对昂贵专有工具的依赖。研究团队还训练了8B参数的CK-Pro-8B…详细

人工智能智能体框架开源模型

2025-08-07 11:11:08
打破语言和视觉边界:斯图加特团队创造首个跨语言多模态AI测试基准

这项由意大利布鲁诺·凯斯勒基金会等机构联合完成的研究创建了首个跨语言多模态AI评测基准MCIF,涵盖英德意中四种语言,包含文字、语音、视频三种模态和13项任务。通过对21个先进AI模型的测试,发现AI在长文本处理、…详细

人工智能多模态处理跨语言评估

2025-08-07 11:10:49
三星SAIL实验室开发AI游戏制作神器:让电脑学会看着录像来改进自己做的游戏

三星SAIL实验室开发了一套AI游戏制作系统,包含评测器AVR-Eval和制作器AVR-Agent。系统能通过观看游戏录像来评判质量,并基于反馈不断改进游戏。测试显示该方法比一次性生成效果好79.2%,但AI目前还不能有效利用外部…详细

人工智能游戏开发多模态评估

2025-08-07 10:32:14
三大AI巨头同时发布新模型:OpenAI、Anthropic、Google齐亮剑

三家AI巨头同时发布重磅新模型。OpenAI推出首批开放权重模型OSS 120b和OSS 20b,具备Apache许可证,大模型推理能力与o4-mini相当,小模型可在智能手机运行。Anthropic发布Claude Opus 4.1,在代码编程和推理任务上显…详细

人工智能大语言模型新型算法

2025-08-07 10:31:09
机器人利用生成式AI实现自主编程获突破

加州大学欧文分校计算机科学家Peter Burke展示了机器人如何通过生成式AI模型和硬件自主编程大脑。该项目中,AI模型被提示编写代码,创建实时无人机地面控制系统,运行在搭载树莓派的无人机上。整个过程耗时2.5周,生…详细

人工智能无人机技术自主编程系统

2025-08-07 10:30:26
OpenAI发布两款"开源"AI推理模型

OpenAI发布了两款开放权重AI推理模型gpt-oss-120b和gpt-oss-20b,具备与o系列相似的推理能力。这是OpenAI自五年前GPT-2以来首次发布开放模型。两款模型在多项基准测试中表现优异,其中120b版本可在单个英伟达GPU上运…详细

人工智能推理模型开源技术

2025-08-07 10:27:26
Cohere发布North智能体平台,承诺企业数据安全部署

加拿大AI公司Cohere推出名为North的AI智能体平台,承诺通过私有部署确保企业和政府数据安全。该平台可在客户自有基础设施上运行,包括本地环境、混合云或离线环境,最少仅需两个GPU。North具备聊天搜索功能,支持客服…详细

人工智能数据安全企业级应用

2025-08-07 10:21:55
香港科技大学团队让电脑听音识画面:仅凭声音就能生成逼真视频

香港科技大学研究团队开发出SpA2V框架,这是首个能够从音频中提取空间信息并生成对应视频的AI系统。该技术不仅能识别声音类型,还能准确判断声源位置、移动方向和距离,通过两阶段生成过程实现"听音生画"。实验结果显…详细

人工智能音频视频生成多模态大语言模型

2025-08-07 10:21:37
语言模型的固定长度束缚终被打破:香港中文大学推出DAEDAL让AI文本生成像人一样灵活

香港中文大学联合上海AI实验室开发的DAEDAL技术,突破了扩散语言模型固定长度限制的束缚。通过智能的长度预估和动态扩展机制,让AI能够根据任务复杂度自动调整回答长度,在数学推理等任务上准确率提升至85.8%,同时大…详细

人工智能扩散语言模型动态长度生成

2025-08-07 10:21:23
南京大学团队颠覆性新作:告别VAE,让AI直接在像素世界中绘制完美图像

南京大学团队提出PixNerd,一种革命性的像素空间图像生成模型。该模型摒弃传统VAE两阶段架构,直接在像素层面工作,通过神经场技术实现端到端训练。在ImageNet测试中达到2.15 FID,推理速度比同类模型快8倍,支持任意…详细

人工智能图像生成神经场技术

2025-08-07 10:21:09
上海交大研究团队让AI从过往经验中学习,代码修复准确率突破40%

上海交大团队开发SWE-Exp系统,让AI能从过往代码修复经验中学习,通过构建"经验银行"存储成功和失败案例,采用双智能体协作模式实现智能修复。在基准测试中达到41.6%成功率,比之前最好方法提升7.2%,开创了从试错探…详细

人工智能代码修复经验学习

2025-08-07 10:20:56
上海交通大学让AI团队"吵架"解决代码bug:多智能体辩论框架让软件修复准确率暴增14.67%

上海交通大学研究团队开发了SWE-Debate框架,通过让多个AI代理进行结构化辩论来解决软件bug问题。该方法首先构建代码依赖图谱生成故障传播路径,然后组织AI代理进行三轮辩论选择最优修复方案。实验显示问题解决成功率…详细

多智能体系统软件工程自动化修复

2025-08-07 10:20:43
上海复旦大学揭秘AI视觉理解新突破:让机器像人一样"看懂"世界并准确分割目标

上海复旦大学研究团队发布了多模态指称分割技术的全面综述,这项技术能让机器像人一样理解复杂的语言描述并在视觉场景中精确分割目标。研究涵盖了从静态图像到动态视频、从单一视觉到音视频融合的完整技术体系,分析…详细

多模态学习计算机视觉技术综述

2025-08-07 10:20:16
清华大学团队打造3D世界的"智能向导":让机器人看图就能找到任何地方

清华大学团队开发的IGL-Nav系统实现了机器人图像导航的重大突破,让机器人能够仅通过一张任意角度拍摄的照片准确找到拍摄地点。该系统采用3D高斯点云技术进行实时场景重建,结合粗定位到精定位的分层策略,在传统和自…详细

人工智能3D高斯点云机器人导航

2025-08-07 09:56:14
Google高管否认AI搜索降低网站点击量

谷歌搜索负责人莉兹·里德发表博文回应外界质疑,声称AI搜索功能并未减少网站流量。她表示总体有机点击量同比保持稳定,同时谷歌搜索次数在增加。这似乎是对皮尤研究中心分析的回应,该研究显示AI概览功能降低了点击…详细

人工智能搜索引擎流量分配

2025-08-07 09:54:51
微软Project Ire登场,AI智能体首次承担逆向工程师角色

微软发布了名为Project Ire的自主AI代理,声称可在无人协助下检测恶意软件。该原型使用大语言模型和二进制分析工具对软件进行逆向工程,判断代码是否恶意。在约4000个"困难目标"文件的实际测试中,该AI代理标记为恶意…详细

人工智能恶意软件检测AI智能体

2025-08-07 09:53:13
谷歌推出"引导式学习"工具对抗ChatGPT学习模式

随着新学年临近,Google在Gemini中推出"引导学习"工具,旨在像AI导师一样帮助用户深入理解概念而非简单获取答案。该功能通过图像、图表、视频和互动测验逐步分解问题,适应用户需求。此举紧随OpenAI推出ChatGPT学习模…详细

人工智能自然语言处理教育优化

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章