田纳西理工大学研究发现,在特定条件下,纯粹追求短期利益的人工智能反而会自发表现出探索行为。研究通过多臂老虎机和网格世界实验证实,当环境具有重复结构且智能体拥有足够记忆时,贪婪策略能够产生类似Thompson采…详细
宾夕法尼亚大学研究团队开发了AgentTTS系统,解决多阶段AI任务中的计算资源分配难题。通过发现不同子任务对模型大小的偏好差异、最优预算点存在性和子任务间相互依赖关系三个关键规律,该系统能智能分配计算预算,在…详细
港科大团队提出的动态掩码稀疏注意力机制通过内容感知的动态掩码生成和位置感知的稀疏计算,让大语言模型学会智能分配注意力资源。该方法在保持完整信息的同时大幅降低计算复杂度,在长序列处理中实现10倍以上加速,…详细
腾讯AI实验室推出认知内核-专业版,这是首个完全开源且几乎免费的AI智能体框架。该框架通过创新的分层架构和统一接口设计,最大化利用大语言模型能力,避免对昂贵专有工具的依赖。研究团队还训练了8B参数的CK-Pro-8B…详细
这项由意大利布鲁诺·凯斯勒基金会等机构联合完成的研究创建了首个跨语言多模态AI评测基准MCIF,涵盖英德意中四种语言,包含文字、语音、视频三种模态和13项任务。通过对21个先进AI模型的测试,发现AI在长文本处理、…详细
三星SAIL实验室开发了一套AI游戏制作系统,包含评测器AVR-Eval和制作器AVR-Agent。系统能通过观看游戏录像来评判质量,并基于反馈不断改进游戏。测试显示该方法比一次性生成效果好79.2%,但AI目前还不能有效利用外部…详细
三家AI巨头同时发布重磅新模型。OpenAI推出首批开放权重模型OSS 120b和OSS 20b,具备Apache许可证,大模型推理能力与o4-mini相当,小模型可在智能手机运行。Anthropic发布Claude Opus 4.1,在代码编程和推理任务上显…详细
加州大学欧文分校计算机科学家Peter Burke展示了机器人如何通过生成式AI模型和硬件自主编程大脑。该项目中,AI模型被提示编写代码,创建实时无人机地面控制系统,运行在搭载树莓派的无人机上。整个过程耗时2.5周,生…详细
OpenAI发布了两款开放权重AI推理模型gpt-oss-120b和gpt-oss-20b,具备与o系列相似的推理能力。这是OpenAI自五年前GPT-2以来首次发布开放模型。两款模型在多项基准测试中表现优异,其中120b版本可在单个英伟达GPU上运…详细
加拿大AI公司Cohere推出名为North的AI智能体平台,承诺通过私有部署确保企业和政府数据安全。该平台可在客户自有基础设施上运行,包括本地环境、混合云或离线环境,最少仅需两个GPU。North具备聊天搜索功能,支持客服…详细
香港科技大学研究团队开发出SpA2V框架,这是首个能够从音频中提取空间信息并生成对应视频的AI系统。该技术不仅能识别声音类型,还能准确判断声源位置、移动方向和距离,通过两阶段生成过程实现"听音生画"。实验结果显…详细
香港中文大学联合上海AI实验室开发的DAEDAL技术,突破了扩散语言模型固定长度限制的束缚。通过智能的长度预估和动态扩展机制,让AI能够根据任务复杂度自动调整回答长度,在数学推理等任务上准确率提升至85.8%,同时大…详细
南京大学团队提出PixNerd,一种革命性的像素空间图像生成模型。该模型摒弃传统VAE两阶段架构,直接在像素层面工作,通过神经场技术实现端到端训练。在ImageNet测试中达到2.15 FID,推理速度比同类模型快8倍,支持任意…详细
上海交大团队开发SWE-Exp系统,让AI能从过往代码修复经验中学习,通过构建"经验银行"存储成功和失败案例,采用双智能体协作模式实现智能修复。在基准测试中达到41.6%成功率,比之前最好方法提升7.2%,开创了从试错探…详细
上海交通大学研究团队开发了SWE-Debate框架,通过让多个AI代理进行结构化辩论来解决软件bug问题。该方法首先构建代码依赖图谱生成故障传播路径,然后组织AI代理进行三轮辩论选择最优修复方案。实验显示问题解决成功率…详细
上海复旦大学研究团队发布了多模态指称分割技术的全面综述,这项技术能让机器像人一样理解复杂的语言描述并在视觉场景中精确分割目标。研究涵盖了从静态图像到动态视频、从单一视觉到音视频融合的完整技术体系,分析…详细
清华大学团队开发的IGL-Nav系统实现了机器人图像导航的重大突破,让机器人能够仅通过一张任意角度拍摄的照片准确找到拍摄地点。该系统采用3D高斯点云技术进行实时场景重建,结合粗定位到精定位的分层策略,在传统和自…详细
谷歌搜索负责人莉兹·里德发表博文回应外界质疑,声称AI搜索功能并未减少网站流量。她表示总体有机点击量同比保持稳定,同时谷歌搜索次数在增加。这似乎是对皮尤研究中心分析的回应,该研究显示AI概览功能降低了点击…详细
微软发布了名为Project Ire的自主AI代理,声称可在无人协助下检测恶意软件。该原型使用大语言模型和二进制分析工具对软件进行逆向工程,判断代码是否恶意。在约4000个"困难目标"文件的实际测试中,该AI代理标记为恶意…详细
随着新学年临近,Google在Gemini中推出"引导学习"工具,旨在像AI导师一样帮助用户深入理解概念而非简单获取答案。该功能通过图像、图表、视频和互动测验逐步分解问题,适应用户需求。此举紧随OpenAI推出ChatGPT学习模…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。