科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-08-01 10:18:13
清华大学团队打造超级机器人管家:一个会自己"思考"的全能型人形机器人诞生了!

清华大学团队开发出革命性人形机器人系统Being-0,具备类人思维能力。该系统采用创新的"三层大脑"架构:顶层基础模型负责理解指令和制定策略,中间层连接器模块负责将计划转化为具体动作,底层技能库负责执行各种操作…详细

人工智能机器人控制视觉-语言模型

2025-08-01 10:17:58
SEAP:让大语言模型像人脑一样"聪明偷懒"的训练免费神经网络修剪技术——中国人民大学和上海高级算法研究院联合研究

中国人民大学和上海高级算法研究院联合开发的SEAP技术,通过模仿人脑按需激活不同区域的工作方式,让大语言模型能够根据任务类型智能选择相关神经元,实现"聪明偷懒"。该技术在保持97.8%原始性能的同时,将推理速度提…详细

大语言模型优化神经网络修剪训练免费技术

2025-08-01 10:17:46
YuE:能创作五分钟完整歌曲的AI音乐家诞生了,香港科技大学开发的开源音乐生成模型震撼发布

香港科技大学研究团队开发出首个开源长篇音乐生成模型YuE,能根据歌词创作5分钟完整歌曲。该系统采用双阶段架构和轨道解耦技术,在人工评估中与商业系统性能相当,支持多语言创作和风格转换,为音乐创作民主化奠定基…详细

AI音乐生成开源模型长篇音乐创作

2025-08-01 10:17:37
Azure AI Speech升级:仅需几秒音频即可生成逼真语音克隆

微软升级了Azure AI Speech服务,用户仅需几秒钟的语音样本即可快速生成逼真的语音复制品。该个人语音功能于2024年5月21日正式发布,采用名为"DragonV2.1Neural"的零样本文本转语音模型,支持100多种语言。微软表示新…详细

人工智能语音合成零样本学习

2025-08-01 10:17:34
阿里巴巴DAMO院推出Babel:让90%全球人口都能用上的多语言AI大模型

阿里巴巴DAMO院推出开源多语言大模型Babel,支持全球25种主要语言,覆盖90%世界人口。采用创新的层扩展技术而非传统继续训练,推出9B和83B两个版本。在多语言任务评估中表现出色,83B版本接近GPT-4o性能,特别关注印…详细

多语言AI模型层扩展技术开源大语言模型

2025-08-01 10:17:18
GUI界面上的智能助手:vivo和香港中文大学让机器人学会像人类一样操作手机

vivo和香港中文大学的研究团队开发了UI-R1系统,首次将强化学习技术应用到图形界面操作中。该系统仅用136个训练样本就能让AI学会操作手机、电脑界面,在跨平台测试中表现优异,为智能设备交互开辟了高效的新路径。…详细

人工智能强化学习图形用户界面

2025-08-01 10:17:00
港科大联手快手:视频生成模型将彻底重塑游戏开发,每个人都能成为游戏设计师

香港大学、香港科技大学与快手科技联合发布开创性研究,提出用交互式生成视频(IGV)技术构建下一代游戏引擎,将彻底改变游戏开发模式。该技术能实时生成无限游戏内容,让每个人都能成为游戏设计师,解决传统游戏内容…详细

生成式游戏引擎交互式视频生成AI游戏开发

2025-08-01 10:16:01
新加坡国立大学推出IPV-BENCH:首个专门评估AI视频模型处理"不可能场景"的基准测试

新加坡国立大学研究团队开发了IPV-BENCH,首个专门评估AI视频模型处理"不可能场景"能力的基准测试平台。研究发现,当前最先进的AI视频模型在生成和理解违反物理定律、生物规律等不可能场景时表现不佳,最好的生成模型…详细

人工智能视频生成基准测试

2025-08-01 10:15:26
上海AI实验室团队突破视觉推理难题:让AI也能像人类一样"看图解题"

上海AI实验室团队开发的MM-Eureka突破了多模态视觉推理难题,这是一个能同时理解图像和文字并进行复杂推理的AI系统。通过创新的强化学习训练策略和高质量的MMK12数据集,MM-Eureka不仅在数学推理上表现出色,还展现出…详细

多模态推理强化学习视觉推理

2025-08-01 10:15:14
小模型也能学会深度思考:UCLA团队让2B视觉AI实现类人推理突破

UCLA团队首次成功让20亿参数的小型视觉AI模型实现了类似DeepSeek R1的"啊哈时刻"现象。他们通过在未经指令微调的基础模型上直接应用强化学习,让模型学会了自我反思和深度推理,在视觉推理任务上取得了显著突破。研究…详细

视觉推理强化学习多模态AI

2025-08-01 10:15:01
香港科大提出PreSelect:用AI预测能力来筛选高质量训练数据,10倍提升语言模型训练效率

香港科技大学研究团队提出PreSelect方法,通过分析文本对不同AI模型能力的预测能力来筛选高质量训练数据。该方法基于"能够准确反映模型能力差异的文本往往也是最佳训练材料"的核心洞察,仅用轻量级fastText分类器就能…详细

人工智能数据筛选训练效率

2025-08-01 10:14:46
人工智能真的知道答案,却选择保持沉默?Google与Technion揭示大模型的"隐性知识"现象

Google Research与以色列理工学院联合研究发现,大型语言模型存在显著的"隐性知识"现象——AI内部掌握的知识远超其外部表现,平均差距达40%。研究团队通过测试三个主流AI模型的1700个事实性问题,发现AI在内部完全知…详细

人工智能隐性知识大语言模型

2025-08-01 10:14:31
西安交通大学团队提出MAPS:基于性格理论的多智能体系统,让AI像人类专家团队一样协作解决科学难题

西安交通大学团队提出MAPS多智能体系统,基于心理学大七人格理论设计7个专门化AI智能体协作解决多模态科学问题。系统采用苏格拉底式质疑方法进行自我监督,在数学、物理、化学问题求解上比现有最佳AI提升15.84%,甚至…详细

人工智能多智能体系统科学问题求解

2025-08-01 10:14:16
复旦大学研究团队突破:让AI机器人拥有"想象力",规划任务效率提升33%

复旦大学研究团队开发出革命性的AI机器人训练方法"双重偏好优化",让机器人具备预测行动后果的"想象力"。该方法通过同时优化动作选择和状态预测,使7B参数模型的任务成功率提升31.4%,规划效率提升33.0%,甚至超越GP…详细

人工智能机器人任务规划世界建模

2025-08-01 10:14:02
阿里达摩院VACE:一个模型搞定所有视频创作,从文字到视频再到精细编辑全包了

阿里达摩院推出VACE系统,这是首个能够统一处理文字转视频、视频编辑、遮罩编辑等12种视频任务的AI模型。通过创新的视频条件单元(VCU)和上下文适配器架构,VACE不仅能单独完成各类视频生成编辑任务,还支持任务组合创…详细

视频生成模型人工智能多任务学习

2025-08-01 10:13:44
Google DeepMind推出Gemma 3:轻量级多模态AI模型的革命性突破

Google DeepMind发布Gemma 3多模态AI模型家族,参数量从1B到27B,支持文字、图片理解和多语言处理,可在普通设备运行。创新的5:1注意力架构将内存消耗降低75%,支持128K长文档处理。在多项测试中表现优异,27B版本在…详细

多模态AI轻量级模型开源AI

2025-08-01 10:12:08
机器人终于学会了"察言观色":上海AI实验室让机器人只需10个示例就能掌握复杂任务

上海AI实验室等机构联合开发的Dita机器人学习模型实现重大突破,仅需10个示例就能让机器人掌握复杂任务。该模型创新性地结合扩散模型与Transformer架构,让机器人具备类似人类的环境观察和任务理解能力,在多个基准测…详细

人工智能扩散模型机器人学习

2025-08-01 09:29:38
Canonical重启TPM加密技术,Ubuntu 25.10版本即将支持

Canonical宣布Ubuntu 25.10"Questing Quokka"将引入基于可信平台模块(TPM)芯片的全盘加密功能。该功能原计划在23.10版本推出,现在终于落地。新方案利用现代PC内置的TPM 2.0芯片存储加密密钥,支持自动解锁,无需手…详细

人工智能系统安全自动化启动

2025-08-01 09:28:08
IOWN全光网络项目迎来五周年 与ITU签署合作协议

创新光学无线网络全球论坛在五周年之际与国际电信联盟签署合作协议,旨在加速光子技术发展。该项目由NTT主导,联合爱立信、诺基亚等巨头,致力于构建全光子网络基础设施,应对AI驱动的数据中心增长需求。研究显示,全…详细

人工智能光子学技术全光网络

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章