科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-25 16:00:04
智能集成创新!华为云ROMA集成平台融合MCP,加速全链路业务协同

2025年6月20-22日,华为开发者大会2025(HDC 2025)在东莞松山湖盛大举行。6月21日,“ROMA集成平台融合MCP,加速全链路业务协同”专题论坛成功举办,本次论坛话题聚焦“MCP(Model Context Protocol)”“智能体”等…详细

2025-06-25 15:59:18
华为携手伙伴发布“政务一网通军团海外智慧城市与政务服务联合方案”——共赢出海数智化新未来

华为开发者大会 2025(HDC 2025)于6月20日-22日在东莞松山湖顺利举行。…详细

2025-06-25 15:58:40
电子科技大学 鲲鹏昇腾科教创新孵化中心揭牌,打造中国算力生态“成电范式”

6月17日,电子科技大学与华为技术有限公司签署合作协议,宣布“电子科技大学 鲲鹏昇腾科教创新孵化中心”(以下简称“孵化中心”)正式揭牌成立。…详细

2025-06-25 15:58:07
联想混合式人工智能优势集能力全面升级,加速企业AI转型

近日,联想正式宣布全面升级其“联想混合式人工智能优势集”(Lenovo Hybrid AI Advantage(TM)),进一步拓展其全栈AI能力。升级重点包括:强化AI基础设施解决方案、完善全周期AI服务组合,并扩展与全球技术伙伴深度…详细

2025-06-25 15:57:33
盘古世界模型问世!华为博士天团答疑如何用4D空间重构物理世界

6月20日-22日,一年一度的华为开发者大会(HDC 2025)隆重启幕。…详细

2025-06-25 14:54:37
纽约大学最新研究:机器人"想得很美,做得不行"的尴尬现状被彻底揭露

纽约大学研究团队通过INT-ACT测试套件全面评估了当前先进的视觉-语言-动作机器人模型,发现了一个普遍存在的"意图-行动差距"问题:机器人能够正确理解任务和识别物体,但在实际动作执行时频频失败。研究还揭示了端到…详细

机器人技术视觉-语言-动作模型泛化能力评估

2025-06-25 14:54:23
UNC Chapel Hill让AI变身万能专家:一个模型解决所有视觉推理难题

北卡罗来纳大学教堂山分校研究团队提出MEXA框架,通过动态选择和聚合多个专业AI模型来处理复杂的多模态推理任务。该方法无需额外训练,在视频理解、音频分析、3D场景理解和医学诊断等多个基准测试中显著超越现有模型…详细

多模态推理专家聚合视频理解

2025-06-25 14:54:05
从印地语到英式口音,人工智能让语音生成告别"一口一个味"——孟买工程学院突破多语言情感语音合成

孟买工程学院研究团队开发出突破性的多语言情感语音合成系统,能实现印地语与英语间的实时口音切换,同时准确表达多种情感。该系统在口音准确性上提升23.7%,情感识别准确率达85.3%,为南亚地区教育技术和无障碍软件…详细

多语言语音合成情感语音技术印度口音建模

2025-06-25 14:53:35
统一理解与生成的"大脑分工":上海AI实验室揭示多模态AI的两难困境与解决方案

上海AI实验室研究团队发现统一多模态AI中图像理解与生成任务存在根本冲突:理解需要逐层增强语义关联,生成则需要早期语义指导后期专注细节。他们提出UniFork架构,采用"共享浅层+分离深层"的Y型设计,有效解决任务冲…详细

统一多模态AI图像生成与理解Y型神经网络架构

2025-06-25 14:52:32
新加坡国立大学团队开发"拖拽式"AI模型:让大模型适应新任务只需几秒钟

新加坡国立大学团队开发出革命性的"拖拽式"AI技术DnD,能够在几秒钟内直接从文本描述生成大语言模型参数,无需传统耗时的训练过程。该技术在多个任务上表现优异,效率比传统方法提升2500-12000倍,为AI模型的快速定制…详细

人工智能参数生成大语言模型优化

2025-06-25 14:50:44
终端平铺工具:控制台专家的多路复用利器

本文评测了六款控制台平铺终端复用器工具。GNU Screen作为老牌工具功能强大但操作复杂,Tmux更现代化但学习曲线陡峭,Byobu为前两者提供友好界面,Zellij用Rust编写界面简洁易用,DVTM追求极简主义,Twin提供类似Tur…详细

终端管理平铺窗口多路复用器

2025-06-25 14:48:49
Snyk收购Invariant Labs以扩展AI智能体安全能力

网络安全公司Snyk宣布收购瑞士人工智能安全研究公司Invariant Labs,收购金额未公开。Invariant Labs从苏黎世联邦理工学院分拆成立,专注于帮助开发者构建安全可靠的AI代理工具和框架。该公司提供Explorer运行时观察…详细

人工智能AI智能体安全企业收购

2025-06-25 14:47:43
谷歌发布离线机器人AI系统,无需联网即可系鞋带

谷歌DeepMind发布新的离线视觉语言行动模型,让机器人无需云端支持即可自主运行。该模型基于Gemini的多模态理解能力,能够完成系鞋带、折衣服等复杂任务。相比之前的混合云端模式,新模型准确性仅略有下降,但大幅提…详细

人工智能机器人技术离线部署

2025-06-25 14:43:00
Pure Storage谈AI数据挑战超越硬件层面

Pure Storage AI基础设施副总裁Par Botes强调,成功应对AI工作负载不仅需要足够的计算和存储资源,更关键的是确保AI训练数据的质量。企业需要捕获、组织、准备和对齐数据,因为数据往往不完整或不适合AI要解决的问题…详细

人工智能数据工程数据湖仓

2025-06-25 14:41:56
全球5G用户2025年底将接近30亿,FWA业务快速增长

爱立信2025年移动性报告显示,5G通信正加速走向成熟,商业服务发展为复杂套餐。预计2025年底全球5G用户数将超过29亿,约占移动用户总数三分之一。2024年底5G网络承载35%全球移动流量,预计2030年将达80%。固定无线接…详细

5G网络固定无线接入基于速度资费

2025-06-25 13:31:46
机器人团队协作新突破:上海人工智能实验室让多个机器人像人类团队一样高效合作

上海人工智能实验室的研究团队开发了VIKI-R框架,首次实现了让不同类型机器人像人类团队一样协作。该研究建立了全球首个多机器人视觉协作评估平台VIKI-Bench,通过队员选择、任务规划、轨迹感知三层测试体系全面评估…详细

机器人协作强化学习视觉感知

2025-06-25 13:31:30
告别文档分块难题:Yellow.ai如何用AI"眼睛"让机器真正看懂PDF文件

Yellow.ai研究团队开发了革命性的多模态文档分块技术,让AI系统能像人类一样"看"PDF文档,而非仅仅"读"文字。该方法采用批量视觉处理和上下文保持机制,解决了传统固定长度分块导致的表格分割、内容破碎等问题。在RA…详细

多模态文档理解RAG系统优化视觉引导分块

2025-06-25 13:31:14
DreamCube:香港大学团队突破传统,让AI从一张照片"脑补"出整个360度世界

香港大学团队突破性地解决了AI全景图生成中的拼接难题,提出DreamCube系统,能从单张照片生成包含深度信息的完整360度场景。该研究创新性地引入"多平面同步"技术,让AI同时协调处理立方体六个面,避免传统方法的色差…详细

人工智能3D场景生成多平面同步

2025-06-25 13:30:48
腾讯推出"游戏制造器":AI让你用键盘鼠标就能创造真实游戏世界

腾讯混元团队推出革命性AI系统Hunyuan-GameCraft,能根据键盘鼠标操作实时生成对应游戏画面。该系统统一处理各种输入信号,采用混合历史条件训练保持长期一致性,通过模型蒸馏实现近实时响应。基于100多款3A游戏数据…详细

游戏视频生成交互式AI实时内容创作

2025-06-25 13:30:30
腾讯混元3D 2.5:让3D模型生成进入"极致细节"时代

腾讯混元3D团队发布的最新版本2.5在3D资产生成领域实现重大突破。新系统引入100亿参数的LATTICE形状模型,能生成极其精细的3D形状细节,并首次支持PBR物理渲染材质生成。通过双阶段分辨率提升和多通道协同机制,实现…详细

3D生成技术物理渲染深度学习

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章