科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-10-09 12:20:45
康卡斯特和UCL联手:让语音识别模型学会"脑补",仅凭文字就能适应新领域

康卡斯特和UCL研究团队开发了WhisTLE技术,解决语音识别模型在新领域适应中只能依赖昂贵语音数据的问题。该方法通过训练变分自编码器模拟语音编码器输出,实现仅用文本进行深度监督适应。实验显示平均降低12.3%词错误…详细

语音识别深度监督域适应

2025-10-09 12:20:33
复旦大学团队重磅突破:机器人终于学会了"问问题",从被动执行者进化为主动合作伙伴

复旦大学团队开发出Ask-to-Clarify机器人框架,让机器人首次具备主动询问澄清模糊指令的能力。该系统采用双组件架构和两阶段训练策略,在8项真实任务中全面超越现有技术,成功率达90-98%。这一突破将机器人从被动执行…详细

人工智能机器人控制交互式对话

2025-10-09 12:20:21
苹果公司首次发布统一多模态AI模型Manzano:一个模型既能看懂图片又能画出图片

苹果公司发布突破性AI模型Manzano,首次实现单一模型同时具备图像理解和生成能力。该模型采用创新的混合视觉标记器设计,通过统一的语义空间有效解决了传统多模态模型中理解与生成任务的冲突问题。在多项基准测试中,…详细

人工智能多模态模型图像生成

2025-10-09 12:20:08
伊利诺伊大学团队突破手机视频重建难题:不需要额外传感器,仅凭摄像头就能完美还原动态场景

伊利诺伊大学团队开发出ROS-Cam系统,仅需普通RGB视频即可精确重建动态三维场景,无需激光雷达等额外传感器。该技术通过补丁式追踪过滤器、异常值感知优化和两阶段策略,在多个数据集上超越现有方法,处理速度提升2-…详细

计算机视觉三维重建摄像头参数优化

2025-10-09 12:19:52
小米研究院推出革命性GUI自动化框架:让AI像人一样"眨眼-思考-执行"操作界面

小米研究院推出的BTL-UI是一个革命性的GUI智能代理框架,通过模拟人类"眨眼-思考-执行"的认知过程,让AI能够像人类一样自然地操作各种应用界面。该技术在多个基准测试中实现了显著性能提升,为未来的人机交互和自动化…详细

人工智能图形用户界面认知科学

2025-10-09 11:27:15
当年只有30人在训练AGI:Anthropic预训练负责人访谈的万字实录,曾经的AI实验室都是通才,现在大家都是专才

Y Combinator合伙人Ankit Gupta与Anthropic预训练负责人Nick Joseph最近进行了一次深度对话。…详细

2025-10-09 11:26:03
高性能轻薄本首选:Dell Pro 14 Premium的全方位优势

随着 AI 正逐步走入办公与个人应用场景,用户对高性能轻薄本和高端商务本的需求正在发生变化。设备不仅要足够便携,还要能处理多任务和 AI 相关工作负载,这对设备性能、散热和续航都提出了更高要求。…详细

2025-10-09 11:09:36
NBA中国与阿里云宣布达成多年合作,重塑球迷互动体验

NBA中国将利用阿里云的人工智能和云计算服务,支持一系列数字球迷互动计划。双方将基于阿里巴巴通义千问大模型,开发一个专属AI模型。…详细

阿里云NBAAI大模型

2025-10-09 10:45:48
PEC 2025 AI创新者大会年度提问:新工作时代:AI工作流由谁主导?

9月13日的PEC 2025 AI创新者大会暨第二届提示工程峰会上,“年度提问二:新工作时代:AI工作流由谁主导?”从企业实践到技术实现、从业务落地到战略决策,展开了一场高密度的思想碰撞与经验分享,将AI工作流背后的难…详细

PEC

2025-10-09 10:41:18
PEC 2025 AI创新者大会年度对话:新创意时代,AI如何定义“第十艺术”?

在9月13日召开的“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场主题为“新创意时代,AI如何定义‘第十艺术’?”的圆桌对话引发了热烈讨论。至顶AI实验室联合主理人路飞携六位数字艺术家与AI创业者,围绕AI…详细

PEC

2025-10-09 10:21:31
土耳其AI如何识破聊天机器人的"胡说八道"?伊斯坦布尔Newmind AI团队首创检测系统

土耳其伊斯坦布尔Newmind AI团队开发出首个专门针对土耳其语的AI幻觉检测系统Turk-LettuceDetect,能够逐字识别AI生成内容中的虚假信息。该系统使用三种不同的AI模型,在包含17790个样本的数据集上训练,最佳模型达到…详细

人工智能自然语言处理幻觉检测

2025-10-09 10:14:03
法国团队打造"推理核心":让AI像数学家一样思考的训练场

法国研究团队开发了"推理核心"训练环境,专门培养AI的基础推理能力。该系统包含18个核心任务,涵盖逻辑推理、规划、因果分析等领域,能无限生成新题目并精确控制难度。与传统依赖固定题库的方法不同,推理核心专注于…详细

强化学习符号推理训练环境

2025-10-09 10:08:25
阿里巴巴Qwen团队打造史上最强多模态AI:一个模型搞定文字、语音、图像和视频,实时对话延迟仅234毫秒

阿里巴巴Qwen团队发布的Qwen3-Omni实现了AI领域的重大突破,首次让单一模型在文字、语音、图像、视频处理上都达到专业水平,无任何性能损失。该系统支持119种文字语言,实时对话延迟仅234毫秒,在36项测试中32项达到…详细

人工智能多模态融合实时语音交互

2025-10-09 10:03:07
字节跳动发布ByteWrist:让机器人手腕像人手一样灵活的革命性设计

字节跳动研究团队开发出革命性的ByteWrist并联机器人手腕,采用三层嵌套驱动机制和弧形连接杆设计,体积比传统手腕减少40%,承载能力提高60%。在狭窄空间操作测试中,搭载ByteWrist的机器人比传统Kinova机器人快一倍…详细

机器人技术并联机构新型设计

2025-10-09 09:55:45
Littelfuse推出IX3407B隔离栅极驱动器简化大功率设计

新型单通道驱动器采用2.5 kV电容隔离技术,可提升功率密度、加快开关速度、增强电机驱动器、逆变器及工业电源的可靠性。…详细

2025-10-09 09:54:38
Scale AI团队推出SWE-Bench Pro:AI编程助手能否胜任真正的企业级软件开发挑战?

Scale AI团队推出SWE-Bench Pro测试平台,专门评估AI编程助手在真实企业级软件开发中的表现。研究发现,即使是最先进的GPT-5和Claude模型,成功率也仅有23%左右,远低于在传统测试中70%的表现。该测试平台包含1865个…详细

人工智能软件工程AI编程助手

2025-10-09 09:46:22
图像编辑智能评分员:微软团队开发AI助手彻底改变图像修改质量评估

微软团队开发的EdiVal-Agent是首个针对AI图像编辑的自动化评估系统,能像专业评委一样从指令遵循、内容一致性和视觉质量三维度评分。该系统与人类评审一致性达81.3%,测试发现Nano Banana表现最均衡,GPT-Image-1指令…详细

人工智能图像编辑评估系统

2025-10-09 09:45:41
首次建立的"材料显微镜图像理解力测试"让AI暴露了重大盲区——中大深圳团队发现现有模型在专业领域表现堪忧

中大深圳团队创建MatCha测试平台,评估15个先进AI模型在材料显微图像理解方面的能力。结果显示,即使是最优秀的GPT-4模型准确率也仅59%,远低于人类专家的89%。研究揭示AI在专业领域存在知识缺乏和视觉感知不足的重大…详细

材料科学多模态大语言模型基准测试

2025-10-09 09:45:23
Meta推出RecoWorld:让推荐系统在虚拟世界里"练手",就像飞行员在模拟器中学习一样

Meta研究团队推出RecoWorld,这是首个专为智能推荐系统打造的虚拟训练环境。该系统通过虚拟用户与推荐系统的多轮对话互动,让算法在安全环境中学习理解和响应用户指令。RecoWorld支持文本、多模态和语义编码三种内容…详细

人工智能智能推荐系统虚拟训练环境

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章