商业办公-第31页-频道-至顶网

2025-07-14 12:40:45

让多媒体AI突破隔阂：阿里巴巴团队如何让机器真正"看懂"图文组合

阿里巴巴团队提出UniME框架，通过两阶段训练方法突破传统多模态AI的局限性。该技术采用文本知识蒸馏和困难负样本训练，显著提升了模型在图文理解、检索和组合概念处理方面的能力，在多个基准测试中取得3-10%的性能提…详细

多模态AI 知识蒸馏困难负样本训练

2025-07-14 11:46:11

领跑全球！数字化动车段“藏”着这些新质生产力

中国高铁领跑世界，高铁成就让中国式现代化的万千气象流光溢彩，钢铁之路让推动构建人类命运共同体的纽带跨越山海。…详细

2025-07-14 10:24:23

直击创维光伏零碳智慧园区，解锁零碳园区创新实践

2025年7月10日，创维光伏“聚势碳索——邀您共赴零碳智慧园区”主题活动在滁州工业园拉开帷幕。…详细

2025-07-14 09:55:00

月之暗面Kimi K2在关键基准测试中超越GPT-4——且完全免费

中国AI初创公司月之暗面发布开源语言模型Kimi K2，采用万亿参数混合专家架构，在编程和自主代理任务上表现卓越。该模型在SWE-bench等关键基准测试中超越GPT-4，同时提供免费开源版本和低价API服务。Kimi K2具备强大的…详细

人工智能智能体技术开源模型

2025-07-14 09:53:34

Meta与OpenAI人才争夺战：AI造就精英但冲击其他群体

AI人才争夺战愈演愈烈。Meta大举挖角后，OpenAI招募了特斯拉前软件工程副总裁David Lau和xAI基础设施架构师。Meta向其超级智能实验室部署新员工，以超2亿美元薪酬包招聘苹果基础模型负责人。这场激烈竞争造成了AI对劳…详细

人工智能深度学习人才竞争

2025-07-14 09:52:35

打造能倾听所有人的语音AI：迁移学习与合成语音的实践应用

传统语音助手往往无法很好地服务于有语音障碍的用户。通过深度学习和迁移学习技术，新一代对话AI系统能够理解更广泛的语音模式。这些系统不仅能识别非标准语音，还能基于用户的语音样本生成个性化合成语音，帮助用户…详细

人工智能语音识别包容性设计

2025-07-14 09:52:01

2040年实现AGI的S型曲线发展路径预测分析

本文分析了AI向AGI发展的七大路径中的S曲线路径，该路径预测AI发展将经历三个阶段：2025-2030年AI多模态模型和智能体技术快速发展；2030-2035年进入停滞平台期，引发AI寒冬担忧；2035-2040年技术突破重新启动，自改进…详细

人工智能生成式AI 新型算法

2025-07-14 09:51:13

UC伯克利用"边生成边验证"新技术让AI视觉模型告别"睁眼说瞎话"

UC伯克利和POSTECH研究团队开发了REVERSE系统，这是首个能让AI视觉模型在生成描述时实时自我监控和纠错的技术。通过创新的"边生成边验证"机制，该系统在多项基准测试中将AI幻觉率降低12%-34%，为构建更可信的人工智能…详细

视觉语言模型自我验证机制幻觉检测与纠正

2025-07-14 09:50:55

推理模型为何在遇到无解题目时反而"想太多"？马里兰大学团队揭示AI思维陷阱

马里兰大学研究团队首次发现，当前最先进的AI推理模型在面对缺失关键信息的无解问题时，会陷入"过度思考"陷阱，生成比正常情况长2-4倍的冗余回答，却很少能正确识别问题的不可解性。这种现象挑战了"测试时间缩放定律…详细

人工智能推理模型批判性思维

2025-07-14 09:50:43

西湖大学重磅突破：只用文字就能训练AI看图，成本降低96%的神奇技术

西湖大学研究团队开发了Unicorn技术，首次实现仅用文字训练视觉语言AI模型，无需任何真实图片。该方法通过三阶段数据合成流程，将文字描述转换为合成图像表征，训练的Unicorn-8B模型在多项测试中表现优异。相比传统方…详细

视觉语言模型跨模态表征转移文本数据合成

2025-07-14 09:50:36

超强AI系统会是什么样子？

专家预测，未来的超级人工智能不会是单一巨大的"大脑"，而更像互联网般的分布式系统。MIT的明斯基早就提出，人脑本身就是多个"机器"的集合。研究者辛格提出了智能的"三难困境"：可扩展性、协调合作和异质性。他认为通…详细

人工智能分布式智能混沌理论2.0

2025-07-14 09:50:30

AI训练数据筛选新法：上海AI实验室让机器学习更聪明

上海AI实验室联合复旦大学提出MIG方法，通过构建语义标签图和最大化信息增益来自动筛选AI训练数据。该方法能用5%的精选数据达到完整数据集的训练效果，在多项评估中提升1-6%，计算效率比传统方法快100倍以上，为AI训…详细

人工智能数据选择语义空间建模

2025-07-14 09:50:17

当视觉和语言真正融合：北京大学与上海AI实验室打造FUSION模型

北京大学与上海AI实验室联合发布FUSION模型，通过创新的全模态整合技术，实现视觉和语言的深度融合。该模型仅用630个视觉令牌就超越了传统大型模型，在文本引导视觉编码、上下文感知解码等方面取得突破，代表了多模态…详细

多模态AI 视觉语言融合深度学习

2025-07-14 09:50:01

当AI学会"看懂"视频后，我们离真正的机器人管家还有多远？——香港大学团队揭秘视频理解新突破

这项由香港大学和腾讯团队完成的研究创建了SEED-Bench-R1视频理解测试平台，发现强化学习方法在训练AI理解视频方面比传统方法更有效，特别是在面对陌生环境时表现更佳。研究揭示了AI视觉感知能力的提升机制，但也发现…详细

视频理解强化学习多模态AI

2025-07-14 09:49:47

明尼苏达大学突破性研究：AI评判系统学会自我反思，让机器像人类一样思考评价

明尼苏达大学团队开发的MPO系统让AI评判具备了类似人类的元认知能力，能够自我反思并动态调整评价标准。该系统有效解决了AI训练中的"奖励欺骗"问题，在文章写作、文档总结、道德推理和数学推理四个任务中都表现出显著…详细

人工智能强化学习元认知

2025-07-14 09:49:31

AI视频生成新突破：天工AI让你用几张照片就能拍出好莱坞大片

天工AI推出的SkyReels-A2视频生成系统实现了重大突破，能够将多张不相关照片智能组合成高质量视频。该技术采用双分支架构处理语义和空间信息，通过200万训练样本学习元素组合规律。在与商业模型的对比中表现出色，特…详细

视频生成多模态AI 开源模型

2025-07-14 09:48:45

字节跳动AI团队推出UNO：图像"魔法师"实现从一到多主题的自由创作

字节跳动AI团队推出的UNO系统实现了图像生成领域的重要突破，能够根据参考图片生成新场景，并首次很好地解决了多主题图像生成的技术难题。该系统采用创新的渐进式训练策略和自动化数据生成技术，在保持参考物体特征的…详细

图像生成多主题定制渐进式训练

2025-07-14 09:48:27

约翰斯·霍普金斯大学突破：让AI从多个视频中写出百科全书级文章，人类终于不用再看几十个视频总结新闻了！

约翰斯·霍普金斯大学研究团队开发出突破性AI系统CAG，能像资深编辑一样从多个视频中提取信息并撰写维基百科风格文章。该系统采用三重协作机制，显著优于传统方法，为新闻业和知识管理带来革命性潜力，虽仍存在音频处…详细

人工智能视频理解文章生成

2025-07-14 09:48:14

北大物理学院推出首个物理推理基准测试：AI模型在复杂物理问题面前还是个"学渣"

北京大学物理学院团队开发了首个专门评估AI大语言模型物理推理能力的基准测试PHYBench，包含500道原创物理题目。测试发现即使最先进的AI模型准确率也仅有36.9%，远低于人类专家的61.9%，揭示了AI在复杂物理推理中的显…详细

人工智能物理推理基准测试

2025-07-14 09:47:49

阿里巴巴团队让AI学会了完美"表演"：一张照片秒变生动说话视频

阿里巴巴团队首次实现仅凭一张照片生成逼真说话视频的AI技术突破。该系统不仅能完美同步嘴唇动作，还能自然展现面部表情、肢体动作和背景变化，并支持个性化的动作强度控制。这项技术将显著降低视频内容制作门槛，为…详细

人工智能视频生成数字人技术

华为云数字化转型秘籍调研

业界热点: