科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-21 11:30:41
香港科技大学团队突破:让AI像真正的设计师一样,一步步"拼积木"创造3D世界

香港科技大学团队开发了名为CoPart的革命性3D生成技术,它模仿人类设计师的工作方式,将复杂3D物体分解为多个部件分别生成再组装。该技术采用双重编码策略和相互指导机制,确保各部件既精细独立又协调统一。研究团队…详细

3D生成技术部件化建模计算机视觉

2025-07-21 11:30:07
清华大学团队革命性突破:让AI模型运行速度提升3.67倍的"积木式"智能系统

清华大学团队推出BlockFFN架构,通过创新的稀疏激活技术和块级优化训练,实现了AI模型在端侧设备上3.67倍的加速效果。该技术采用ReLU路由器和RMSNorm设计,结合激活稀疏性和推测解码,在保持模型性能的同时大幅提升运…详细

混合专家模型稀疏激活端侧推理

2025-07-21 11:29:45
多模态AI的视觉语言冲突危机——中科大团队揭示人工智能"看图说话"的致命盲点

中科大研究团队发现多模态AI存在严重的"模态冲突"问题——当图片和文字信息矛盾时,AI会产生幻觉并编造不存在的内容。研究构建了专门数据集测试发现,包括GPT-4o在内的主流AI错误率超过40%。团队提出三种解决方案,其…详细

多模态AI计算机视觉强化学习

2025-07-21 11:22:20
创维光伏玩转“零碳”新赛道

当前,我国现有工业园区数量超1.5万个,国家级和省级园区超过2500个,贡献了全国工业产值的50%以上,碳排放量占全国总量的30%以上。作为产业聚集的载体,零碳园区对美丽中国建设和“双碳”目标实现有着重要意义。…详细

2025-07-21 11:00:02
MIT团队揭秘AI基础模型的"假象":它们真的理解世界吗?

哈佛和MIT研究团队通过创新的"归纳偏差探测"方法,发现AI基础模型虽然在预测任务上表现出色,但实际上并未真正理解世界的基本规律。研究以天体物理学为例,揭示了AI模型更像是依赖启发式策略的"经验主义者",而非掌握…详细

人工智能机器学习归纳偏差探测

2025-07-21 10:59:17
CLiFT:西蒙弗雷泽大学让虚拟现实"瘦身"的黑科技,用更少数据创造更真实的视觉体验

西蒙弗雷泽大学研究团队开发了CLiFT压缩光场令牌技术,用创新的数据压缩方法解决虚拟现实中的存储和传输难题。该技术能够用原来十分之一的数据量实现相同的视觉质量,同时支持根据用户需求动态调整渲染效果。在实际测…详细

压缩光场令牌神经渲染虚拟现实优化

2025-07-21 10:59:03
卡内基梅隆大学最新突破:告别分词器,让AI直接理解原始文本的革命性技术

卡内基梅隆大学研究团队开发的H-Net架构实现了语言模型的重大突破,通过动态分块机制直接处理字节级数据,彻底摆脱传统分词器依赖。该技术不仅在英语任务上超越现有模型,在中文、代码和DNA等场景中更展现出显著优势…详细

人工智能动态分块端到端学习

2025-07-21 10:37:06
跨越AI价值鸿沟:远石科技与阿里云的共创之路

对于绝大多数传统企业而言,将AI的潜力转化为实在的生产力,是一个要打通数据、重塑流程、平衡投入产出的漫长过程。许磊将这个过程定义为“产业重塑”。…详细

云计算阿里云远石科技AIIDC

2025-07-21 10:29:26
OpenAI实验模型在国际数学奥林匹克竞赛中获得金牌级表现

OpenAI研究科学家Alexander Wei宣布,公司一个未发布的实验模型在国际数学奥林匹克竞赛中解决了六道题目中的五道,获得42分中的35分,达到金牌水平。该模型展现出类似人类数学家的推理能力,能够构建复杂严密的论证。…详细

人工智能数学推理实验突破

2025-07-21 10:29:00
AGI和AI超级智能证明智能所需回答的问题数量

本文探讨了判断AI是否达到通用人工智能(AGI)和人工超级智能(ASI)水平所需的问题数量。目前缺乏确定的测试方法来评估是否达到顶级AI水平。基于图灵测试的分析,作者提出仅通过少量问题难以全面评估智能水平。参考…详细

人工智能自然语言处理评估方法

2025-07-21 10:28:07
AI在商业中的正确用量

哈佛商学院教授拉克哈尼将AI比作药物,强调企业需要找到合适的"剂量"。研究显示AI能带来12.2%的任务完成率提升,速度提高25%,质量提升40%。然而AI存在"锯齿状技术前沿"现象,在某些领域表现卓越,在其他领域则可能导…详细

人工智能业务流程优化生产力提升

2025-07-21 10:27:22
AnyCoder:基于Kimi K2的快速Web应用开发工具发布

Hugging Face推出开源网页应用开发环境AnyCoder,集成实时预览、多模态输入和一键部署功能。该工具由Kimi K2等AI模型驱动,支持用户通过自然语言描述生成HTML、CSS和JavaScript代码。具备UI图像识别、网页搜索集成、…详细

人工智能代码生成开源工具

2025-07-21 10:26:23
隐私安全需三思:AI获取个人数据权限的风险与挑战

AI正在渗透生活各个层面,从手机应用到搜索引擎。许多AI工具以工作需要为借口,要求获取用户大量个人数据访问权限。以Perplexity的Comet浏览器为例,它要求访问用户谷歌账户的广泛权限,包括管理邮件、下载联系人、编…详细

人工智能数据隐私用户权限管理

2025-07-21 10:03:05
音频编码器的"换心手术":伊利诺伊大学团队如何让AI听懂你想要什么

伊利诺伊大学团队提出Re-Bottleneck框架,解决了音频AI系统只关注重现质量而忽视任务适应性的问题。该方法在预训练模型内部添加轻量级"翻译器",无需重新训练整个系统就能为其添加有序性、语义理解和等变性等新功能。…详细

音频处理神经网络架构模型优化

2025-07-21 10:02:33
莫斯科理工大学研究团队发明AI"拼积木"新方法:让机器学习像生物成长一样自然生长

莫斯科理工大学研究团队提出革命性AI训练新方法,通过固定视觉嵌入层实现模块化组装和渐进式生长。专业模型可像拼积木般无缝合并,AI系统能像生物般逐层发育。实验证明合并模型性能优于单体专家,深度增加能显著提升…详细

人工智能模块化组装渐进式生长

2025-07-21 10:02:02
Adobe Research团队重新定义长视频生成:从5秒到5分钟的技术突破之路

Adobe Research联合32家顶尖机构发布重磅研究,全面解析长视频生成技术现状与突破路径。研究发现当前AI视频生成存在时长限制(多数仅5-16秒)和质量衰减问题,通过分析六大技术流派和核心架构组件,为实现电影级长视…详细

长视频生成视频AI技术多模态扩散模型

2025-07-21 10:01:37
NAVER AI实验室推出"瓶颈令牌":一个令牌记住机器人的所有动作经验

NAVER AI实验室开发的Token Bottleneck方法通过"瓶颈令牌"机制,让机器人能像人类一样记忆和理解动态场景。该方法将观察信息压缩成记忆胶囊,结合少量新信息预测完整场景,在机器人操作任务中成功率提升20-40%,真实…详细

机器人学习自监督学习动态场景理解

2025-07-21 09:35:47
洞见AI时代数据底座的思考——YashanDB亮相2025可信数据库发展大会

7月16日,由中国通信标准化协会主办、中国信息通信研究院、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)承办的2025可信数据库发展大会在北京隆重召开,深圳计算科学研究院(深算院)携崖山数据库全栈解…详细

2025-07-21 09:12:53
大语言模型的"词嵌入"真的藏着语义秘密吗?莫斯科物理技术学院的惊人发现

莫斯科物理技术学院研究发现,大语言模型无需学习词汇语义含义也能实现语言理解。通过使用基于字符视觉形状的冻结嵌入代替传统可训练嵌入,模型在推理测试中表现更佳。研究表明语义理解是Transformer架构的涌现属性,…详细

人工智能冻结嵌入语言理解机制

2025-07-21 09:12:37
AI绘画界的"反作弊神器":清华大学团队推出T-LoRA技术,让AI不再"背答案"

清华大学团队推出T-LoRA技术,解决AI绘画中的"背答案"问题。该技术通过时间步骤的智能控制和正交初始化,让AI在学习单张照片时既保持特征准确性,又避免过度记忆背景等细节,生成更有创意和多样性的图像。实验显示T-…详细

T-LoRA技术扩散模型AI绘画优化

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章