科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-06 11:22:39
压缩表示的统一缩放定律:从ISTA和Red Hat AI的研究中探索AI模型压缩的本质

ISTA和Red Hat AI的研究团队在《Unified Scaling Laws for Compressed Representations》论文中提出了一个革命性的统一框架,揭示了AI模型压缩背后的数学规律。他们发现,无论使用什么压缩方法,模型性能都可以通过"…详细

人工智能模型压缩缩放定律

2025-06-06 11:22:22
对抗伪装:当AI内容学会化身成人类,检测器将如何应对?

这项研究揭示了机器生成文本检测器的重大漏洞。意大利研究团队通过直接偏好优化技术,成功训练AI模型生成更像人类的文本,导致顶尖检测器准确率下降高达60%。研究者分析了语言特征分布变化,发现经过训练的模型能有效…详细

人工智能文本检测机器学习

2025-06-06 11:22:05
让AI读懂你的心:武汉大学团队开发个性化视觉大模型辅助系统的突破性研究

武汉大学研究团队开发了PCogAlign框架,使视觉语言模型能够理解人类的个性化情境认知。研究采用社会学中"角色集合"概念描述人类多样性,构建了PCogAlignBench基准测试集,包含18,000个样本和20个不同角色集的个体。该…详细

人工智能视觉语言模型个性化认知

2025-06-06 11:21:51
大模型预测未来的评估陷阱:评估语言模型预测能力的困境与误区

这项由ETH苏黎世、ELLIS图宾根研究所和MPI图宾根的研究者合作完成的论文,揭示了评估大型语言模型预测能力时的关键陷阱。研究发现两类主要问题:数据时间泄露导致评估结果不可信,以及基准测试表现难以外推到实际预测…详细

人工智能评估语言模型预测时间数据泄露

2025-06-06 11:21:31
CityLens:清华等机构研发城市图像分析基准,评估大型语言-视觉模型的城市社会经济感知能力

CityLens是清华大学和北京交通大学联合开发的基准测试系统,旨在评估大型语言-视觉模型通过城市图像预测社会经济指标的能力。研究团队构建了一个覆盖17个全球城市的多模态数据集,包含经济、教育、犯罪、交通、健康和…详细

城市感知大型语言-视觉模型社会经济预测

2025-06-06 10:56:24
Snapchat 全球推出 Apple Watch 应用

Snapchat 推出全新 watchOS 应用,支持 Apple Watch 用户预览及通过键盘、手写、语音或表情快速回复消息,打造便捷的多平台通讯体验。…详细

社交网络watchOS 开发跨平台应用

2025-06-06 10:46:50
中国光网络研讨会“卫星光通信与智能组网技术”首届专项研讨会召开

6月5日,由中国移动研究院与中国光网络研讨会(OptiNet China)联合主办的首届“卫星光通信与智能组网技术”专项研讨会在北京召开。…详细

2025-06-06 10:09:55
亚马逊神秘研发实验室开发集成agentic AI软件的机器人

Amazon旗下秘密研发机构Lab126新成立团队,专注在机器人上嵌入自主代理AI,实现通过自然语言完成复杂任务,从而提升仓储物流与配送效率,同时开发高精度地图技术。…详细

人工智能自然语言处理agentic AI框架

2025-06-06 10:09:10
数据中心的绿色存储

本文指出数据中心因 AI 应用激增而面临巨大电力需求压力,绿色 IT 能降低能耗与运营成本。 Infinidat 提出以安全存储系统为基础的解决方案,实现高投资回报与显著运营开支降低,同时兼顾环保与经济效益。…详细

人工智能绿色IT运营成本节约

2025-06-06 10:05:20
别再猜测为什么你的大语言模型出错: Anthropic 的新工具能准确显示问题所在

本文介绍了 Anthropic 开源的电路追踪工具,通过生成归因图和介入实验全面揭示大语言模型内部机制,助力企业高效调试和优化。…详细

人工智能机理可解释性电路追踪工具

2025-06-06 10:00:34
Samsung 联手 Glance 利用你的面容实现 AI 生成锁屏广告

三星与 Glance 合作推出 AI 购物体验,通过自拍生成个性化时尚广告,并在三星手机上陆续推出,用户可自主选择接入,但涉及位置追踪及数据存储问题。…详细

人工智能生成式 AI个性化定制广告

2025-06-06 09:54:12
未来预测:逐年推进 AI 迈向 2040 年实现 AGI 的路径

本文探讨了达成人工通用智能(AGI)七大路线中的线性进阶路径,预测了从2025年至2040年 AI 技术与社会效应的关键年度节点。…详细

人工智能大语言模型渐进式路径

2025-06-06 09:27:36
借力美团牵牛花即时零售数字化,初哩改写美妆行业新规则

在消费升级与即时需求爆发的双重驱动下,美妆即时零售正成为行业新风口。传统美妆零售受限于营业时间、库存深度和配送效率,难以满足消费者“即时变美”的需求。而借助数字化系统的赋能,一批新兴品牌正在改写行业规则。…详细

2025-06-06 09:18:25
用多模态扩散模型实现离散-连续量子电路的合成:让AI助力量子计算变得更轻松

这项研究介绍了一种新型多模态扩散模型,能够同时生成量子电路的离散结构和连续参数。由因斯布鲁克大学和NVIDIA公司研究人员开发,该模型利用两个独立但协同工作的扩散过程处理门类型选择和参数预测,克服了传统量子…详细

量子计算机器学习多模态扩散模型

2025-06-06 09:18:07
SenseFlow:香港科技大学团队突破性提升大规模文本生成图像模型的高效蒸馏技术

SenseFlow是香港科技大学等机构联合开发的文本到图像蒸馏技术,解决了大型流匹配模型蒸馏的三大难题。研究团队提出隐式分布对齐(IDA)稳定训练过程,段内引导(ISG)优化时间步重要性分配,并设计基于视觉基础模型的判别…详细

人工智能流匹配模型模型蒸馏

2025-06-06 09:17:46
MASKSEARCH:通过通用预训练框架,让你的AI更会搜索与思考

MASKSEARCH是阿里巴巴集团同义实验室开发的新型预训练框架,通过创新的"检索增强掩码预测"任务,训练大型语言模型像人类一样主动使用搜索工具获取信息。这项框架包含两个阶段:首先在掩码预测任务上预训练,然后在下…详细

人工智能检索增强生成大型语言模型

2025-06-06 09:17:31
SmolVLA:为低成本高效机器人打造的视觉-语言-动作模型

SmolVLA是由Hugging Face、巴黎索邦大学等机构联合开发的小型视觉-语言-动作模型,专为低成本机器人设计。与现有模型相比,它仅有4.5亿参数(小10倍),却能达到相当性能。SmolVLA采用精巧架构设计,可在单GPU训练、…详细

机器人学习视觉语言模型异步推理

2025-06-06 09:17:16
AREAL:突破传统,完全异步强化学习如何让大语言模型的推理能力飞跃

AREAL是一个由清华大学和蚂蚁研究院开发的全新异步强化学习系统,专为提升大语言模型的推理能力而设计。与传统同步系统不同,AREAL完全解耦了生成和训练过程,推理工作器持续生成新输出,训练工作器则在收集到足够数…详细

强化学习系统大语言模型推理异步训练架构

2025-06-06 09:16:23
EarthMind:基于大型多模态模型的多尺度多传感器地球观测系统

EarthMind是一个创新的视觉-语言框架,专为解决地球观测领域的多尺度和多传感器理解挑战而设计。由多所国际知名大学联合开发的这一系统引入了两项关键技术:空间注意力提示(SAP)机制重新分配大型语言模型内部的注意力…详细

人工智能多模态融合地球观测

2025-06-06 09:15:59
CodeV-R1:让推理增强型Verilog生成变得简单高效,中科院计算所团队带来硬件描述语言自动生成的突破性进展

CodeV-R1是中科院计算所团队开发的专用于Verilog硬件描述语言自动生成的推理增强型大语言模型框架。该研究克服了三大关键挑战:缺乏自动化验证环境、高质量数据稀缺和计算成本高昂。研究团队通过开发自动测试台生成框…详细

人工智能硬件描述语言强化学习

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章