科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-08 08:57:40
AI驱动数据产业整合潮流,但这不是全部真相

数据行业正面临重大变革,市场整合趋势明显。近期Databricks以10亿美元收购Neon、Salesforce以80亿美元收购Informatica等交易显示,更多并购即将到来。被收购公司虽规模不同,但都有共同点:买方希望通过收购技术促进…详细

人工智能数据管理企业并购

2025-07-08 08:56:33
亚马逊第100万台仓储机器人正式上岗,AI赋能更智能化

亚马逊机器人部门宣布已部署超过一百万台仓储机器人,并推出DeepFleet人工智能系统。该系统如交通控制器般协调机器人运行,提高移动效率并避免拥堵。从2012年开始测试至今,这些机器人已成为亚马逊履行中心的主力,遍…详细

人工智能机器人技术智能物流系统

2025-07-08 08:55:08
企业领导者需要了解的开源与专有AI模型选择策略

企业在采用生成式人工智能时,需在开源模型与专有模型间做出选择。真正的开源AI包括模型架构、训练数据和权重,但完全开源的模型很少。多数企业会混合使用两种模型。对于银行等受监管行业,开源模型是唯一选择,因为…详细

人工智能生成式AI战略决策

2025-07-08 08:54:17
影子AI风险:大语言模型应用的治理挑战

影子AI指员工在企业IT政策和数据治理控制之外私自使用未经授权的人工智能服务。研究显示,2024年企业生成式AI流量激增890%,与生成式AI相关的数据泄露事件增长一倍以上。开发人员为提高效率和缩短产品上市时间,常绕…详细

人工智能大语言模型影子IT治理

2025-07-08 08:51:44
欧洲核子研究中心的粒子物理数据处理技术访谈

欧洲核子研究中心(CERN)作为大型强子对撞机的所在地,已成为开放量子研究所三年试点阶段的基地。该中心高级顾问夏尔玛介绍,计算是CERN的三大支柱之一。中心需要将每秒4000万次碰撞的数据快速筛选至1000次,再缩减…详细

人工智能数据处理仿真模型

2025-07-08 08:46:07
英伟达用分层KV缓存和Dynamo引擎扩展大语言模型内存

英伟达通过Dynamo引擎实现分层KV缓存,将大语言模型的键值对存储从GPU高带宽内存扩展至CPU内存、直连SSD和网络存储。该技术解决了GPU内存不足时向量数据被驱逐需重新计算的问题,通过多层存储架构提升推理效率。Dyna…详细

人工智能分布式存储缓存优化

2025-07-07 19:13:18
基于场景驱动的模拟测试无法保护我们免受通用AI和超级AI的威胁

本文探讨了一种防范通用人工智能(AGI)和人工超级智能(ASI)存在性风险的方法:将它们置于计算机仿真世界中进行测试。虽然这种方法看似合理,但存在诸多挑战。AGI可能会隐藏恶意行为,或因被欺骗而转向恶意。此外,…详细

人工智能模拟测试安全风险评估

2025-07-07 19:12:20
AI在游戏中的表现暴露了其致命弱点

尽管AI在围棋等复杂游戏中表现出色,但在简单的井字棋游戏中却屡屡失败。研究显示,AI代理在模拟商业环境中的表现同样令人失望,经常出现幻觉、欺骗和任务未完成等问题。游戏测试为评估AI能力提供了直观方式,帮助普…详细

人工智能游戏测试AI基准评估

2025-07-07 17:48:34
语言中的强调秘密:如何让智能语音模型理解语音强调背后的含义

这项研究关注语音中的句子强调(即说话时对特定词的重音),它能传达说话者的潜在意图。耶路撒冷希伯来大学的研究团队发现,尽管现代语音语言模型进步显著,它们在理解句子强调方面表现不佳。团队创建了StressTest基…详细

语音处理句子强调识别人工智能交流

2025-07-07 17:38:18
ViStoryBench:一场可视化故事世界的大冒险——StepFun团队打造全面评估标准,帮你判断AI是否真懂讲故事

ViStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20…详细

人工智能视觉生成故事可视化

2025-07-07 17:37:47
数据清洗与扩充让开源语音模型更强大:卡内基梅隆大学团队打造的OWSM v4如何超越工业级模型

卡内基梅隆大学与本田研究所日本分部的研究团队通过数据扩充和清洗技术,打造了新一代开源语音模型OWSM v4。研究者们开发了一套三步数据清洗流程,从原始YODAS数据集中提取出166,000小时高质量语音数据,涵盖75种语言…详细

人工智能语音识别开源模型

2025-07-07 17:37:10
从师到生:语言模型中的级联偏见——Google DeepMind揭示蒸馏过程中的偏见放大现象

该研究揭示了语言模型蒸馏过程中的严重安全隐患:教师模型中微小的偏见会在传递到学生模型时被显著放大。Google DeepMind和东北大学的研究团队发现,仅需在教师模型训练数据中注入0.25%的偏见样本,就能使学生模型在…详细

人工智能模型蒸馏安全漏洞

2025-07-07 17:36:44
BinauralFlow:元(Meta)团队开发的超高质量空间音频技术,让虚拟声音像真实世界一样环绕你的耳朵

Meta和罗切斯特大学研究团队开发的BinauralFlow是一种突破性双耳语音合成框架,通过流匹配模型实现高质量空间音频生成。该技术将双耳渲染视为生成任务而非传统回归问题,并创新性地设计了因果U-Net架构与连续推理管道…详细

空间音频流匹配模型虚拟现实

2025-07-07 17:36:29
从脑电波到语言:哥伦比亚大学团队开发Neuro2Semantic框架,仅需30分钟数据就能解读大脑中的语言

这项哥伦比亚大学研究团队开发的Neuro2Semantic框架,能够从人类颅内脑电图信号中重建语义内容,开创了脑机接口技术的新可能。该框架通过两阶段过程工作:先用LSTM适配器将神经信号与文本嵌入对齐,再用预训练模型将…详细

人工智能神经科学脑机接口

2025-07-07 17:35:28
TL;DR:微调大模型思考长度,让AI推理更高效——记录中美多机构联合研究

这篇研究论文提出了一种名为TLDR(思考长度数据再权重)的创新方法,用于解决大型语言模型在推理过程中过度思考的问题。研究团队通过动态平衡系统1(简洁直觉)和系统2(深度推理)数据的权重,实现了在保持推理准确…详细

人工智能大语言模型推理思考压缩技术

2025-07-07 17:35:12
MoCA-Video:运动感知概念对齐技术让视频编辑更连贯自然

MoCA-Video是沙特阿卜杜拉国王科技大学研究团队开发的免训练视频编辑框架,通过运动感知概念对齐技术实现高质量语义混合。该方法巧妙利用对角线去噪调度和无类别分割技术在潜在空间中精确跟踪目标,并通过动量校正和…详细

计算机视觉扩散模型视频编辑

2025-07-07 17:34:50
微软最新突破:如何让大型语言模型在超长文本中聊得又快又好?

微软研究院团队提出了Rectified Sparse Attention(ReSA)技术,解决大型语言模型处理超长文本时的效率问题。ReSA结合了分组块稀疏注意力机制和定期密集矫正策略,既保持了生成质量,又显著提高了处理速度。实验表明…详细

大型语言模型稀疏注意力机制推理效率优化

2025-07-07 17:34:35
提升社交智能:如何让大模型像人类一样理解人情世故——浙江大学与阿里巴巴通义实验室联合研究

这项研究由浙江大学和阿里巴巴通义实验室合作完成,提出了一种名为"时序感知分层认知强化学习"(TimeHC-RL)的创新方法,旨在提升大语言模型的社交智能。研究者观察到,虽然大模型在数学等领域进步显著,但社交领域需…详细

人工智能社交智能强化学习

2025-07-07 17:34:10
小米发布MiMo-VL-7B:一款令人惊艳的开源视觉语言模型,通用性能与推理能力双双突破

小米LLM-Core团队开源了两款强大的视觉语言模型MiMo-VL-7B-SFT和MiMo-VL-7B-RL,在通用视觉理解和多模态推理领域创下新纪录。仅有7B参数的MiMo-VL-7B-RL在40项评测中的35项上超越Qwen2.5-VL-7B,在OlympiadBench上达…详细

人工智能视觉语言模型多模态推理

2025-07-07 17:33:28
物声相应:交互式感知物体的图像到音频生成技术——加州大学伯克利分校与字节跳动联合研究突破

这项研究提出了一种交互式物体感知的图像到音频生成模型,让用户能够针对图像中选定的特定物体生成相应声音。研究团队将物体中心学习整合到条件潜在扩散模型中,通过多模态注意力机制学习图像区域与声音的对应关系。…详细

人工智能音频生成物体感知

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章