科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-04 13:34:32
MetaFaith:让大语言模型更诚实地表达不确定性的新方法

这项研究首次系统研究了大语言模型在表达不确定性时的"忠实度"问题,发现它们往往在不确定时仍使用肯定语言,导致用户过度信任。研究团队提出了MetaFaith方法,通过激发模型的"元认知"能力,使其能更诚实地表达不确定…详细

人工智能语言模型校准不确定性表达

2025-06-04 13:34:14
从失败中学习:强化蒸馏法让大语言模型更擅长推理

这项研究提出了强化蒸馏(REDI)框架,创新性地利用大型语言模型生成的正确和错误推理过程进行训练。传统方法仅使用正确样本,浪费了包含宝贵信息的错误样本。REDI采用两阶段方法:先用正确样本建立基础,再通过非对…详细

大语言模型知识蒸馏强化学习

2025-06-04 13:33:15
UniGeo:利用视频扩散模型实现一致性几何信息估计的突破性研究

UniGeo是一项开创性研究,它利用视频扩散模型来一致性地估计视频中的几何信息(如表面法线和坐标)。与传统方法不同,UniGeo在全局参考坐标系中进行预测,而非每帧的局部相机坐标系,从而有效利用视频模型中的帧间对…详细

计算机视觉视频扩散模型三维几何估计

2025-06-04 12:57:38
EasyText:一项突破性研究让AI轻松实现多语言文本渲染,精准控制布局与样式

EasyText是一项由新加坡国立大学、香港中文大学与Tiamat AI、Liblib AI合作开发的多语言文本渲染框架。基于扩散变换器(DiT)技术,它能将多语言字符编码为字符标记,并通过创新的字符位置编码技术实现精确文本布局控…详细

人工智能扩散变换器多语言文本渲染

2025-06-04 12:57:20
人机协同进化:波森AI推出EmergentTTS-Eval,革新语音合成评估标准

波森AI研究团队开发的EmergentTTS-Eval是一个针对文本转语音(TTS)系统的全面评估框架,专注于测试六大挑战场景:情感表达、非语言线索、外语词汇、语法复杂性、复杂发音和问题表达。研究创新地采用大型音频语言模型作…详细

人工智能语音合成评估方法

2025-06-04 12:57:04
实现多LLM融合的动态选择框架:东北大学等机构突破大模型知识聚合的局限性

这项研究由东北大学、北京大学、哈佛大学和谷歌合作完成,提出了一种名为Fusion-X的创新框架,用于解决大语言模型知识聚合中的挑战。研究团队通过引入自适应选择网络、动态加权融合策略和反馈驱动损失函数,实现了多…详细

大语言模型融合自适应选择网络知识聚合技术

2025-06-04 12:56:49
大语言模型本质上是线性映射?最新研究揭示神经网络背后的简单数学

这项研究揭示了大语言模型在处理特定输入时可被精确表示为线性系统的惊人特性。研究者通过在梯度计算中战略性分离非线性部分,使Llama 3、Gemma 3等多种模型展现出局部线性特性,无需改变模型权重或输出结果。通过奇…详细

人工智能大语言模型线性代数

2025-06-04 12:56:15
GSO:用于评估SWE-Agent的挑战性软件优化任务基准

这篇论文介绍了GSO(Global Software Optimization),一个用于评估大语言模型在软件性能优化任务中能力的基准测试。研究团队从真实代码库中提取了102个优化任务,涵盖10个代码库和多种编程语言。实验结果显示,即使…详细

软件工程性能优化大语言模型

2025-06-04 12:55:37
模型保护自适应量化:一种让你的大语言模型更"轻"、更"快"、不失真的技术突破

这篇研究介绍了一种名为YAQA(Yet Another Quantization Algorithm)的训练后量化技术,由康奈尔大学研究团队开发。与传统方法不同,YAQA不仅关注局部激活误差,而是考虑整个模型的KL散度,通过Kronecker分解的Hessian…详细

人工智能Kronecker分解自适应量化技术

2025-06-04 12:03:48
Roig Arena 将以 6GHz Wi-Fi 网络及先进分析技术开幕

Roig Arena 将于 2025 年 9 月在瓦伦西亚开业,借助 Extreme Networks 的 6GHz Wi-Fi 与数据分析技术,实现无缝运营与个性化观众体验,打造全天候活动中心。…详细

体育场馆6GHz Wi-Fi网络分析

2025-06-04 12:02:30
OpenMamba:吃点绿菜,它们对你有益

OpenMamba 是一款意大利独立滚动更新的 Linux 发行版,基于 Fedora 工具构建,提供 KDE Plasma 与 LXQt 桌面。它采用最新组件和标准打包工具,运行稳定且易用,适合规避主流系统限制的用户。…详细

开源操作系统RPM打包工具滚动发行模式

2025-06-04 12:01:05
微软纯文本编辑器升级:Notepad 新增格式选项

微软更新Notepad,新增工具栏格式选项支持粗体、斜体、超链接、列表和标题,并兼容Markdown输入,传统纯文本编辑体验或将受影响。…详细

文本编辑文本格式化AI集成

2025-06-04 11:59:44
埃隆·马斯克表示 XChat 正逐步向全体用户推出,但其所谓的安全性仍存在疑问

Elon Musk 宣布新版 XChat 支持自毁消息、加密、文件共享及音视频通话,目前仅在部分用户中测试,预计本周面向所有用户开放。Musk 称其基于 Rust 构建,并采用 “Bitcoin 风格” 加密,但这一说法引发争议。…详细

社交媒体加密技术全新架构

2025-06-04 11:27:07
驱动汽车电子创新:RIGOL CAN-FD总线分析解决方案

——高性能示波器助力汽车电子系统开发与验证…详细

2025-06-04 11:25:18
普源精电:科技创新引领聚合力,产教融合赋能电子教育

——RIGOL成为2025年TI杯全国大学生电子设计竞赛全国总测评仪器合作方…详细

2025-06-04 11:16:52
揭秘大语言模型的假话问题:弗吉尼亚大学团队打造可靠生物医学假设生成评估工具

弗吉尼亚大学研究团队开发了TruthHypo基准和KnowHD框架,用于评估大语言模型生成生物医学假设的真实性及检测幻觉。研究发现大多数模型在生成真实假设方面存在困难,只有GPT-4o达到60%以上的准确率。通过分析推理步骤…详细

人工智能生物医学研究幻觉检测

2025-06-04 11:15:52
语言模型安全推理重大突破:亚马逊Nova团队利用AI智能代理协作创建高质量策略链式思维数据

亚马逊Nova责任AI团队与亚利桑那州立大学共同开发了AIDSAFE,这是一种创新的多代理协作框架,用于生成高质量的安全策略推理数据。不同于传统方法,AIDSAFE通过让多个AI代理进行迭代讨论和精炼,产生全面且准确的安全…详细

安全推理多代理协作语言模型安全

2025-06-04 11:15:24
控制随心,视频随意:ByteDance智能创作的ATI轨迹控制系统如何彻底改变视频生成技术

ByteDance智能创作团队推出的ATI系统彻底改变了视频生成技术的控制方式。这个统一框架通过简单的点轨迹同时实现相机移动、物体平移和局部变形控制,不再需要分散的工具。用户只需在初始图像上标记关键点并绘制运动路…详细

视频生成技术轨迹控制系统运动注入器

2025-06-04 11:14:16
System-1.5 推理:蒙特利尔大学研究团队打造动态捷径,让AI思考更灵活高效

这项来自蒙特利尔大学研究团队的突破性工作提出了System-1.5推理框架,通过在潜在空间中创建动态捷径,使大语言模型能够灵活调整思考路径。研究者设计了模型深度捷径和推理步骤捷径,让AI系统能像人类一样区分关键与…详细

人工智能潜在空间推理动态计算

2025-06-04 11:14:01
被难倒的视觉语言模型:为什么人工智能看不懂视觉谜题?

这项研究揭示了视觉语言模型在解决视觉文字谜题方面的重大局限性。研究团队通过432个手工注释的谜题数据集,评估了从OpenAI到Google等多家公司的AI模型表现。结果显示,即使最先进的模型在抽象推理、横向思维和理解视…详细

人工智能视觉语言模型多模态推理

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章