科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-05 10:25:45
全方位保护:华盛顿大学与微软联合开发的OMNIGUARD,一种跨模态AI安全防护的高效方法

这项由华盛顿大学和微软联合开发的OMNIGUARD研究,提出了一种高效的AI安全检测方法,能够跨越语言和模态(文本、图像、音频)识别有害内容。该方法通过发现大型语言模型内部的通用表示,构建轻量级分类器,比现有方法…详细

人工智能安全跨模态防护大型语言模型

2025-06-05 10:20:28
ReasonGen-R1:微软使用监督微调与强化学习让图像生成模型先思考后创作

这篇研究论文介绍了ReasonGen-R1,一个由微软与上海科技大学合作开发的创新框架,首次将链式思考(CoT)与强化学习(RL)应用到自回归图像生成模型中。研究通过两阶段方法实现:先用监督微调(SFT)教会模型生成推理文本,…详细

人工智能自回归图像生成链式思考

2025-06-05 10:13:35
Nvidia 表示其 Blackwell 芯片在训练 AI 大语言模型基准测试中领跑

Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。…详细

人工智能深度学习新型芯片架构

2025-06-05 10:11:10
HP ZBook Ultra 与 AMD Ryzen AI Max:移动工作站的转折点

HP新款ZBook Ultra G1a搭载AMD最新Ryzen AI Max+ PRO 395处理器,实现轻薄机身与高性能AI加速和创作需求的完美结合,为专业用户提供全新移动办公体验。…详细

人工智能集成显卡AI加速

2025-06-05 10:09:37
数据中心的绿色存储

随着 AI 应用不断增多,数据中心的电力需求急剧上升,企业正借助绿色存储方案降低能耗和成本,实现环保与经济效益的双重提升。…详细

人工智能绿色存储高投资回报率

2025-06-05 10:07:16
Klarna CEO 表示公司将使用人工提供 VIP 客户服务

在伦敦SXSW大会上,Klarna首席执行官西米亚特科夫斯基表示,公司在利用AI自动处理繁琐任务以降低成本、提升效率的同时,仍将为VIP客户保留专属人工服务。他透露,公司正通过技术与业务整合、数据集中管理及防范金融科…详细

人工智能人机协作数据整合

2025-06-05 10:06:45
Hugging Face 表示其新型机器人模型高效到可在 MacBook 上运行

Hugging Face 推出轻量机器人模型 SmolVLA,基于共享数据训练,支持异步推理,能在低成本硬件上运行,加速通用机器人研发。…详细

机器人开源模型轻量高效

2025-06-05 09:37:21
Check Point 通过人工智能驱动的安全管理,加速威胁检测与响应,助力现代企业提升安全防护能力

新一代 Smart-1 管理设备提高了效率,将管理网关和人工智能工具的自动化、策略洞察力和协调能力提高了 2 倍。…详细

2025-06-05 09:34:35
当上下文成为金子:上下文文档嵌入模型的评估与训练

这项研究针对现代文档检索系统中的关键缺陷:独立处理文档片段导致丢失上下文信息。研究团队开发了ConTEB基准测试来评估模型利用文档级上下文的能力,并提出了InSeNT方法,结合后期分块和创新的对比学习策略。实验表…详细

文档检索上下文嵌入检索增强生成

2025-06-05 09:34:16
多语言LLM安全研究的现状与挑战:从语言鸿沟的测量到解决之道

这项由布朗大学和Cohere实验室研究者联合进行的研究全面分析了大型语言模型(LLM)安全研究中的语言不平等现象。通过系统回顾近300篇2020-2024年间的安全相关论文,研究发现LLM安全研究严重偏向英语,即使中文这样的高…详细

人工智能安全多语言模型语言鸿沟研究

2025-06-05 09:34:00
ChARM:角色扮演型AI助手的突破性进步——让AI角色更加真实可信

这项研究提出了ChARM,一种创新的角色扮演AI奖励建模框架,通过行为自适应边界和自我进化策略大幅提升AI角色的真实性和一致性。研究团队创建了包含1,108个角色的RoleplayPref数据集,实验表明ChARM比传统模型提高了1…详细

角色扮演AI奖励模型自然语言处理

2025-06-05 09:33:41
重新思考循环神经网络中的双线性状态转换:隐藏单元不仅是记忆,更是计算的主角

这篇研究重新审视了循环神经网络中的双线性状态转换机制,挑战了传统观点。高通AI研究团队证明,隐藏单元不仅是被动记忆存储,更是网络计算的积极参与者。研究建立了一个从实数对角线到完全双线性的模型层级,对应不…详细

循环神经网络双线性模型状态跟踪

2025-06-05 09:33:22
深思不见?探究多模态推理模型中放大的幻觉问题——加州大学圣克鲁兹和斯坦福大学的最新发现

这项研究探讨了多模态大语言模型在增强推理能力时出现的视觉幻觉问题。研究发现,模型生成更长推理链时,对视觉信息的关注减少,导致幻觉增加。研究者提出RH-AUC指标和RH-Bench基准来评估模型在推理与幻觉间的平衡,…详细

多模态大语言模型视觉幻觉人工智能评估

2025-06-05 09:33:03
形式化不确定性的语法:何时在自动推理任务中信任大语言模型

这篇研究探讨了大语言模型在自动推理任务中的不确定性问题。研究者提出,模型生成形式规范时的概率不确定性不是缺陷,而是宝贵的信号源。通过引入概率上下文无关文法框架分析SMT-LIB程序分布,他们发现不确定性信号具…详细

人工智能形式验证不确定性量化

2025-06-05 09:32:47
GATE:沙特研究团队打造高性能阿拉伯语文本嵌入模型,比OpenAI还强25%

来自沙特阿拉伯王子苏丹大学和阿尔法萨尔大学的研究团队开发了GATE(General Arabic Text Embedding)模型,这是一套专为阿拉伯语设计的文本嵌入系统。该研究结合了套娃表示学习和混合损失训练方法,解决了阿拉伯语特…详细

阿拉伯语处理文本嵌入语义相似度

2025-06-05 09:32:31
微调小模型还是提示大模型?ServiceNow揭秘低代码工作流程生成的最佳选择

这篇来自ServiceNow的研究探讨了在生成低代码工作流时,微调小型语言模型(SLM)与提示大型语言模型(LLM)的效果对比。研究团队发现,尽管GPT-4o等大模型通过精心设计的提示可以产生合理结果,但在这类需要结构化输出的…详细

人工智能语言模型工作流自动化

2025-06-05 09:31:27
多模态大语言模型的偏好如何影响决策?哈工大与鹏城实验室揭示与控制模型"偏听偏信"的机制

哈尔滨工业大学和鹏城实验室的研究团队开发了一种评估多模态大语言模型模态偏好的新方法,并证实这些模型在处理图像和文本信息冲突时确实存在偏好现象。研究者通过构建MC?基准测试,发现模型偏好受多种因素影响,并能…详细

人工智能多模态大语言模型表示工程

2025-06-05 09:23:25
万兆光网 协同智算,2025中国光网络研讨会盛大召开

6月4日,为期两天的2025年中国光网络研讨会(OptiNet China)在北京盛大召开。…详细

2025-06-05 09:19:05
AI浪潮下的光网络“基石”之变

——2025中国光网络研讨大会释放出七个信号…详细

光网络AI

2025-06-04 17:53:50
分叉-合并解码:提升音视频大语言模型的多模态理解能力

韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的…详细

多模态AI解码技术音视频理解

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章