科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-04 11:16:52
揭秘大语言模型的假话问题:弗吉尼亚大学团队打造可靠生物医学假设生成评估工具

弗吉尼亚大学研究团队开发了TruthHypo基准和KnowHD框架,用于评估大语言模型生成生物医学假设的真实性及检测幻觉。研究发现大多数模型在生成真实假设方面存在困难,只有GPT-4o达到60%以上的准确率。通过分析推理步骤…详细

人工智能生物医学研究幻觉检测

2025-06-04 11:15:52
语言模型安全推理重大突破:亚马逊Nova团队利用AI智能代理协作创建高质量策略链式思维数据

亚马逊Nova责任AI团队与亚利桑那州立大学共同开发了AIDSAFE,这是一种创新的多代理协作框架,用于生成高质量的安全策略推理数据。不同于传统方法,AIDSAFE通过让多个AI代理进行迭代讨论和精炼,产生全面且准确的安全…详细

安全推理多代理协作语言模型安全

2025-06-04 11:15:24
控制随心,视频随意:ByteDance智能创作的ATI轨迹控制系统如何彻底改变视频生成技术

ByteDance智能创作团队推出的ATI系统彻底改变了视频生成技术的控制方式。这个统一框架通过简单的点轨迹同时实现相机移动、物体平移和局部变形控制,不再需要分散的工具。用户只需在初始图像上标记关键点并绘制运动路…详细

视频生成技术轨迹控制系统运动注入器

2025-06-04 11:14:16
System-1.5 推理:蒙特利尔大学研究团队打造动态捷径,让AI思考更灵活高效

这项来自蒙特利尔大学研究团队的突破性工作提出了System-1.5推理框架,通过在潜在空间中创建动态捷径,使大语言模型能够灵活调整思考路径。研究者设计了模型深度捷径和推理步骤捷径,让AI系统能像人类一样区分关键与…详细

人工智能潜在空间推理动态计算

2025-06-04 11:14:01
被难倒的视觉语言模型:为什么人工智能看不懂视觉谜题?

这项研究揭示了视觉语言模型在解决视觉文字谜题方面的重大局限性。研究团队通过432个手工注释的谜题数据集,评估了从OpenAI到Google等多家公司的AI模型表现。结果显示,即使最先进的模型在抽象推理、横向思维和理解视…详细

人工智能视觉语言模型多模态推理

2025-06-04 11:06:50
灵活又靠谱,红帽给AI时代定了个调

红帽相信开放将继续带来更快速、更优质的安全改进,而非相反。去年Red Hat Summit带来了Linux AI(RHEL AI)和OpenShift AI的重磅更新,今年则重点聚焦在Linux 10和llm-d。…详细

红帽AILinux

2025-06-04 10:53:04
Adobe 在 Android 上发布 Photoshop 应用 beta 版本

Adobe 周二宣布推出适用于 Android 系统的 Photoshop 应用测试版,提供与桌面版相似的图像编辑工具和 AI 功能,初期免费使用,旨在吸引更多偏好手机创作的年轻用户。…详细

人工智能图像编辑生成式填充

2025-06-04 10:15:03
MMSI-Bench:上海人工智能实验室打造的多图像空间智能新基准,揭示AI与人类空间认知的巨大差距

上海人工智能实验室研究团队开发了MMSI-Bench,这是首个专注于多图像空间智能评估的全面基准。研究人员花费300多小时,从12万张图像中精心构建了1000道问题,涵盖了位置关系、属性和运动等多种空间推理任务。评测结果…详细

多图像空间推理人工智能评估基准视觉语言大模型

2025-06-04 10:14:18
ZPressor:突破性信息瓶颈压缩技术让3D高斯渲染不再受限于输入视图数量

这项研究提出了ZPressor,一种轻量级模块,可帮助前馈式3D高斯渲染(3DGS)模型更有效地处理大量输入视图。研究团队通过信息瓶颈理论,将输入视图分为锚点视图和支持视图,然后使用交叉注意力将支持视图信息压缩到锚…详细

3D场景重建信息瓶颈压缩高斯渲染技术

2025-06-04 10:13:58
视觉世界中的定位强化学习:卡内基梅隆大学团队让AI"看"得更透彻

卡内基梅隆大学研究团队开发了ViGoRL系统,通过视觉定位强化学习显著提升AI的视觉推理能力。该方法让模型将每个推理步骤明确锚定到图像的特定坐标,模拟人类注视点转移的认知过程。与传统方法相比,ViGoRL在SAT-2、B…详细

人工智能视觉推理强化学习

2025-06-04 10:13:38
当你不在时,动物们是如何跳舞的?——华盛顿大学与加州大学伯克利的奇妙动物舞蹈研究

华盛顿大学和UC伯克利的研究团队开发了一种创新框架,让动物在音乐节奏下翩翩起舞。该研究《当你不在时,动物们是如何跳舞的》从少量生成的关键帧开始,通过图优化问题找出满足特定编舞模式的最佳路径,并应用视频扩…详细

人工智能视频生成编舞模式

2025-06-04 10:13:38
Character.AI: 关于角色扮演 AI 工具及其新视频功能须知

文章详细介绍了Character.AI这款主要面向娱乐、角色扮演和互动叙事的AI聊天工具的原理、用户群体、特色功能以及面临的法律与伦理争议,同时揭示了其新推出的视频和游戏互动体验。…详细

人工智能大语言模型新视频功能

2025-06-04 10:13:20
LUNGUAGE:一个结构化胸片X光报告评估的里程碑——KAIST与微软等顶尖团队推出的纵向解读评估框架

LUNGUAGE是由KAIST、微软和多家医疗机构联合开发的胸片X光报告结构化评估框架,解决了现有评估方法忽视时间连贯性和细节准确性的问题。该框架包含1,473份专家标注的胸片报告和80份纵向序列标注,通过两阶段结构化流程…详细

放射学报告评估结构化医学数据时间连贯性分析

2025-06-04 10:13:04
FAMA:意大利和英语的首个大规模开源语音基础模型

意大利布鲁诺·凯斯勒基金会研究团队发布FAMA,首个遵循开放科学原则的英意双语语音基础模型。与Whisper等闭源模型不同,FAMA完全开放训练数据、代码和模型权重,在超过15万小时开源语音数据上训练。研究创建了包含1…详细

语音基础模型开放科学语音识别与翻译

2025-06-04 10:04:59
agentic AI 预计到2028年将处理68%的客户服务互动

思科报告指出,自主型人工智能未来三年内有望承担高达68%的客户服务任务,通过个性化与前瞻性支持提升效率与节省成本,但用户仍重视人与人之间的互动和健全的治理机制。…详细

人工智能Agentic AI优化客户体验

2025-06-04 10:03:12
重载计算:AI 数据中心存在重量问题

随着 AI 设备密集度攀升,传统数据中心正面临设备重量增加带来的结构挑战,促使设计向单层和强化地板转变。…详细

人工智能高密度服务器数据中心设施升级

2025-06-04 10:02:57
Wispr Flow 发布 iOS 应用 力图让口述输入变得毫不费力

一款支持100多种语言的语音输入软件从Windows、Mac延伸到iOS,提供键盘语音双模式,体验流畅并能自动学习专有名词,订阅模式也颇具竞争优势。…详细

人工智能语音转文本多语言支持

2025-06-04 10:01:20
AI 转型项目受遗留应用程序与陈旧数据管理的制约

许多企业因遗留系统和陈旧数据架构积累技术债,致使自动化和AI转型步履维艰。Pegasystems调查显示,庞大的老旧应用和分散数据正阻碍新技术落地,其推出的数据集成平台和Pega Agentic Process Fabric为此提供了解决方…详细

人工智能实时数据集成Agentic AI 支持

2025-06-04 09:59:42
岗位空缺分析显示具备 AI 技能者薪资显著提升

PwC 分析近十亿招聘广告发现,掌握 AI 技能的员工平均薪资提升 11%,并推动行业生产力与收入大幅增长,促使岗位技能迅速转变并创造新机遇。…详细

人工智能大语言模型薪资增长分析

2025-06-04 09:59:01
SailPoint为基于 AI 的身份安全指明方向

SailPoint将agentic AI技术融入其身份安全平台,推出新工具以管理和保护企业中不断增长的AI代理,实现身份治理和访问控制合规。…详细

人工智能生成式 AI新型算法

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章