红帽相信开放将继续带来更快速、更优质的安全改进,而非相反。去年Red Hat Summit带来了Linux AI(RHEL AI)和OpenShift AI的重磅更新,今年则重点聚焦在Linux 10和llm-d。…详细
Adobe 周二宣布推出适用于 Android 系统的 Photoshop 应用测试版,提供与桌面版相似的图像编辑工具和 AI 功能,初期免费使用,旨在吸引更多偏好手机创作的年轻用户。…详细
上海人工智能实验室研究团队开发了MMSI-Bench,这是首个专注于多图像空间智能评估的全面基准。研究人员花费300多小时,从12万张图像中精心构建了1000道问题,涵盖了位置关系、属性和运动等多种空间推理任务。评测结果…详细
这项研究提出了ZPressor,一种轻量级模块,可帮助前馈式3D高斯渲染(3DGS)模型更有效地处理大量输入视图。研究团队通过信息瓶颈理论,将输入视图分为锚点视图和支持视图,然后使用交叉注意力将支持视图信息压缩到锚…详细
卡内基梅隆大学研究团队开发了ViGoRL系统,通过视觉定位强化学习显著提升AI的视觉推理能力。该方法让模型将每个推理步骤明确锚定到图像的特定坐标,模拟人类注视点转移的认知过程。与传统方法相比,ViGoRL在SAT-2、B…详细
华盛顿大学和UC伯克利的研究团队开发了一种创新框架,让动物在音乐节奏下翩翩起舞。该研究《当你不在时,动物们是如何跳舞的》从少量生成的关键帧开始,通过图优化问题找出满足特定编舞模式的最佳路径,并应用视频扩…详细
文章详细介绍了Character.AI这款主要面向娱乐、角色扮演和互动叙事的AI聊天工具的原理、用户群体、特色功能以及面临的法律与伦理争议,同时揭示了其新推出的视频和游戏互动体验。…详细
LUNGUAGE是由KAIST、微软和多家医疗机构联合开发的胸片X光报告结构化评估框架,解决了现有评估方法忽视时间连贯性和细节准确性的问题。该框架包含1,473份专家标注的胸片报告和80份纵向序列标注,通过两阶段结构化流程…详细
意大利布鲁诺·凯斯勒基金会研究团队发布FAMA,首个遵循开放科学原则的英意双语语音基础模型。与Whisper等闭源模型不同,FAMA完全开放训练数据、代码和模型权重,在超过15万小时开源语音数据上训练。研究创建了包含1…详细
思科报告指出,自主型人工智能未来三年内有望承担高达68%的客户服务任务,通过个性化与前瞻性支持提升效率与节省成本,但用户仍重视人与人之间的互动和健全的治理机制。…详细
一款支持100多种语言的语音输入软件从Windows、Mac延伸到iOS,提供键盘语音双模式,体验流畅并能自动学习专有名词,订阅模式也颇具竞争优势。…详细
许多企业因遗留系统和陈旧数据架构积累技术债,致使自动化和AI转型步履维艰。Pegasystems调查显示,庞大的老旧应用和分散数据正阻碍新技术落地,其推出的数据集成平台和Pega Agentic Process Fabric为此提供了解决方…详细
PwC 分析近十亿招聘广告发现,掌握 AI 技能的员工平均薪资提升 11%,并推动行业生产力与收入大幅增长,促使岗位技能迅速转变并创造新机遇。…详细
SailPoint将agentic AI技术融入其身份安全平台,推出新工具以管理和保护企业中不断增长的AI代理,实现身份治理和访问控制合规。…详细
这项研究提出了KronSAE,一种新型稀疏自编码器架构,通过克罗内克积分解显著降低了训练成本。研究者引入了模拟二进制AND操作的mAND激活函数,在减少参数量的同时提高了重建质量和特征可解释性。实验证明,KronSAE在各…详细
这项由加州大学伯克利分校研究团队开发的REOrder框架,通过重新排列图像块的处理顺序,显著提升了视觉模型性能。研究发现,传统的行主序排列并非最优选择,而通过信息论先验和强化学习寻找最佳排序,可在不修改模型架…详细
这篇研究介绍了香港科技大学团队开发的难度感知提示法(DAP),一种能够根据问题难度智能调整推理链长度的创新方法。通过这一方法,研究者构建了LiteCoT数据集,包含10万个简洁推理样本,平均仅720个标记,比传统方法减…详细
格罗宁根大学和哈佛大学的研究团队发现,当前大型推理模型在被要求用非英语语言"思考"时,面临严重的语言匹配与准确性权衡。他们通过评估六个先进模型,揭示即使最强大的32B参数模型也经常默认使用英语推理,而非用户…详细
这篇研究综述探讨了大语言模型(LLMs)与知识图谱(KGs)在问答系统中的结合方式。研究者提出新的分类法,根据问答类型和KG角色将方法分为:KG作为背景知识、推理指南或验证器。文章系统性分析了各种复杂问答类型(多文档…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。