Mergenetic是一个开源工具库,让研究人员能在普通GPU上进行进化式模型合并。由罗马萨皮恩扎大学和洛桑联邦理工学院研究者开发,它集成了19种进化算法和6种合并策略,支持数据集抽样以减少计算负担,并提供Python API、命令行和图形界面三种交互方式。通过案例研究证明,该工具能有效合并多语言模型和促进跨语言能力迁移,降低了高质量模型合并的技术门槛,使普通研究者也能创造出优秀的语言模型。
本研究提出了MuToR,一种通过在输入序列中插入"寄存器令牌"来改进大语言模型训练的创新方法。与传统的"下一个词预测"方法相比,MuToR使模型能够同时预测多个未来词,从而提供更丰富的学习信号。这种方法不需要改变模型架构,仅增加极少量参数,并且在微调预训练模型时表现尤为出色。研究团队在数学推理、文本摘要和图像生成等多种任务上验证了其有效性,证明MuToR不仅能提高模型性能,还能在保持推理速度的同时增强模型的规划能力。
剑桥大学和伦敦大学学院的研究团队提出了一种名为"视觉规划"的全新范式,让人工智能系统能够完全通过图像序列而非文本进行推理。与传统依赖语言的方法不同,这种方法模仿人类在解决空间问题时直接在"心眼"中想象解决方案的能力。研究团队开发的基于强化学习的视觉规划框架(VPRL)在导航任务上比基于文本的方法平均提高了40%的准确率,证明了非语言推理在特定任务中的优越性,为AI系统开辟了一条更接近人类直觉思维的新路径。
Red Hat 推出的 AI 推理服务器基于 vLLM 与 Neural Magic 技术,通过压缩模型和优化 GPU 内存管理,实现生成式 AI 快速推理和混合云部署。
本文概述了物联网设备安全面临的不断升级的网络攻击风险,讨论了因设备普及和互联带来的漏洞、AI驱动的恶意软件威胁以及供应链风险,并提出了通过风险管理、标准制定和先进防护措施来应对这些挑战的重要性。
BBC 的研发团队致力于利用技术为公共利益服务,从内容真实性验证、沉浸式媒体体验到 AI 语音转文字系统,实现跨行业创新,造福社会。
文章介绍了 OpenAI 推出的全新编码系统 Codex,该系统可根据自然语言指令执行复杂编程任务,并引领从传统自动补全向自主完成编程任务转变,同时讨论了此类工具面临的挑战与未来发展前景。
由阿里巴巴钱文团队与浙江大学合作的研究提出了"并联缩放"(ParScale)方法,一种全新的大语言模型能力提升策略。不同于增加参数或延长推理时间的传统方法,ParScale通过多路并行计算来提升模型性能:它使模型同时从多个角度处理同一输入,再智能整合结果。研究表明,P倍并行计算相当于增加O(log P)倍参数,但内存和延迟开销显著降低。对于1.6B参数模型,8路并行可节省22倍内存增长和6倍延迟增长。更重要的是,此方法可应用于现有模型,通过少量数据的后训练即可实现性能提升,为资源受限场景下部署强大AI提供新思路。
这项研究提出了一种系统化培养大型推理模型核心能力的方法,不再依赖难以预测的"啊哈时刻"。研究团队基于皮尔斯的经典推理三元组(演绎、归纳、溯因),设计了自动生成的训练任务,实现三阶段训练流程:单独对齐各元能力,参数空间合并,领域特定强化学习。实验表明该方法在数学、编程和科学基准测试上提升了10%以上的性能,并能提高后续学习的性能上限,为构建更可靠的AI推理系统提供了新思路。
在新任CIO Mark Sherwood的引领下,Wolters Kluwer借助多云战略、人工智能创新与信息安全管理,实现从传统出版向科技型企业的全面转型,加速全球业务落地与数字升级。
微软将 GPT-4o 图像生成功能融入 Microsoft 365 Copilot,用户可在 Word、Excel、Outlook 等应用中直接创建与编辑逼真图片,此更新同时面向企业和普通用户,拓展了创意工具的边界。
Nvidia 首席执行官黄仁勋宣布通过全新 NVLink Fusion 系统,让数据中心客户可同时采用 Nvidia 与其他厂商的芯片,实现系统定制与竞争共存,巩固公司在 AI 领域的核心地位。
微软将 xAI 的 Grok 3 系列引入 Azure AI Foundry,进一步扩展 AI 模型选择。该平台现托管逾1900款模型,支持安全数据整合与定制管理,同时面临争议与偏见风险。
该文探讨企业如何利用超级计算推动 AI 项目落地。HPE 高性能计算及 AI 基础设施负责人表示,密集计算、扩展架构与液冷技术正助力大规模数据中心建设,亚太区增长迅猛,但高投入、能耗和人才短缺仍是严峻考验。
Nvidia在台北Computex 2025展示了一系列AI创新,包括连接全球GPU计算资源的AI平台、升级的人形机器人基础模型GR00T N1.5和NVLink Fusion方案,以助力构建大规模AI工厂。
高通正借助在 AI 时代的独特 CPU 技术(包括收购 Nuvia 技术)重返数据中心市场,着力打造低功耗高性能的推理集群,或与 Nvidia GPU 搭配。同时,其 CEO 提及 AI PC 市场进展,并预告将在九月发布新一代 Snapdragon X 处理器。
这篇博文深入解析了KAIST与卡内基梅隆大学研究团队开发的COT ENCYCLOPEDIA框架,该框架能够自下而上地分析、预测和控制大语言模型的推理策略。研究显示,不同的推理策略对模型表现有显著影响,且这些策略主要由训练数据的格式而非内容领域塑造。通过引导模型采用最优策略,可提升模型准确率2.5%-8.3%,为AI系统优化提供了全新方向。
这项研究介绍了TokenAdapt,一种通过混合启发式初始化策略帮助大型语言模型实现分词器灵活性的创新框架。研究团队同时探索了学习多词"超级词元"技术,以增强压缩效率并减少标记碎片化。实验证明TokenAdapt显著优于现有方法,在零样本困惑度测试中表现突出,甚至比ReTok方法提高约2倍性能。该项工作为解决LLM分词器锁定问题提供了计算效率高且广泛适用的解决方案。
这项研究介绍了一种创新的两阶段SVG风格定制方法,使AI能够生成具有特定风格的矢量图形。香港城市大学和Adobe研究院的团队首先训练一个路径级T2V扩散模型掌握SVG结构,然后通过从定制的图像扩散模型中提取风格知识来实现风格定制。与现有方法相比,该技术既保持了SVG的结构规律性,又能灵活适应不同风格,为设计师提供了一个强大工具,可以根据文本描述高效生成风格一致的矢量图标。
低代码市场正迎复兴,Kissflow凭借包括业务用户与IT团队都可使用的全能平台迅速找到定位。平台支持从流程自动化到应用开发的规模化扩展,并集成AI功能,加速构建和监控,助力东南亚企业实现数字化转型。