这项突破性研究由法国瓦雷奥公司联合荷兰高校团队完成,开发出名为Franca的开源AI视觉模型。该模型仅使用公开数据训练,却在图像分类、物体检测、语义分割等多项任务中达到或超越了谷歌、Meta等科技巨头的私有模型性…详细
高通AI研究院开发出CSD-VAR技术,能够从单张图片中精确分离内容与风格,实现灵活的视觉创作。该技术针对视觉自回归模型设计,通过尺度感知优化、SVD修正和增强记忆机制三大创新,有效解决了传统方法的内容泄漏问题。…详细
西班牙马德里理工大学研究团队开发了全球首个融入能耗意识的AI评估平台——生成式能源竞技场(GEA),通过对694个评估样本的分析发现,当用户了解AI模型能耗信息后,46%的用户会改变原始选择,更节能小模型的获胜率从…详细
牛津大学研究团队开发了基于期望值的新型股市风险评估方法,通过分析FTSE 100指数20年数据发现,该方法在预测极端市场事件方面比传统方法准确25%以上。新方法不仅考虑风险事件的发生概率,还特别关注事件的严重程度,…详细
小红书NLP团队开发了专门针对社交网络的AI模型RedOne,通过三阶段训练策略处理社交媒体特有的非正式语言和多元化任务。该模型在社交网络基准测试中比基础模型平均提升14.02%,在实际应用中将有害内容检测准确率提升1…详细
上海交通大学研究团队发现扩散式大语言模型存在严重安全漏洞,其开发的DIJA攻击方法能以接近100%成功率绕过AI安全防护,诱导模型生成危险内容。该攻击利用扩散模型的双向建模和并行解码特性,通过插入掩码标记让AI误…详细
清华大学等机构联合发布Mono-InternVL-1.5多模态大语言模型,通过创新的单体式架构设计,实现了用58%更少的训练数据达到更好性能的突破。该模型采用视觉专家嵌入和渐进式训练策略,有效解决了多模态学习中的灾难性遗…详细
Mistral AI发布了两个开源多模态语音AI模型Voxtral Mini和Small,不仅具备语音识别能力,更能理解语音内容并进行智能对话。模型支持32K上下文窗口,可处理40分钟长音频,在语音识别、翻译和理解任务中达到最先进水平…详细
浙江大学和新加坡国立大学联合开发的AutoSteer系统,为多模态大语言模型提供了创新的安全防护机制。该系统通过安全意识评分自动识别AI内部最佳监控点,结合智能毒性检测器和拒绝机制,实现了既强大又安全的AI防护。实…详细
HSE大学研究团队提出了RiemannLoRA方法,创新性地将黎曼几何引入大型模型的低秩适应训练中。该方法通过统一框架同时解决了初始化选择和过参数化两个关键问题,在常识推理和图像生成任务上都显著优于传统LoRA方法,为…详细
浙江大学研究团队开发的Diffuman4D系统实现了从稀疏视频重建高质量三维人物表演的技术突破。该系统仅需4台摄像头就能生成多视角一致的高分辨率视频,通过创新的滑动迭代去噪机制和人体骨骼引导,解决了传统方法在时空…详细
清华大学研究团队开发出能够像人类一样理解物理世界的人工智能系统。该系统采用"子等变图神经网络"架构,内置物理规律,能仅通过观察预测物体运动和相互作用。与传统AI相比,新系统预测精度提升30-45%,且具备强大的…详细
7月23日,2025开放原子开源生态大会开源鸿蒙主题演讲(以下简称“主题演讲”)在北京国家会议中心二期顺利召开。…详细
近日,长期未出现在公众视线中的全球知名创新企业家、慈善家,盛大集团和天桥脑科学研究院创始人陈天桥,罕见地在媒体上公开发声。他在接受记者书面采访时,就目前脑机接口等硬核科创领域发展发表见解,呼吁科创投资…详细
Mureka O1模型与Mureka V6模型自3月底发布以来,收获了全球用户的广泛好评,新增注册用户近300万。…详细
超智算(北京)科技有限公司(以下简称“超智算”)近日宣布完成亿元级战略融资,该轮融资由北京市石景山区现代创新产业发展基金有限公司领投。…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。