斯坦福大学研究团队开发出SpeechDriveFace技术,能够仅通过声音生成逼真的说话面部视频。该技术通过深度学习建立声音与面部表情的映射关系,在清晰度、同步性等测试中表现优异,超过80%观察者无法区分真假。技术在内…详细
Captions公司推出的Mirage是一项革命性的AI视频生成技术,仅通过音频就能生成完全匹配的说话视频。该技术采用先进的扩散模型,能够分析音频中的语调、节奏和情感信息,转换为自然流畅的视频内容。Mirage在嘴唇同步准…详细
中国AI公司DeepSeek发布旗舰语言模型V3.1更新版,该模型已针对新一代国产芯片进行优化。新模型采用UE8M0数据类型训练,为即将发布的国产芯片做准备。V3.1统一了"思考"和"非思考"模式,单一模型支持两种范式,上下文窗…详细
VAST Data发布SyncEngine通用数据目录和高性能导入解决方案,能够发现、编目并捕获其他供应商存储系统中的文件和对象数据,将其导入VAST的AI专用系统。该工具提供跨文件系统、对象存储和SaaS应用的实时可搜索目录,使…详细
微软在Windows 11 Insider Preview Canary Channel build 27928中将语言和时间设置从控制面板迁移至设置应用。新功能包括添加时钟、选择时间服务器、时间格式设置以及数字货币格式更改等。微软去年曾表示控制面板"已…详细
谷歌正在将其搜索引擎的AI模式推广到全球更多地区,同时不断提升人工智能技术的智能化水平。这一举措标志着谷歌在搜索领域的AI应用将覆盖更广泛的用户群体,为全球用户提供更加智能、精准的搜索体验。通过持续的技术…详细
安全研究人员发现,谷歌Gemini CLI等生产级AI系统容易受到图像缩放攻击。攻击者通过在图像中嵌入恶意提示,利用AI系统的图像缩放算法使隐藏指令在缩放后显现,从而绕过安全机制实现数据窃取。研究团队开发了开源工具…详细
哈佛大学和麻省理工学院研究团队开发了MetaFlows,一种革命性的AI学习方法,能让机器像人类一样从少量例子中快速学会新技能。该技术结合流匹配和元学习,显著提升数据效率,在图像生成和视频合成等任务中表现出色。M…详细
微软研究院开发出Logic-RL训练框架,仅用5000个逻辑谜题就让7B参数AI模型学会深度推理。该方法通过强化学习让AI自发发展出反思、验证等思维能力,在数学竞赛中实现125%性能提升,证明了小规模精准训练的巨大潜力,为…详细
约翰霍普金斯大学团队提出R2-T2方法,通过测试时动态调整专家权重让多模态AI更智能。该技术无需重训练就能让7B小模型性能超越34B大模型,在视觉问答等9个基准测试中取得显著提升。核心思路是让AI在遇到新任务时自动寻…详细
阿里巴巴达摩院开发的PREL框架通过渐进式学习让AI具备类人推理能力,在复杂推理任务中性能提升超35%。该框架采用多层次架构和动态推理路径,解决了传统AI推理混乱、上下文丢失等问题,已在医疗诊断、金融评估等领域展…详细
韩国KAIST团队开发的Mol-LLaMA是首个能像化学专家一样理解分子并解释其性质的AI系统。该系统通过融合2D和3D分子信息,不仅能准确预测分子特性,还能详细解释背后的科学原理,在药物发现、化学教育等领域展现出巨大应…详细
OpenAI研究团队创建了SWE-Lancer基准,通过1400多个来自Upwork的真实软件工程任务(总价值100万美元)评估AI编程能力。测试包括个人编程任务和技术管理决策,使用专业工程师编写的端到端测试进行评估。最佳AI模型Cla…详细
MIT科学家开发的CellSAM人工智能系统能够仅通过普通显微镜的黑白照片预测细胞内部结构,准确率高达95%。该技术突破了传统荧光显微镜的局限,无需昂贵标记物就能同时观察多种细胞器,将加速药物开发、改善疾病诊断,并…详细
斯坦福大学研究团队运用先进脑成像技术,首次实时观察音乐对大脑的影响机制。研究发现音乐如同"大脑指挥家",能协调多个脑区活动,实现神经振荡同步,调节情绪、增强记忆、激发创造力并促进社交连接。不同音乐类型激…详细
2025年8月21日,荣耀在上海举办“绽放之夜”主题发布会,正式发布新一代竖折旗舰——荣耀 Magic V Flip2。秉承以人为本,科技与人文相结合的理念,荣耀以“掌中高定 旗舰实力”定义产品,用人文科技绽放女性的闪耀时…详细
Quinas科技完成ULTRARAM通用存储器量产的关键步骤,该技术结合了DRAM的速度、NAND的非易失性和低功耗特性。IQE公司成功将兰卡斯特大学开发的化合物半导体层扩展到工业化工艺,开发出可扩展存储设备的镓锑化物和铝锑化…详细
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。