科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-15 11:34:20
斯坦福大学突破性视频生成技术:让AI记住更多画面还不"跑偏"的FramePack方法

斯坦福大学研究团队提出FramePack技术,通过几何级数压缩和反向采样策略,有效解决了AI视频生成中的遗忘-漂移矛盾问题。该方法实现了固定计算复杂度下的任意长度视频生成,在多项评估指标上表现优异,为AI视频生成领…详细

视频生成深度学习新型算法

2025-07-15 11:11:29
AI应用的“安全锁”:安全闪存技术在满足行业认证中的作用

采用如华邦电子具备授权与认证机制的安全闪存技术,可有效防御未经授权的访问和恶意攻击,从而保障数据的机密性、完整性和真实性…详细

2025-07-15 10:44:22
黄仁勋:H20 将在中国恢复销售,并针对中国推出全新且完全兼容的专用 GPU

NVIDIA 将恢复 H20 在中国的销售,并宣布推出面向中国市场的全新且完全兼容的 GPU。…详细

2025-07-15 10:13:47
海外AI实验室首次破解R1-Zero训练谜题:原来这些神奇的AI推理能力是这样炼成的

新加坡联合研究团队首次全面解析R1-Zero训练方法,发现传统算法存在隐藏偏差,提出改进版Dr. GRPO算法。研究揭示AI"自我反思"能力的真相,并用极简配方在7B模型上创造AIME 2024新纪录,为AI推理训练提供重要洞察和实…详细

人工智能强化学习算法优化

2025-07-15 10:11:11
Meta建设5GW超大规模AI数据中心抢占AI竞赛先机

Meta正在建设名为Hyperion的数据中心,预计提供5千兆瓦算力支持其AI实验室。该项目占地面积足以覆盖曼哈顿大部分区域,位于路易斯安那州东北部,将在数年内扩展至5GW规模。此外,Meta还计划在2026年启用1GW的Prometh…详细

人工智能数据中心基础设施建设

2025-07-15 10:10:06
AI也能看图学本事了!南开大学团队让机器像人一样举一反三

南开大学团队开发的VisualCloze系统通过"视觉上下文学习"实现了通用图像生成,让AI能够像人类一样通过观察几个例子就学会新的图像处理任务。该系统采用统一架构处理多种任务,在风格转换、图像编辑、条件生成等方面都…详细

视觉上下文学习通用图像生成AI多任务学习

2025-07-15 10:10:03
Google为NotebookLM添加精选笔记本功能,涵盖多元化主题内容

谷歌为其AI驱动的NotebookLM平台新增"精选笔记本"功能,与全球知名作者、研究人员、出版物和非营利组织合作创建高质量互动资源。首批精选笔记本涵盖长寿建议、2025年预测、人生建议和莎士比亚作品等主题。用户可通过…详细

人工智能自然语言处理产品功能升级

2025-07-15 10:09:53
GPT-4o真的能统一图像生成和理解吗?UCLA研究团队揭示多模态AI的"阿喀琉斯之踵"

UCLA研究团队通过三个维度的测试发现,GPT-4o虽然能生成高质量图像,但在抽象推理、规则遵循和逻辑判断方面存在严重局限。研究揭示了当前多模态AI"表面聪明,深层糊涂"的问题,挑战了关于统一视觉理解与生成能力的假…详细

人工智能图像生成多模态模型

2025-07-15 10:09:44
Claude AI 现已集成 Canva 设计平台

Anthropic的Claude AI现在可以在聊天界面内直接使用Canva视觉工作室创建和编辑设计。该集成基于Canva服务器和Anthropic的模型上下文协议(MCP)技术。Claude可以使用Canva工具生成设计或搜索用户工作区内的素材。此功能…详细

人工智能模型上下文协议平台集成

2025-07-15 10:09:37
ByteDance推出Multi-SWE-bench:让AI程序员学会修复全球七种编程语言的Bug

ByteDance研究团队构建了Multi-SWE-bench,这是首个覆盖七种主流编程语言的AI编程能力评测平台,包含1632个人工验证的真实Bug修复案例。测试显示现有顶级AI模型存在严重的语言偏见,在Python以外语言上表现大幅下降。…详细

多语言编程AI代码生成软件工程测试

2025-07-15 10:09:22
香港大学突破性研究:让AI看图更聪明的"超级翻译器"问世

香港大学团队开发出拥有30亿参数的视觉分词器GigaTok,首次解决了AI图像理解中"重建质量"与"生成质量"相互矛盾的技术难题。通过创新的语义正则化方法,该技术在保持图像重建精度的同时大幅提升了图像生成效果,为统一…详细

视觉分词器图像生成语义正则化

2025-07-15 10:09:00
AI视觉智能的色彩感知大考:大学马里兰分校团队揭示多模态模型的"色盲"真相

这项由马里兰大学团队进行的研究首次系统评估了32个主流AI模型的色彩理解能力,发现即使最先进的模型在基础色彩认知上也存在明显不足。研究通过COLORBENCH测试系统,从色彩感知、推理和稳定性三个维度进行评估,揭示…详细

人工智能色彩理解多模态模型

2025-07-15 10:08:03
ACTalker:香港科技大学团队打造会表情的AI主播,让视频通话变得更自然

香港科技大学团队开发的ACTalker系统实现了多信号协同控制的说话头像生成突破,通过并行控制曼巴层和面具丢弃策略,让AI能同时根据音频和面部动作生成自然的说话视频,在语音同步性和表情控制精度方面全面超越现有方…详细

人工智能视频生成多信号控制

2025-07-15 10:05:31
Perplexity推出AI浏览器引领智能体应用时代

Perplexity本周发布的Comet AI浏览器标志着智能代理应用时代的到来。该浏览器采用AI原生设计,配备能够理解网页内容的AI助手,可在侧边栏中实时回答用户问题。OpenAI随即宣布将推出自己的AI浏览器,验证了这一趋势。…详细

人工智能自然语言处理新型架构

2025-07-15 10:04:08
Solo.io获得VB Transform 2025创新展示"最具成功潜力"奖

云原生应用网络公司Solo.io在旧金山VB Transform创新展示会上荣获"最有可能成功"奖。该公司发布了Kagent Studio框架,帮助企业在Kubernetes中构建、保护、运行和管理AI代理。该框架提供VSCode原生扩展集成、实时事件…详细

人工智能云计算平台工程

2025-07-15 10:02:07
FlowReasoner:新加坡Sea AI Lab团队让AI智能体系统实现"一人一策"的突破性研究

这是由新加坡Sea AI Lab等机构联合完成的突破性研究,提出了FlowReasoner查询级元智能体系统。该系统能为每个用户查询定制专门的多智能体解决方案,突破了传统"一套方案解决一类问题"的局限。通过推理能力结合外部执…详细

人工智能多智能体系统强化学习

2025-07-15 10:01:47
新加坡大学团队重大突破:让AI大脑快速思考不再是梦,推理效率提升十倍不止!

新加坡国立大学团队发布重要综述,系统梳理大型推理模型的效率优化技术。研究将优化方法分为显式压缩和隐式编码两大路线,涵盖思维链压缩、偏好优化、奖励机制等多种技术。通过对50多种方法的深入分析,发现这些技术…详细

人工智能推理优化大型语言模型

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章