TRANSFORMER文章列表第1页-至顶网频道

TRANSFORMER 关键字列表

Google 的 “world-model” 赌注：打造 AI 操作层，而不是让 Microsoft 抢占用户界面

人工智能

TRANSFORMER

新型算法

2025-05-26

Google 的 “world-model” 赌注：打造 AI 操作层，而不是让 Microsoft 抢占用户界面

谷歌正全力打造具备“世界模型”的全能 AI 助手，通过深度整合各项技术与产品，旨在重塑搜索体验，并在 AI 竞争中超越微软和 OpenAI。

Anthropic 联合创始人 Jared Kaplan 将出席 TechCrunch Sessions: AI

人工智能

TRANSFORMER

新型算法

2025-04-30

Anthropic 联合创始人 Jared Kaplan 将出席 TechCrunch Sessions: AI

Anthropic 联合创始人兼首席科学家 Jared Kaplan 将于6月5日在 UC Berkeley 的 Zellerbach Hall 出席 TC Sessions: AI，讲解混合推理模型与风险治理框架，探讨 AI 如何革新人机互动。

人工智能

TRANSFORMER

优化模型

2025-04-29

DeepSeek 成功证明：动力是 AI 创新的关键

2025年1月，DeepSeek 从中国闪亮登场，挑战 OpenAI 及美国巨头。其通过优化 KV 缓存、采用 MoE 策略及强化学习，提升硬件与能源效率，为大语言模型领域开辟新路径。

TRANSFORMER

腾讯

Hunyuan-Large

Transformer

2024-11-06

腾讯放大招，超Meta！史上参数最大，开源专家混合模型

腾讯开源了基于Transformer架构的Hunyuan-Large模型，拥有3890亿参数，优于Meta的LLama3.1 - 405B模型。Hunyuan-Large采用MoE结构，高效训练和推理，支持长达256K上下文。使用了KV缓存压缩技术，减少内存占用。训练数据包括7万亿token，包括高质量合成数据。模型在CommonsenseQA、PIQA、WinoGrande等测试中表现优异。