Cohere的非营利研究实验室本周发布了一款多模态“开放”AI模型Aya Vision,该实验室声称其为同类最佳。Aya Vision能够执行图像描述、回答照片相关问题、翻译文本以及生成23种主要语言的摘要等任务。Cohere还通过WhatsApp免费提供Aya Vision,称这是“使技术突破对全球研究人员可及的重要一步”。
对于企业来说,从启动到可持续增长的道路可能充满不确定性,但关键在于:解决真实问题,让客户为你的解决方案付费,并确保收入超过获取成本。对于独立创业者而言,在没有雇佣资源的情况下实现规模化的挑战更为艰巨。幸运的是,今天的企业家有一个强大的替代方案:人工智能代理。这些自主的人工智能工具可以帮助你的企业在不立即扩展团队的情况下实现增长,这在每一美元收入都要重新投入到业务中的阶段尤为重要。
AI助手正如火如荼,但专注于分析、整理和得出结论的大量数据的助手又如何呢?Google的数据科学助手正是为此而生:这款新的、免费的Gemini 2.0驱动的AI助手,旨在自动化数据分析,现已在特定国家和语言中向18岁及以上用户免费提供。
OpenAI 最近推出了 GPT-4.5,这款新模型在准确性测试中表现优于之前的版本,能够更好地理解细微差别。尽管面临 GPU 短缺的挑战,OpenAI 仍然致力于将这一模型推向市场,并计划在未来推出更先进的推理能力模型。
Contextual AI今天发布了其基础语言模型(GLM),声称在行业中提供了最高的事实准确性,超越了Google、Anthropic和OpenAI的领先AI系统,在一个关键的真实性基准测试中表现出色。该公司由检索增强生成(RAG)技术的先驱创立,GLM在FACTS基准测试中获得了88%的事实得分,而Google的Gemini 2.0 Flash为84.6%,Anthropic的Claude 3.5 Sonnet为79.4%,OpenAI的GPT-4o为78.8%。
VDURA是一家高性能计算和人工智能并行文件系统存储供应商,最近在其V5000硬件架构平台上增加了一个高容量全闪存存储节点。V5000于三个月前推出,配备了中央瘦型(1RU)控制节点,控制混合闪存+磁盘存储节点。新推出的全闪存F节点是一个1RU服务器机箱,最多可容纳12个128 TB NVMe QLC SSD,提供1.536 PB的原始容量。VDURA的首席执行官Ken Claffey表示,AI工作负载需要持续的高性能和可靠性,因此V5000不仅能达到最高速度,还能在硬件故障的情况下保持这些速度。
Google Cloud 推出两项新的 AI 功能:一是面向数据科学家的 Data Science Agent,可在 Google Colab 中快速进行数据分析;二是面向医疗专业人士的 Vertex AI Search 多模态搜索功能,可更全面地分析患者健康信息。这些 AI 创新旨在提高数据分析效率和医疗诊断准确性,推动 AI 在科技和医疗领域的应用。
领先的 AI 公司正在采用"蒸馏"技术,以创造更便宜、更易采用的 AI 模型。这种技术在 DeepSeek 成功应用后引起广泛关注,引发了硅谷 AI 领导地位的动摇。蒸馏技术通过将大型语言模型的知识转移到小型模型中,实现了高效且经济的 AI 应用。这一突破为初创公司和开发者提供了更多机会,同时也对现有 AI 公司的商业模式构成了挑战。
人工智能公司 Anthropic PBC 今日宣布已完成一轮 35 亿美元的融资,估值达到 615 亿美元。这轮 E 轮融资在公司从 Google LLC 筹集 10 亿美元不到两个月后进行。两个月前,亚马逊公司将对 Anthropic 的投资翻倍至 80 亿美元。亚马逊网络服务自去年九月起成为该人工智能提供商的主要云服务商。
云计算基础设施提供商 CoreWeave Inc. 正在瞄准公开市场,希望借此满足投资者对人工智能的强烈需求。该公司今天表示,已向美国证券交易委员会提交了首次公开募股所需的文件,文件显示其将在纳斯达克交易所以“CRWV”股票代码交易。摩根士丹利主导此次发行,摩根大通和高盛提供协助。
自2022年末ChatGPT推出以来,专家们一直在讨论人工智能语言模型将如何影响世界。几年后,情况逐渐明朗。根据斯坦福大学领导的新研究,分析了跨多个行业的超过3亿条文本样本,发现人工智能语言模型现在在各行业的专业沟通中提供了高达四分之一的写作支持,尤其是在美国教育水平较低的地区影响显著。
Zoom Communications的研究团队开发了一种突破性技术,能够显著降低人工智能系统在处理复杂推理问题时所需的成本和计算资源,可能会改变企业大规模部署AI的方式。该方法称为草稿链(Chain of Draft,CoD),使大型语言模型能够用最少的文字解决问题——所需文本仅为当前方法的7.6%,同时保持或甚至提高准确性。研究结果上周在arXiv研究库中发表。
Podcastle是一款播客录制和编辑平台,现已推出名为Asyncflow v1.0的AI文本转语音模型,并为开发者提供API接口,方便其在应用中直接集成该模型。新模型支持超过450种AI语音,能够为文本进行朗读。该公司表示,其技术和模型的训练及推理成本较低,使其在竞争中具备优势。Podcastle的创始人Arto Yeritsyan表示,尽管开发成本高昂,但得益于最近的大型语言模型进展,Podcastle终于能够在不需要大量数据的情况下构建高质量的语音模型。
C++ 的创始人比雅恩·斯特劳斯特鲁普呼吁 C++ 社区捍卫这门编程语言,近年来由于其内存安全缺陷而被网络安全机构和技术专家所忽视。
Opera浏览器现在拥有“代理AI”,用户可以请求内置的AI模型执行需要一系列浏览器内操作的任务。虽然这项技术展示可能有趣,但实际上它只是将网络浏览委托给一个能力有限的个人助手。AI代理被称为浏览器操作员,可以帮助用户找到可购买的12双10码Nike袜子。尽管用户可以在15秒内通过访问Walmart在线商店完成相同操作,但这项技术的推出标志着浏览器角色的转变。
亚马逊即将推出一系列新的Alexa Plus伴侣设备,这标志着生成式人工智能在消费者日常生活中的首次大规模应用。Jassy表示,这些伴侣设备只是Alexa可持续商业模式的一部分,未来将通过移动和桌面界面提供新产品和广告服务,并推出订阅服务。
一项新研究发现,深度搜索(DeepSeek)生成的文本中,有惊人的 74.2% 与 OpenAI 的 ChatGPT 输出在风格上有显著相似性。这一发现表明,深度搜索可能是基于 ChatGPT 的输出进行训练的。
物理人工智能代表了人工智能从纯数字系统向能够与现实世界互动的智能机器的演变。与仅依赖软件的人工智能不同,物理人工智能将算法与传感器和执行器结合在机器人、车辆和设备中,使它们能够感知周围环境并实时做出决策。这些系统能够自主运行,适应不断变化的环境,而不是遵循固定的编程。
美光宣布推出首款1y (1-gamma) DDR5内存芯片样品,以满足AI处理系统的需求。这不仅彰显了美光在技术和制造领域的领先地位,还将这一先进工艺扩展到更广泛的DRAM芯片产品组合中。新产品将为智能手机带来更高性能和更低功耗,同时推出的移动存储解决方案也将为折叠屏手机设计提供支持。
Stripe 年度报告显示,AI 初创企业增长速度远超传统 SaaS 公司。顶级 AI 企业仅用 24 个月就实现 500 万美元年化收入,而 SaaS 公司则需 37 个月。Stripe 认为,将这些初创企业称为"LLM 包装器"忽视了它们在特定行业中的重要价值。报告还指出,垂直 SaaS 仍有巨大潜力,尤其对小企业而言。