黑帽大会2025在拉斯维加斯举办,超2.2万人参与。随着生成式AI被恶意利用,攻击者用AI改进钓鱼攻击并创造新恶意软件,企业浏览器成为关键防御机制。谷歌、Island、Mammoth Cyber和Palo Alto Networks等厂商推出企业浏览器解决方案。大会上思科、HPE、Infoblox等发布AI安全增强功能。面对攻击者的自动化威胁,防御者必须整合安全防护,在浏览器、终端、云端构建端到端防御框架。
AI、大语言模型和GPU的快速发展正推动数据中心重新审视基础电力架构。随着AI工作负载对传统基础设施提出更高要求,直流电正获得发展势头。DC电源系统具有更高效率,可节省机架空间并减少转换损耗,与太阳能和储能系统兼容性更好。尽管面临组件重新设计、安全挑战和标准化等技术障碍,但长期运营成本可降低7-20%。目前多数专家认为混合AC/DC架构是未来几年最可能的发展方向。
加州欧文的FieldAI公司宣布获得4.05亿美元融资,用于开发"基础具身AI模型"——通用机器人大脑,帮助人形机器人、四足机器人和自动驾驶汽车适应新环境。最新一轮融资3.14亿美元由贝索斯探险基金等共同领投。该公司构建基于物理学的"场基础模型",通过在AI模型中加入物理层,让机器人能够安全学习并适应新环境,同时具备风险意识和安全决策能力。
IBM与NASA合作开发名为Surya的开源AI模型,专门用于预测太阳耀斑和日冕物质抛射等太空天气事件。该模型基于NASA太阳动力学观测站九年高分辨率太阳观测数据训练,在太阳耀斑分类准确性上提升16%。目标是提供两小时预警,保护卫星、电网、通信系统等关键基础设施免受类似1859年卡林顿事件的强烈太阳风暴影响。
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
惠普企业(HPE)发布搭载英伟达Blackwell架构GPU的新服务器,抢占AI技术需求激增市场。IDC预测,搭载GPU的服务器年增长率将达46.7%,占总市场价值近50%。2025年服务器市场预计增长39.9%至2839亿美元。英伟达向微软等大型云服务商大量供应Blackwell GPU,每周部署约7.2万块,可能影响HPE服务器交付时间。HPE在全球服务器市场占13%份额。受美国出口限制影响,国际客户可能面临额外限制。新服务器将于2025年9月2日开始全球发货。
安全专业协会ISACA面向全球近20万名认证安全专业人员推出AI安全管理高级认证(AAISM)。研究显示61%的安全专业人员担心生成式AI被威胁行为者利用。该认证涵盖AI治理与项目管理、风险管理、技术与控制三个领域,帮助网络安全专业人员掌握AI安全实施、政策制定和风险管控。申请者需持有CISM或CISSP认证。
在谷歌云安全峰会上,谷歌分享了其AI安全愿景的更多细节。该公司推出智能安全运营中心,通过AI代理优化数据管道、自动化警报分类和事件响应来简化检测工程工作流程。新的警报调查代理基于Mandiant分析师的工作经验,能够丰富事件信息并提供响应建议。此外,谷歌还在其Agent Builder工具中新增了代理清单和风险识别功能,加强了对提示注入攻击的防护,并增强了安全指挥中心的威胁检测能力。
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
戴尔将AI数据平台与Elasticsearch集成,同时PowerEdge R7725服务器配备英伟达RTX Pro 6000 Blackwell GPU。新平台包含非结构化数据引擎,具备向量搜索、语义检索和混合关键词搜索功能,可为推理分析和智能搜索提供实时安全访问。RTX Pro 6000提供3753万亿次稀疏FP4计算性能,配备96GB GDDR7内存。该更新将增强数据处理性能,简化AI开发部署流程。
Confluent公司在其Confluent Cloud for Apache Flink平台中推出流式代理新功能,旨在帮助金融、医疗、广告等行业构建基于实时数据的智能体AI应用。该功能将实时数据引入处理管道,使AI智能体能够根据业务变化自主推理、适应并采取行动。通过整合Flink流处理与智能体框架,支持事件驱动的连续响应机制,并采用模型上下文协议安全调用外部工具。
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
据Android Police报道,谷歌翻译即将迎来重大AI升级。最新版本9.15.114显示新增模型选择器,包含"快速"和"高级"两种模式。快速模式适用于菜单翻译等简单任务,高级模式将使用Gemini技术提供更准确的上下文理解。更新还将加入类似多邻国的练习模式,通过游戏化方式辅助语言学习。这一升级体现了谷歌持续推进语言翻译技术创新的努力。
随着AI和生成式AI的快速普及,组织在数据处理和应用架构方面面临新挑战。传统集中式架构难以满足现代AI应用的性能需求,推动AI能力向数据生成和决策制定的边缘位置转移。边缘AI部署面临带宽限制、GPU资源需求和运营复杂性等挑战。F5应用交付和安全平台等解决方案通过统一控制和可视化管理,为分布式AI环境提供一致的安全策略和流量管理能力。
企业普遍认为AI模型需要大量算力,但Hugging Face专家认为应该更智能地使用AI。五个关键策略包括:为特定任务选择合适规模的模型而非通用大模型;将效率设为默认选项,避免不必要的高成本计算模式;通过批处理和精度调整优化硬件利用;推广能耗透明度评级系统;重新思考"更多算力更好"的观念,专注于智能架构和优质数据而非简单扩大GPU集群规模。
谷歌Gemini模型登陆甲骨文云,标志着企业AI应用的重要转变。该集成允许企业用户通过甲骨文云基础设施直接访问Gemini模型,而非仅作为外部API。甲骨文采用多供应商策略,为客户提供更灵活的模型选择。这一合作使Gemini的文本生成、多模态分析等功能可直接嵌入甲骨文应用中,无需迁移数据。同时将集成到未来的甲骨文融合云应用中,包括HR、财务和供应链解决方案,为企业提供更先进的AI自动化能力。
最近OpenAI用户震惊地发现他们的搜索记录出现在Google搜索中。实际上OpenAI明确告知了这一做法,但多数用户未仔细阅读条款。虽然OpenAI已移除相关功能,但因版权诉讼的法院命令,所有用户对话仍被保留。Google的Gemini等AI服务也在记录用户信息以提供个性化服务。这些数据可能在安全漏洞中泄露,用户应谨慎提问敏感话题。