人工智能文章列表第18页-至顶网频道

2025-08-22

百度无人出租车已实现盈亏平衡，海外扩张前景可观

中国互联网巨头百度表示，其在中国的无人出租车业务已实现盈亏平衡，对进军全球市场后的盈利前景充满信心。CEO李彦宏在财报电话会议中透露，尽管武汉的出租车费用比其他中国城市低30%，但百度的无人出租车业务已在当地实现盈亏平衡。AI技术在多方面助力百度发展，包括代码生成、数字人技术等，但AI搜索的商业化仍面临挑战。

TikTok母公司字节跳动发布开源Seed-OSS-36B模型，支持512K Token上下文

字节跳动Seed团队在Hugging Face发布新的开源大语言模型Seed-OSS-36B，专为高级推理和开发者友好性设计。该模型提供三个版本：基础模型（含/不含合成数据）和指令调优版本。模型拥有360亿参数，支持512K令牌上下文长度，相当于约1600页文本。在数学推理、编程和长文本处理等基准测试中达到开源领域最先进水平。采用Apache-2.0许可证，允许企业免费商用部署。

中南大学等机构突破难题：让AI真正理解长文本并生成完美图像，TextAtlas5M数据集问世

中南大学等机构联合发布TextAtlas5M数据集，包含500万图像-文本对，专门解决AI长文本图像生成难题。该数据集平均文本长度148.82词，远超现有数据集，涵盖广告、学术、教育等真实场景。配套的TextAtlasEval基准测试显示，即使最先进的商业模型也面临显著挑战，为AI图像生成技术指明了新的发展方向。

斯坦福大学如何让AI像人类一样思考：用4D建模重新定义空间理解

斯坦福大学Gordon Wetzstein教授团队提出神经辐射场技术，首次让AI具备类似人类的三维空间理解能力。该技术仅需少量不同角度照片即可重建完整三维场景，在图像质量上比传统方法提升20%以上。研究成果应用于自动驾驶、VR/AR、医学影像等领域，标志着AI从二维图像识别向三维空间理解的重大跃进。

新加坡国立大学团队突破性成果：让AI从几十张图片就能学会艺术家的"涂鸦"技巧

新加坡国立大学团队开发的PhotoDoodle系统，通过两阶段训练策略实现了从少量样本学习艺术家照片涂鸦风格的突破。该系统采用位置编码复用和无噪声条件机制，仅需30-50对图片样本就能掌握特定艺术风格，在保持背景完整的同时精确添加装饰元素，为AI辅助艺术创作开辟了新方向。

AI评判官的隐形偏见：当合成数据遇上同门师兄弟，公正评价还能保证吗？——亚利桑那州立大学等多所高校联合发现"偏好泄漏"现象

亚利桑那州立大学等多所高校联合研究发现了AI评估中的"偏好泄漏"现象：当大语言模型既用于生成训练数据又用于评判学生模型时，会产生系统性偏见，偏爱体现自己风格的回答。研究显示这种偏见可达23.6%，比已知的自我中心偏见影响更严重，可能导致AI评估排行榜出现系统性偏差，威胁AI评估体系的公正性。

当AI学会"预见未来"：商汤科技如何让自动驾驶汽车拥有水晶球般的预知能力

商汤科技研究团队开发了MaskGWM，一个革命性的自动驾驶预测系统。该系统采用创新的"双重学习法"，让AI同时掌握图像生成和逻辑推理能力，能够预测长达12秒的未来驾驶场景。通过空间和时间两个维度的掩码重建训练，结合多视角预测能力，MaskGWM在标准测试中显著超越现有技术，并展现出强大的跨域泛化能力，为更安全智能的自动驾驶技术奠定了重要基础。

UC伯克利发现AI推理学习的秘密：结构比内容更重要的惊人真相

UC伯克利研究团队发现，仅用17000个训练样本就能让AI获得强大推理能力，关键在于推理的逻辑结构而非具体内容正确性。即使训练数据包含错误答案或错误计算，AI仍能学会推理，但一旦打乱逻辑结构，性能就会急剧下降。该发现颠覆了AI训练需要海量完美数据的认知，为资源有限的团队提供了经济高效的AI推理能力培养方案。

斯坦福大学新发现：大语言模型居然能自己学会当"翻译官"

斯坦福大学研究发现，主要用英语训练的大型语言模型竟能自发学会处理其他语言任务，无需明确教学。这种跨语言迁移能力随模型规模增大而显著提升，通过形成"通用语义空间"实现不同语言间的知识迁移。研究为降低多语言AI开发成本、支持资源稀缺语言提供了新途径，但仍面临性能不均衡、文化适应性等挑战。

生成式引擎优化GEO：在线零售商的新营销手册

随着谷歌搜索和亚马逊主页在电商领域影响力下降，AI助手如ChatGPT、Claude等成为消费者新的购物入口。品牌必须掌握生成式引擎优化(GEO)技术才能保持可见性。传统SEO策略已失效，AI系统更青睐结构化、问答式的高质量内容。研究显示，来自AI助手的流量转化率比其他渠道高9倍。品牌需要基于真实客户问题创建内容，采用结构化问答格式，并建立信任度，才能在这个新的电商秩序中脱颖而出。

人工智能大模型推理速度大提升！阿姆斯特丹大学与Salesforce联手开发"聪明导游"技术

阿姆斯特丹大学与Salesforce合作开发的奖励引导推测解码（RSD）技术，通过让小模型处理简单任务、大模型解决复杂问题的智能分工，在保持推理准确率的同时大幅提升计算效率。该技术在数学推理等任务中表现出色，计算量最多可减少75%，为AI应用的普及和成本降低提供了重要技术支撑。

微软首创！让大型语言模型记忆力暴涨64倍的神奇方法

微软研究院开发出LongRoPE2技术，能让大型语言模型的记忆容量扩展64倍至12.8万字，同时保持98.5%的原有性能。该方法通过发现AI位置编码训练不均衡问题，采用智能搜索和混合训练策略，仅用传统方法八十分之一的资源就实现突破。这项技术将使AI能完整处理长文档、进行复杂对话，为文档分析、代码开发、内容创作等领域带来重大改进。

华科大联手地平线：让AI学会开车的秘诀，竟然是在数字世界里"碰车"

华中科技大学联合地平线机器人开发RAD自动驾驶训练系统，首次将3D高斯点云渲染技术应用于强化学习，在逼真虚拟环境中让AI通过试错学习驾驶技能。该方法巧妙结合模仿学习与强化学习，将碰撞率降低3倍至8.9%，同时保持人类化驾驶风格。研究为自动驾驶AI安全训练开辟新路径，预示更可靠的无人驾驶汽车即将到来。

华盛顿大学研究发现：小模型学不会"高手"推理，混合教学法成破解关键

华盛顿大学研究团队发现小AI模型无法有效学习大模型的复杂推理方法，提出了"小模型可学习性差距"概念。他们通过大规模实验证明，小模型更适合学习简洁推理而非复杂推理，并创新性地提出混合蒸馏法，将不同复杂度的训练数据按比例组合，显著提升了小模型性能，为AI模型训练策略提供了新的"因材施教"思路。

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: