人工智能 关键字列表
Google为Discover功能新增AI生成摘要

Google为Discover功能新增AI生成摘要

谷歌正在其个性化内容流Discover中引入AI生成摘要功能,该功能已在美国的Android和iOS用户中开始推广。摘要卡片会显示新闻网站标志和AI生成的内容片段,用户可点击查看更多相关文章。谷歌声称此举能帮助用户更好地选择想要访问的页面,但出版商担心这会进一步减少点击流量。据估计,包含AI概览的搜索结果中有64%最终没有产生点击。该功能首先专注于体育和娱乐等热门生活方式话题。

Meta开发会说话的AI虚拟角色:从语音到电影级视频,一句话就能"变出"会对话的人物

Meta开发会说话的AI虚拟角色:从语音到电影级视频,一句话就能"变出"会对话的人物

Meta联合滑铁卢大学开发的MoCha系统实现重大突破,仅需语音和文字描述就能生成电影级会说话的虚拟角色视频。该技术突破传统局限,无需参考图片等辅助条件,还能实现多角色对话场景,在唇音同步、表情自然度等方面显著超越现有方法,为内容创作、教育、娱乐等领域带来革命性变化。

把家里老设备组装成超级计算机:阿联酋研究团队让70B大模型在普通家庭设备上飞速运行

把家里老设备组装成超级计算机:阿联酋研究团队让70B大模型在普通家庭设备上飞速运行

阿联酋和中国研究团队联合开发prima.cpp系统,成功实现70B大模型在普通家庭设备集群上运行。该系统通过创新的管道环形并行技术和Halda调度算法,将响应速度提升15倍至600毫秒,内存压力控制在6%以下,为AI技术民主化提供了新路径。

Moonshot AI发布Kimi-VL:仅用3B参数就能媲美大型AI的超级视觉模型

Moonshot AI发布Kimi-VL:仅用3B参数就能媲美大型AI的超级视觉模型

Moonshot AI发布了新一代视觉语言模型Kimi-VL,该模型采用混合专家架构,仅用2.8B激活参数就能媲美大型模型性能。其创新包括原生分辨率视觉编码器、128K长上下文处理能力和长链思考推理机制。在多项基准测试中,Kimi-VL在数学推理、文档理解、智能体任务等方面表现出色,证明了小参数高效能的设计理念,为AI技术的普及和可持续发展提供了新思路。

清华大学最新发现:AI强化学习训练可能是个"伪命题"?

清华大学最新发现:AI强化学习训练可能是个"伪命题"?

清华大学研究团队通过大规模实验发现,当前备受推崇的强化学习训练方法(如训练GPT-o1的技术)并未真正提升AI的推理能力,而是让模型更善于从已掌握的推理方法中选择正确答案。研究涵盖多个模型和任务,揭示了AI能力提升背后的真实机制与普遍认知的差异。

微软沙特阿拉伯研究团队发布Kuwain 1.5B:用"语言注射"技术让英文AI秒懂阿拉伯语

微软沙特阿拉伯研究团队发布Kuwain 1.5B:用"语言注射"技术让英文AI秒懂阿拉伯语

沙特阿拉伯misraj.ai团队开发了Kuwain 1.5B,一个仅15亿参数的阿拉伯语-英语双语AI模型。他们创新性地提出"语言注射"技术,在英语模型基础上增加8个新层专门处理阿拉伯语,同时保持原有层冻结。通过扩展26000个阿拉伯语词汇和9:1的数据配比,实现了阿拉伯语性能8%提升,英语能力完全保持,训练成本降低70%。该方法可推广到其他语言,为多语言AI发展提供了高效经济的新路径。

人工智能学会了"无师自通":清华大学团队让AI在没有标准答案的情况下自我进化

人工智能学会了"无师自通":清华大学团队让AI在没有标准答案的情况下自我进化

清华大学研究团队开发出TTRL技术,让AI无需标准答案即可自我学习。通过"多数投票"机制,AI分析自己的多个解答找出最佳答案并以此改进。在数学竞赛中表现卓越,AIME 2024正确率提升159%。这种"无师自通"能力标志着AI向真正自主智能迈进的重要突破。

KAIST团队开发PaperCoder:让AI读懂科学论文,自动生成完整代码

KAIST团队开发PaperCoder:让AI读懂科学论文,自动生成完整代码

KAIST团队开发了PaperCoder,一个能够自动将机器学习论文转化为完整代码仓库的AI系统。该系统通过规划、分析、编码三个阶段,解决了80%科学论文缺乏代码实现的问题,在评估中获得88%专家认可,生成的代码只需微调0.81%即可执行。

AI合作推理新突破:让多个AI像团队一样实时协作解决复杂问题

AI合作推理新突破:让多个AI像团队一样实时协作解决复杂问题

这项来自Yandex和多所国际院校的突破性研究首次实现了多个大语言模型的实时协作推理,让AI能像人类团队一样即时分享思考过程并自发分工合作。通过创新的共享注意力缓存技术,多个AI可以同时处理复杂问题,避免重复劳动,相互纠错验证,显著提升解题效率和准确率,为AI从单体智能向群体智能转变开辟了新路径。

AI如何让屏幕上的文字变得栩栩如生:南京大学团队的神奇文字生成器

AI如何让屏幕上的文字变得栩栩如生:南京大学团队的神奇文字生成器

南京大学团队开发的TextCrafter系统成功解决了AI图像生成中多文字准确渲染的技术难题。该系统采用三阶段策略:实例融合、区域隔离和文字聚焦,实现了73.7%的文字准确率,相比基础模型提升45%以上。同时创建了包含2000个复杂场景的CVTG-2K评测数据集,为该领域建立了新标准。作为无需训练的即插即用技术,TextCrafter在广告设计、内容创作等领域具有广阔应用前景。

清华大学团队重磅发布:一个AI模型既会画画又会"思考"图片,颠覆传统人工智能设计

清华大学团队重磅发布:一个AI模型既会画画又会"思考"图片,颠覆传统人工智能设计

清华、浙大等高校联合研发MergeVQ框架,首次实现单一AI模型同时精通图像理解与生成。通过创新的信息分层处理和Token合并技术,该系统用传统方法五分之一的计算资源达到更优性能,在ImageNet测试中展现突出效果。这一突破为AI视觉技术的高效化和普及化开辟新路径,有望推动智能相册、内容创作、电商推荐等多领域应用发展。

联合健康集团首席数字官:速度是最大的知识产权

联合健康集团首席数字官:速度是最大的知识产权

联合健康集团首席数字与技术官Sandeep Dadlani正领导着医疗行业最雄心勃勃的数字化转型之一。作为年收入近3000亿美元的巨头企业,该公司通过United AI Studio平台大规模部署AI解决方案,每年处理1亿通客服电话。Dadlani强调"速度是最大的知识产权",通过数字优先策略服务5500万用户,利用AI技术帮助临床医生专注于护理而非行政工作,推动医疗系统效率提升。

Index Engines获得AI持续训练对抗网络威胁专利

Index Engines获得AI持续训练对抗网络威胁专利

Index Engines获得一项新专利,可对AI/ML模型进行针对真实攻击模式的持续训练。该公司的CyberSense产品利用AI和机器学习分析检测非结构化数据内容随时间的变化,以识别可疑行为和勒索软件相关损坏。其研发实验室开发了软件,在受控洁净室环境中自动摄取和行为分析勒索软件变体,训练AI模型应对真实攻击模式。企业战略集团验证该方法检测勒索软件损坏的有效率达99.99%。

Claude Code营收暴涨5.5倍,Anthropic推出分析仪表板

Claude Code营收暴涨5.5倍,Anthropic推出分析仪表板

Anthropic为其Claude Code AI编程助手推出综合分析仪表板,帮助企业技术领导者了解AI编码工具投资回报。新仪表板提供详细指标,包括代码接受率、用户活动、支出数据等。自5月推出Claude 4模型以来,Claude Code活跃用户增长300%,收入增长超过5.5倍。客户包括Figma、Rakuten等知名科技公司。该工具定位为高端企业解决方案,具备"智能体"能力,能理解整个代码库并进行协调性修改。

智能体AI时代来临,数据中心面临哪些变革

智能体AI时代来临,数据中心面临哪些变革

代理式AI是继生成式AI后的新兴技术趋势,通过软件"代理"自动化复杂任务执行。与生成内容的生成式AI不同,代理式AI专注于执行操作。该技术将在两个方面影响数据中心:首先,随着48%的技术领导者已在使用代理式AI,这将增加LLM推理需求,进一步推动数据中心容量需求;其次,AI代理可能革新数据中心管理,自动化工作负载重新部署、性能优化和网络流量路由等任务,提升运营效率。

SK Telecom发布自主研发的韩语大语言模型

SK Telecom发布自主研发的韩语大语言模型

韩国SK电信发布了A.X 3.1 Lite,这是一个70亿参数的韩语大语言模型,完全从零开始自主开发。该模型在1.65万亿多语言标记上训练,重点关注韩语内容,可在智能手机上运行且无需云端支持。模型在韩语多任务推理基准测试中表现优异,响应时使用的标记数比同类GPT模型少三分之一。已开源并应用于SK电信的A.dot语音助手,支持实时通话摘要等功能。

希捷发布28TB和30TB HAMR硬盘 专为边缘AI和NAS打造

希捷发布28TB和30TB HAMR硬盘 专为边缘AI和NAS打造

希捷宣布其28TB和30TB Exos M数据中心硬盘和IronWolf Pro NAS硬盘全球上市,均采用HAMR热辅助磁记录技术。HAMR技术通过激光临时加热实现更高存储密度。希捷将这些新硬盘定位为边缘AI数据存储设备,支持实时边缘分析。30TB版本售价599.99美元,28TB版本售价569.99美元,现已通过官方商店和授权经销商全球发售。

Krisp推出VIVA开发工具包提升语音智能体精准度

Krisp推出VIVA开发工具包提升语音智能体精准度

语音AI解决方案提供商Krisp发布了VIVA语音隔离AI模型和软件开发工具包,专为语音AI智能体设计。VIVA每月处理超过10亿分钟的语音音频,能在20毫秒内处理音频,将对话轮转准确性提升3.5倍,减少50%的通话中断。该工具可过滤背景噪音和笑声,避免AI误判,提升转录准确性和用户体验。

StepFun推出Step1X-Edit:让AI图像编辑媲美GPT-4o的开源突破

StepFun推出Step1X-Edit:让AI图像编辑媲美GPT-4o的开源突破

StepFun公司推出的Step1X-Edit是首个能够媲美GPT-4o和Gemini2 Flash等商业模型的开源图像编辑AI。该模型通过整合多模态语言理解和扩散图像生成技术,能够处理11种编辑任务,在新构建的GEdit-Bench基准测试中表现优异,为图像编辑技术的民主化开辟了新道路。

谷歌研究:大语言模型在压力下会放弃正确答案

谷歌研究:大语言模型在压力下会放弃正确答案

谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。这种行为对多轮对话AI系统构成威胁,最新信息可能对LLM推理产生不成比例的影响。