科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-16 11:29:36
大模型在数学题自我修正中的困境:NAVER与KAIST联合揭示的新基准

NAVER和KAIST研究团队发现,先进AI模型在数学题自我修正方面存在严重缺陷。他们创建的MMRefine基准测试揭示,即使是GPT-4O等顶级模型也只能成功修正约23%的错误答案,而且经常将正确答案改错。研究发现不同模型在处理…详细

多模态大语言模型数学推理修正AI自我反省能力

2025-06-16 11:29:19
上海交通大学研究团队破解AI生成图像识别难题:让机器像人类一样"看破"假图片并解释原因

上海交通大学研究团队开发出革命性AI图像检测系统,不仅能以98.1%准确率识别AI生成的假图片,更能像人类专家一样用自然语言详细解释判断依据并标出具体问题区域。该系统通过创新的多模态大语言模型训练方法,实现了从…详细

人工智能图像识别可解释AI

2025-06-16 11:29:03
AI智能体的新思路:CMU团队发现"多行动"比"深思考"更有效

卡内基梅隆大学团队发现AI智能体"多试试"比"多想想"更有效的新规律。研究提出TTI方法,通过增加交互步骤而非延长单步思考时间来提升性能。在网页任务中,该方法让AI学会探索、比较和调整策略,在WebVoyager和WebAren…详细

智能体交互扩展强化学习算法网页自动化技术

2025-06-16 11:04:11
算力爆发式增长,电子产业如何摆脱“耗电焦虑”?

这场由算力需求驱动的繁荣背后,电子制造环节的能源消耗正急剧攀升。…详细

施耐德电气算力电子产业

2025-06-16 10:58:19
RMIT大学突破性发现:让购物问答系统告别"只给一个答案"的时代

RMIT大学研究团队提出革命性QQSUM技术,突破传统电商问答系统只给单一答案的局限。该技术能将用户评论中的多元观点自动归纳为代表性关键点并精确量化支持度,为消费者提供全面客观的购买参考。实验显示,新系统在文本…详细

人工智能检索增强生成电商问答系统

2025-06-16 10:57:54
北京通用人工智能研究院:让小模型也能拥有强大推理能力的革命性训练方法

北京通用人工智能研究院的研究团队开发了名为RuleReasoner的创新训练方法,成功让小型AI模型在规则推理任务上超越了OpenAI的o1等大型模型。该方法采用领域感知动态采样策略和强化学习,使8B参数模型在多个困难推理任…详细

强化学习规则推理动态采样

2025-06-16 10:57:34
复旦大学团队突破多模态AI理解瓶颈:让机器像人一样"看懂"图片不再靠猜测

复旦大学等机构联合提出ASVR方法,通过自回归语义视觉重构解决大型视觉语言模型过度依赖文字监督的问题。该方法让AI同时学习视觉和文本信息,在14个多模态理解基准上平均提升5个百分点。研究发现语义重构比像素重构更…详细

多模态AI自回归语义重构视觉理解增强

2025-06-16 10:57:31
算力爆发式增长,电子产业如何摆脱“耗电焦虑”?

这场由算力需求驱动的繁荣背后,电子制造环节的能源消耗正急剧攀升。…详细

施耐德电气电子产业算力

2025-06-16 10:57:17
中科院团队首创AI界的"行前检查员":让虚拟助手告别手机误操作灾难

这是中科院自动化研究所与阿里巴巴合作的突破性研究,首次提出AI助手的"预操作检查"机制。他们开发的GUI-Critic-R1模型能在AI助手执行手机操作前进行错误预防,成功率提升23%,效率显著改善,为智能设备自动化操作的…详细

人工智能GUI自动化预操作检查

2025-06-16 10:26:22
牛津医学研究揭示聊天机器人测试中的关键缺失环节

牛津大学研究发现,尽管大语言模型在医学考试中表现出色,但在实际应用中效果大打折扣。研究显示,LLM直接测试时能94.9%准确识别病症,但人类使用LLM诊断时准确率仅34.5%,甚至低于不使用AI的对照组。问题源于用户提…详细

人工智能自然语言处理人机交互测试

2025-06-16 10:23:04
PCIe 7.0规范正式发布,带宽达512GBps,PCIe 8.0已在筹备中

PCI特殊兴趣小组(PCI-SIG)正式发布PCIe 7.0规范,带宽再次翻倍达到128 GTps原始传输速率,在x16通道配置下可实现高达512 GBps双向带宽。相比2022年发布的PCIe 6.0的256 GBps,性能提升一倍。该技术主要面向800 Gbp…详细

高性能计算光纤互连带宽翻倍

2025-06-16 10:20:58
AI系统规模化前应内置审计追踪的必要性

随着企业开始扩展AI服务并将其投入生产,构建可管理、可追踪、可审计的强健管道至关重要。专家指出,AI编排框架必须包含可审计性和可追溯性功能,让管理员能够追踪系统运行情况。企业需要在早期阶段就将稳健性和审计…详细

人工智能系统编排审计追踪

2025-06-16 10:19:50
超越GPT架构:谷歌扩散模型或将重塑大语言模型部署方式

谷歌DeepMind推出实验性研究模型Gemini Diffusion,采用扩散方法生成文本,打破传统大语言模型依赖自回归逐词生成的模式。该技术从随机噪声开始,逐步细化为连贯输出,显著提升生成速度至每秒1000-2000个令牌,是Gem…详细

人工智能扩散模型新型算法

2025-06-16 10:17:50
多模态AI:强大飞跃背后的复杂权衡考量

多模态AI使系统能够处理文本、图像、音频和视频等多种格式信息,更接近人类感知方式。它能统一孤立的数据源,在医疗、物流、零售等领域实现更精准诊断和个性化体验。然而,多模态AI面临数据整合复杂性、偏见放大、安…详细

人工智能多模态AI战略转变

2025-06-16 09:57:21
华为团队重大突破:让AI直接理解数学题并给出严格证明,就像有了一个永不出错的数学助手

华为诺亚方舟实验室联合香港中文大学团队在2025年6月首次实现了从自然语言数学问题到严格证明的端到端自动化处理。他们开发的Mathesis系统包含创新的强化学习自动形式化器、精细化评估框架LeanScorer,以及高性能证明…详细

人工智能自动定理证明强化学习

2025-06-16 09:57:06
当AI学会偏见:斯科尔科沃科技学院揭示大型语言模型的地缘政治立场

斯科尔科沃科技学院研究团队通过对四个主要AI模型进行地缘政治偏见测试,发现这些系统在评价美国、英国、苏联和中国相关历史事件时表现出明显的国家立场偏好。研究涉及109个历史事件的多角度分析,结果显示几乎所有A…详细

人工智能地缘政治偏见大型语言模型

2025-06-16 09:56:46
斯坦福大学发现:最强AI也只有10%能完美证明数学不等式!

斯坦福大学等机构研究发现,即使是最先进的AI推理模型在数学不等式证明中也存在严重缺陷。虽然这些模型能在65%的情况下给出正确答案,但推理过程的整体正确率仅为10%。研究通过新开发的IneqMath数据集和AI评判系统,…详细

人工智能数学推理新型评估方法

2025-06-16 09:46:17
AMD超越AI能效目标并树立行业新标准

AMD宣布已超越其雄心勃勃的30x25能效目标,在AI和高性能计算系统中加速推进绿色倡议。该公司原计划在2020年至2025年期间将能效提升30倍,最终实现了38倍的显著改进,并提前完成目标。面对AI工作负载日益增长的需求,…详细

人工智能能效优化38倍性能提升

2025-06-16 09:45:51
科技赋能绿色未来,创维光伏引领全民光伏新时代

第十八届(2025)国际太阳能光伏和智慧能源&储能及电池技术与装备(上海)大会暨展览会于6月11日盛大开幕。…详细

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章