科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-11-14 10:26:12
AI帮你写推广文案!哈工大团队让机器人自动宣传学术论文

哈工大团队开发了AutoPR自动学术推广系统,能将研究论文自动转换成吸引人的社交媒体推广文案。系统采用多智能体协作框架,分三阶段处理:内容提取、协作合成、平台适配。在小红书实测中,观看时长提升604%,点赞增加…详细

人工智能自然语言处理自动化系统

2025-11-14 10:25:58
复旦大学与美团联合揭秘:当AI遇到多步骤推理,为何聪明的大模型也会"短路"?

复旦大学与美团联合研究发现,当前顶级AI推理模型在处理需要多步骤连贯推理的复杂任务时会出现显著性能衰退。研究团队开发了R-HORIZON方法,通过构建相互关联的问题链来训练AI的长期推理能力。实验显示,即使是最先进…详细

人工智能强化学习推理优化

2025-11-14 10:25:47
统计学界的"高考"诞生:上海财经大学团队为AI模型设计史上最全面的统计推理能力测试

这项研究首次创建了专门评估AI统计推理能力的大规模基准测试StatEval,包含近20000道从基础到前沿的统计问题。通过创新的多智能体自动化生成系统和严格的评分框架,揭示了当前最先进AI模型在统计推理方面的重要局限性…详细

人工智能统计推理基准测试

2025-11-14 10:25:34
UCLA等顶尖机构研究揭秘:AI如何学会"见机行事"?难题深思,简题速答的智能密码

这项UCLA等机构的联合研究开发了ARES框架,让AI学会根据问题难度调整推理深度。通过识别AI生成过程中的"高窗口熵"时刻作为思考触发器,结合两阶段训练,成功实现了简单问题快速回答、复杂问题深入思考的智能行为,在…详细

人工智能自适应推理多模态大模型

2025-11-14 10:25:22
南洋理工大学推出MRMR:首个专家级多学科多模态检索基准,让AI"读懂"复杂专业文档

南洋理工大学等机构联合推出MRMR基准,这是首个专家级多学科多模态检索测试平台,涵盖23个领域1502个查询任务。研究发现传统文本检索模型配合AI图像描述的表现竟优于专门的多模态模型,揭示了当前AI系统在专业推理方…详细

多模态检索专家级基准推理增强技术

2025-11-14 10:25:08
代码评测界的新突破:让AI当场运行代码再决定谁更厉害

蒙纳士大学郑特雨教授团队发布的BIGCODEARENA研究,通过让AI代码在真实环境中运行来评测编程能力,而非仅看代码文本。研究收集了超过14000次用户交互数据,发现执行反馈显著提高评测准确性。结果显示OpenAI的o3-mini…详细

人工智能代码生成实验验证

2025-11-14 10:24:50
香港理工大学团队首次让AI在"想象中"变聪明:无需额外训练也能提升推理能力

香港理工大学团队首次实现让AI在"想象中"进行多样化推理的技术突破。研究开发出两种随机化策略让AI产生不同思考路径,并设计专门的评价系统筛选最优解。实验证明该方法能在不重新训练模型的情况下,仅通过增加推理计…详细

人工智能并行推理测试时计算扩展

2025-11-14 10:23:58
香港科技大学推出PhysToolBench:首个专门测试AI模型"动手能力"的全新评估体系

香港科技大学推出首个专门评估AI模型工具理解能力的基准测试PhysToolBench,研究发现即使最先进的AI模型得分仅63%,远低于人类90%的水平。测试涵盖三个难度等级,从基础识别到创造性应用,揭示了AI在物理世界理解方面…详细

人工智能工具理解评估视觉推理优化

2025-11-14 10:23:37
AI如何像侦探一样写报告?港大团队揭秘智能研究助手评估新方法

香港大学团队联合多所高校开发出首个专门评估AI研究助手的标准化框架。该研究通过分析AI生成的研究报告质量,建立了包含质量、冗余度和事实准确性的三维评估体系。测试四大商业AI系统发现,Qwen在综合表现上最优,而…详细

人工智能深度研究评估新型评估框架

2025-11-14 10:14:40
VasEdge试用火热招募,降本增效机遇来袭

当云上算力面临数据安全风险,传统风冷又受困于严苛的本地部署条件;当高额电费推高成本压力,服务器散热却拖慢业务运转—— 您的企业是否正在寻找更安全、更高效、更经济的算力解决方案?…详细

VasEdge

2025-11-14 10:11:01
清华大学团队破解AI智能体规划难题:让机器人学会"深谋远虑"而非盲目试错

清华大学团队提出EAGLET框架,通过分离规划与执行解决AI智能体在长期任务中的盲目试错问题。该方法采用同源共识过滤确保高质量训练数据,并设计执行器能力增益奖励机制优化规划器性能。实验显示在三个复杂任务场景中…详细

人工智能深度学习新型算法

2025-11-14 10:10:37
神经网络也能"随机应变"?密歇根大学与NVIDIA联手打造会自我调节的AI图像生成器

这项由密歇根大学与NVIDIA联合开展的研究提出了TC-LoRA技术,彻底改变了AI图像生成的控制方式。不同于传统方法使用固定参数,TC-LoRA能够根据生成阶段和用户条件动态调整网络权重,就像经验丰富的画家会在不同阶段使…详细

人工智能扩散模型动态权重调整

2025-11-14 10:10:27
伊利诺伊大学团队揭示:AI助手如何学会"双赢思维"——让人机对话不再是零和游戏

这项由伊利诺伊大学团队完成的研究首次将博弈论引入大语言模型训练,提出GTALIGN方法让AI学会同时考虑用户和自身福利。通过四步推理链和互利奖励机制,新方法在数学问题求解效率上提升21.5%,用户满意度提升11.3%,并…详细

人工智能博弈论多目标优化

2025-11-14 10:10:16
香港科技大学突破!人工智能如何像人类一样进行复杂推理——揭秘大脑神经元协作的"侦探破案"机制

香港科技大学研究团队首次揭示了人工智能进行复杂推理时的内部神经元协作机制。他们发现AI模型内部存在"查询神经元"和"价值神经元"的精妙配合,类似侦探破案时的线索传递过程。基于这一发现,团队开发了ACE知识编辑方…详细

人工智能知识编辑神经网络

2025-11-14 10:09:49
台湾大学发布突破性视频AI技术:让机器像人一样看懂复杂视频内容

台湾大学研究团队开发出突破性AI视频理解技术Tenet框架,让计算机能够像人类一样根据自然语言描述在视频中准确定位和追踪特定对象。该技术通过智能整合现有模型而非从零训练,大幅降低了计算成本,在标准测试中表现优…详细

计算机视觉视频对象分割人工智能框架

2025-11-14 10:09:29
北大团队:AI大模型思考太多反而出错?用"分段惩罚法"让机器学会精简思路

北京大学研究团队针对大型推理模型的"过度思考"问题,提出了群组相对分段惩罚(GRSP)方法。该方法改变传统的词语级惩罚粒度,转向对推理段落进行管理,并采用长度感知加权机制。实验结果显示,GRSP在保持推理准确性…详细

人工智能强化学习推理优化

2025-11-14 08:40:56
Infinidat InfiniBox G4系列升级重塑高端企业存储格局

Infinidat发布InfiniBox G4系列最新升级,实现容量翻倍、物理占用空间缩减31%、入门价格降低29%。新款InfiniBox SSA G4 F24仅占11个机架单元,起始容量77TB。混合系统单机架最大有效容量从17.2PBe跃升至33PBe,增幅达…详细

存储系统企业级存储系统升级

2025-11-14 08:39:35
Avalonia为微软MAUI跨平台应用方案带来Linux和浏览器支持

微软的MAUI跨平台应用开发框架将通过第三方框架Avalonia获得Linux和浏览器支持。MAUI目前支持Android、iOS、Mac Catalyst和Windows平台,但缺少Linux支持。AvaloniaUI公司正在为MAUI开发新的后端,使用Avalonia渲染器…详细

跨平台开发渲染引擎框架扩展

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章