科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-06-11 09:13:35
不是做大模型,而是落在执行闭环,酷开智能体思路浮出水面

进入2025年,智能体成为AI产业的新入口。不同企业路径分化明显:有的强调大模型平台能力,有的围绕助手封装展开,另一些则选择从具体场景出发,构建可持续的服务闭环。…详细

2025-06-11 07:53:58
CRAWLDoc:如何从混乱的网页中找到学术黄金——德国乌尔姆大学开发的智能文献排序系统

这项研究介绍了CRAWLDoc,一种创新的文献排序系统,能从网络中自动识别与学术论文相关的文档。德国乌尔姆大学的研究团队利用小型语言模型,将论文登陆页面作为查询,对所有链接资源进行排序,有效解决了学术元数据提…详细

学术数据集信息检索语言模型

2025-06-11 07:52:43
婴幼儿语音情感数据的智能分析:西安交通大学与昆明理工大学联合突破传统限制的榜样之作

西安交通大学与昆明理工大学研究团队开发了一种基于集成学习的婴幼儿语音情感识别方法,能有效分辨饥饿、困倦、不舒服和高兴四种情绪状态。研究采用三层分类器架构,整合SVM、随机森林和KNN算法,达到85.82%的准确率…详细

人工智能语音情感识别集成学习

2025-06-11 07:52:03
大型语言模型的隐私保护:微软与普渡大学联合研究团队让AI学会在对话中判断哪些信息该说,哪些不该说

这项来自普渡大学和微软的研究探索如何让AI助手更好地保护用户隐私。研究团队通过让大型语言模型在回答前先思考"语境完整性"(即在特定场景下什么信息适合分享),并结合强化学习技术进行训练,成功降低了隐私信息泄露…详细

人工智能隐私保护大型语言模型

2025-06-11 07:51:43
SkyReels-Audio:让肖像"动"起来 - Skywork AI开创全能音频驱动的人像视频生成技术

SkyReels-Audio是Skywork AI团队开发的全能音频驱动人像视频生成框架,能将静态图像或视频与语音输入结合,生成高度逼真、唇形同步的说话人像视频。基于预训练的视频扩散变换器构建,该技术支持无限长度视频生成和编…详细

人工智能视频生成音频同步

2025-06-11 07:51:19
波士顿大学研究揭秘:为什么大脑"练得越多,想得越少"?神经科学家发现思维自动化的惊人真相

波士顿大学研究团队通过先进脑成像技术首次揭示了技能从需要意识控制转变为自动化执行的完整神经过程。研究发现大脑存在两个关键网络:认知控制网络负责新技能学习,程序性学习网络负责自动化执行。随着练习增加,控…详细

神经科学技能学习大脑网络

2025-06-11 07:50:51
NVIDIA团队突破性研究:让AI推理像魔法一样又快又准的超级压缩术

NVIDIA与爱丁堡大学联合团队于2025年提出的动态内存稀疏化技术,通过智能的延迟删除策略实现AI推理系统的高效内存管理,在保持准确性的同时大幅提升处理速度。该技术只需1000个训练步骤就能实现8倍压缩率,在多项复杂…详细

推理时间扩展动态内存稀疏化AI效率优化

2025-06-11 07:50:32
清华大学团队颠覆自动驾驶"眼睛":用AI生成模型让汽车像人一样"看懂"3D世界

清华大学团队利用扩散模型革新自动驾驶3D感知技术,通过生成式建模取代传统判别式方法,让AI系统具备类人想象推理能力。该方法在遮挡区域预测准确率提升15%,并显著改善下游规划任务性能,为自动驾驶向更智能安全方向…详细

人工智能扩散模型自动驾驶

2025-06-11 07:50:06
H Company的AI网页冲浪高手:开源模型如何以超低成本击败GPT-4?

H Company研究团队开发了开源网页操作AI系统Surfer-H,配备专门训练的Holo1视觉语言模型。该系统在WebVoyager基准测试中达到92.2%的成功率,媲美GPT-4性能但成本仅为其四分之一。研究团队还发布了专门的网页定位测试…详细

人工智能网页自动化开源模型

2025-06-11 07:49:37
通过奖励优化图像描述:让多模态大模型拥有推理能力而不用重新训练视觉模块

这项研究提出了RACRO框架,通过奖励优化图像描述来解决多模态推理问题,避免了传统方法中昂贵的视觉-语言重新对齐过程。研究表明,通过将视觉感知与推理解耦并使用强化学习优化图像描述质量,即使只使用较小模型训练…详细

人工智能多模态大语言模型强化学习

2025-06-11 07:48:46
FusionAudio-1.2M:当AI学会像人类一样"听懂"声音的故事——香港中文大学(深圳)团队的突破性研究

香港中文大学(深圳)研究团队开发出FusionAudio-1.2M数据集,创新性地融合音频、视觉、语音和音乐信息来生成详细的音频描述。该研究采用多模态专家系统和大语言模型整合的两阶段方法,构建了包含120万高质量音频描述的…详细

人工智能多模态融合音频理解

2025-06-10 18:11:06
蚂蚁数科加速推进AI战略,设立“AI+产业创新”实验室

AI技术创新是推动企业智能化升级的核心驱动力。…详细

蚂蚁AI

2025-06-10 18:02:18
英特尔推进技术创新,以规模更大的封装满足AI应用需求

为了推动AI等创新应用落地,使其惠及更广大的用户,需要指数级增长的算力。为此,半导体行业正在不断拓展芯片制造的边界,探索提高性能、降低功耗的创新路径。…详细

2025-06-10 17:48:35
浙江大学推出动态场景重建的新方法——FreeTimeGS,知名KOL:这就是未来Midjourney要实现的效果

浙江大学与吉利汽车研究院提出了一个叫做FreeTimeGS的新方法,通过一种全新的思路给予高斯基元"自由",让它们能够在任意时间和位置出现,从而更好地重建具有复杂动作的动态场景。…详细

3D建模人工智能高斯

2025-06-10 16:39:36
8秒一个电芯,6分半一个电池组!华为F5G-A万兆全光园区方案用网速保障徐工动力的产速

2025年,国内乘用车市场的新能源渗透率已突破55%。与此同时,在商用车领域,新能源车辆的渗透率也突破20%,一大批全新设计的纯电动叉车、铲车、挖掘机等工程机械设备也呈现井喷之势。…详细

2025-06-10 16:27:20
赋能 HPC 未来:MiTAC神雲科技在 ISC高性能计算大会2025 上展示先进服务器平台

【德国汉堡电—ISC高性能计算大会—2025年6月10日】—作为专业的服务器设计与制造商,神达控股股份有限公司(股票代号:3706)旗下子公司神雲科技股份有限公司(MiTAC Computing Technology Corporation),将于 ISC 高性能…详细

2025-06-10 16:08:13
爱簿智能推出E300 AI计算模组:50TOPS国产算力,赋能边缘AI全场景高效部署

国产可控边缘AI基座来了!爱簿E300 AI计算模组以50TOPS国产算力护航关键场景,可实现32B大模型本地轻量化部署!…详细

2025-06-10 15:13:59
从愿景到现实 聚焦生成式AI全球实践 2025亚马逊云科技中国峰会将于6月19日在上海开幕

2025亚马逊云科技中国峰会将于6月19日-20日在上海世博中心举行。本届峰会将汇聚来自亚马逊云科技纽约、伦敦、巴黎等峰会的全球云计算与AI领域权威专家以立足国际的先锋视角,解读生成式AI在全球范围内的落地实践等前…详细

亚马逊云科技

2025-06-10 14:24:08
当AI遇上癌症诊断:上海交大团队如何让机器"看懂"细胞的秘密

上海交通大学研究团队开发出革命性AI癌症诊断系统,通过深度学习技术分析50万张细胞图像,实现94.2%的诊断准确率,诊断时间从30分钟缩短至2分钟。该系统不仅能识别多种癌症类型,还具备解释性功能,已在多家医院试点…详细

人工智能癌症诊断深度学习

2025-06-10 14:21:54
机器人学会3D"变身术":南华理工大学让机器人像人类一样理解物体运动

南华理工大学等机构提出3DFlowAction方法,让机器人通过预测物体3D运动轨迹来学习操作技能。该研究创建了包含11万个实例的ManiFlow-110k数据集,构建了能预测三维光流的世界模型,实现了跨机器人平台的技能迁移。在四…详细

机器人学习3D光流技术跨平台适配

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章