科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网商业办公商业办公 相关文章
2025-07-17 13:58:58
MegaMath:MBZUAI研究团队打造出史上最大开源数学训练数据集,3700亿Token让AI数学能力飞跃

MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,…详细

数据集构建数学推理人工智能

2025-07-17 13:58:26
推理竟然有"隐形"版本?斯坦福&清华联合揭示大模型思维的神秘面纱

这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递…详细

人工智能推理模型潜在推理

2025-07-17 13:57:26
人工智能学会自己分解组装3D物体:香港大学团队让计算机具备"零件思维"

香港大学团队开发的OmniPart系统实现了AI领域的重要突破,让计算机首次具备了像人类一样的"零件思维"。该系统能从单张2D图片生成具有清晰零件结构的3D模型,用户可通过简单的颜色遮罩控制分解过程。系统采用两阶段设…详细

3D生成零件感知建模多模态AI

2025-07-17 13:56:57
让AI学会真正理解人类情感:腾讯研究团队首次用真情实感训练出会安慰人的AI助手

腾讯研究团队首次开发出RLVER框架,通过可验证的情感反馈训练AI理解人类情感。该方法让70亿参数的小型AI模型在情感智能测试中从13.3分跃升至79.2分,达到大型商业模型水平。研究创新性地使用虚拟用户的真实情感变化作…详细

情感智能强化学习AI训练优化

2025-07-17 13:56:15
北卡罗来纳大学团队突破关系抽取难题:让小模型像人类专家一样推理

北卡罗来纳大学团队提出R1-RE框架,通过强化学习训练小模型模拟人类专家推理过程,在关系抽取任务中实现跨领域突破。该方法使7B参数模型达到GPT-4o级别性能,跨领域准确率提升30%,为AI推理训练提供新范式。…详细

关系抽取强化学习跨领域推理

2025-07-17 11:40:42
电脑视觉模型的"排序超能力":图宾根大学团队发现AI能像人类一样给图片排序

德国图宾根大学研究团队发现现代AI视觉模型具备强大的图像排序能力,能够理解年龄、美观程度等连续属性并进行准确排序。研究测试了7种AI模型在9个数据集上的表现,发现CLIP模型表现最佳,且仅需极少样本就能学会排序…详细

视觉人工智能图像排序深度学习

2025-07-17 11:40:23
KAUST团队突破性成果:用"光谱DNA"让机器像人类一样识别材料

KAUST团队开发UnMix-NeRF技术,首次实现3D场景重建与材料识别的同步。该系统利用光谱成像技术,能够识别物体的材料特性,不仅重建逼真3D场景,还可自动分离不同材料区域。技术在多个数据集上表现优异,为机器人、增强…详细

计算机视觉光谱成像材料识别

2025-07-17 11:39:59
医疗AI革命:在你的浏览器里就能生成病历,隐私安全还不用花钱——美国密苏里州默西医院团队的突破性研究

美国密苏里州默西医院团队开发了一个能在浏览器中运行的医疗AI模型,专门用于将医患对话转录生成标准化病历。该模型基于Llama 3.2 1B,通过1500个内分泌科病例训练,在保证隐私安全的前提下,显著提升了病历生成的准…详细

医疗AI本地化部署隐私保护

2025-07-17 11:39:31
InternVL3:上海AI实验室联合多所顶尖院校打造的多模态AI大模型新突破

上海AI实验室联合清华大学等顶尖院校发布的InternVL3,通过原生多模态预训练突破了传统AI模型"先语言后视觉"的局限。该模型在MMMU基准测试中获得72.2分,超越所有开源模型,并引入变长视觉位置编码和混合偏好优化等创…详细

多模态AI原生预训练开源模型

2025-07-17 11:39:06
只要256MB就能秒杀80B大模型?Hugging Face推出史上最小却最强的视觉AI助手

Hugging Face联合斯坦福大学推出革命性小型视觉AI模型SmolVLM,最小版本仅256MB却能超越300倍大小的传统模型。该系列包含三个版本,运行显存需求0.8-4.9GB,可在手机端部署。通过创新架构设计、高效tokenization和精…详细

视觉语言模型模型压缩边缘计算

2025-07-17 11:38:47
机器也能理解电影镜头语言?卡耐基梅隆大学等机构突破视频中的摄像头运动理解

卡耐基梅隆大学等机构联合发布CameraBench,这是首个专门评测AI理解视频摄像头运动的大规模数据集。研究团队与专业电影摄影师合作,标注了约3000个多样化视频,建立了精确的摄像头运动分类体系。测试发现现有AI模型在…详细

视频理解摄像头运动分析多模态数据集

2025-07-17 10:36:56
构建基于偏好和技术转换的变革

科技专家Sungjoo Yoon在TED演讲中提出"偏好原理",认为了解用户喜好信息越多,就能创造更强大的技术。他将市场变化比作"地壳运动",从1969年命令行界面到80年代GUI,再到90年代网络界面,技术发展都遵循这一规律。自…详细

人工智能自然语言处理偏好原则

2025-07-17 10:36:32
微软Copilot Vision AI可全屏扫描识别内容

微软推出了Copilot Vision AI新功能,该技术能够扫描和分析用户屏幕上的所有内容。这项AI视觉技术可以实时理解用户正在查看的信息,包括文本、图像和应用程序界面,为用户提供更加智能化的交互体验和个性化建议。此功…详细

人工智能计算机视觉屏幕识别技术

2025-07-17 10:35:23
马斯克的xAI与沙特Humain就数据中心交易进行洽谈

马斯克旗下AI初创公司xAI正与沙特方面就租赁数据中心容量进行谈判,寻求在能源成本低廉地区扩展基础设施。谈判涉及两个潜在合作伙伴:沙特支持的AI公司Humain提供数千兆瓦容量方案,以及另一家正建设200兆瓦设施的公…详细

人工智能数据中心建设国际合作

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

最新文章