3377体育

颁布于2026-06-04 04:55:53 来自权威揭秘 ·

关注

突发：马里国防部长卡马拉遭袭丧生

20城列队入场万亿GDP之城，南阳、沈阳领跑

文 | 奇点钻研社，作者｜孟雯最近具身智能的数据战打得火热。前有腾讯颁布 Tairos 具身智能盛开平台，后京东又上线了具身智能数据买卖平台，还要发起 60 万人采集 1000 万幼时。不久前，百度也推出具身智能数据超市，想要解决困扰行业已久的数据质量参差不齐、体式尺度不一、使用成本高档痛点。上周亦庄的人形机械人马拉松大赛，更是把具身智能的热度推向热潮。庆幸机械人「闪电」跑完 21 公里，净用时 50 分 26 秒，突破了人类男子半马世界纪录。一功夫，评论区沸腾，" 汗青性时刻 "，" 部署态元年 " 到来！但仔细钻研会发现这更像一场 " 机械能力 " 的突破，而非 "AI 能力 " 的突破。「闪电」之所以能跑出这个成就，靠的是 0.95 米大长腿、自研液冷系统、电机关系从 420Nm 提升到 600Nm。这些都是工程能力的堆集，是庆幸把从前十几年消费电子里的轻量化和结构设计能力，迁徙到了机械人上。若是把统一套算法塞进另一台机械人，或许率跑不出这个成就。问题不在算法，而在 " 具身智能 " 这个词，装了太多寓意。陆续跑 21 公里是一件事；能助你干活，是另一件事；能在产线上陆续工作 8 幼时不；，又是齐全分歧的一件事而这三件事，对应的是三种齐全分歧的数据需要。" 缺数据 " 喊了三年，但没人说清到底缺什么" 整个互联网上能训练的数据一共就没有几多 T，此刻已经快不够用了。" 国内某头部大模型厂商首创人在采访中说，" 此刻各人更多是用检索加强来落地 B 端，C 端还是必要基座模型的进化能力突破。"这是大模型（LLM）领域的真实焦虑。如今，LLM 的 " 数据焦虑 " 正舒展到具身智能。去任何一场机械人有关的论坛，险些所有人都在说，数据不够，是最大的瓶颈。但若是再往下追问，到底缺的是什么数据？答案却千差万别。LLM 之所以可能跑通规模定律（Scaling Law），有一个不能忽视的大前提：互联网文本自身就是一个 " 关环系统 "。一句话里同时蕴含意图、语义、甚至隐含的推理蹊径。模型要做的，就是不休从这些关环中提取法规。所以你只必要 " 多喂 "，模型 " 悟 " 得越多，能力就会天然涌现。但具身智能没有这样的关环。你能够采集 100 万幼时的人类生涯视频，但里面并没有机械人应该若何节造关节的信息；你能够构建 1000 万个仿真场景，但它们往往短缺真实世界里的噪声与长尾散布；你也能够通过遥操作堆集 10 万条工作数据，但一旦更换机械人本体，迁徙成效就会显著打折。具身智能的数据，不是 " 被网络 " 的，而是在物理世界中被 " 造作 " 的。并且分歧类型的数据，对 " 规模 " 的反映也齐全分歧。所以把 LLM 的那一套逻辑原封不动搬过来，自身就是一种误判。若是把具身智能的数据拆开来看，会更清澈一些。它大体能够分为三类：活动节造、场景理解与工作决策。活动节造数据通知机械人 " 怎么动 "，好比关节角度、力矩、活动轨迹等，这类数据高度绑定特定本体，天然不具备规；从媚芰。场景理解数据通知机械人 " 看到了什么 "，好比视觉、空间、物体鉴别等，由于人看到的世界，和机械人看到的世界，在统计意思上是类似的，所以这类数据是目前唯一有可能跑通 Scaling Law 的层级。最难的是工作决策数据，它要通知机械人 " 该怎么办 "，这是整个别下凤最稀缺的一类数据，由于它要求三件事同时成立：感知、判断、执行，并且必须同步标注。这三类数据，有些能够靠堆量解决，有些则齐全行不通，换言之，在具身智能领域，Scaling Law 不是 " 失效了 "，而是 " 分层成立 "。行衣凤其实已经有人描述过这个问题。戴盟机械人接受媒体采访时，称具身智能的数据供给存在一个金字塔结构。?顶层是机械人本体数据，最精确，但最难扩大；中层是可部署采集数据，在精度和规模之间做平衡；底层是人类视角的大规模数据，最容易放量。底层数据，能够靠 " 规； " 堆出来，掌管训练 " 认知 "。顶层的数据，必须贴着本体打磨，掌管训练 " 执行 " 必须精密打磨，不存在 " 多多益善 "。这也是为什么，单纯谈 " 数据规模 " 已经不再有意思，关键在于 " 你在放大哪一层 "。沿着这个思路，学术界也起头尝试给出新的解法。榆林大学颁发的开源项目 PHYAgentOS，把认知层与执行层解耦，即大模型做认知入口，不做最终执行者。这背后对应的，是一套新的数据分工方式：底层数据训练认知能力，能够跨本体泛化；顶层数据训练执行能力，始终绑定具体本体。一旦这一结组成立，数据的使用效能会产生质变：分歧层的数据，不再被强行塞进统一个模型里消化。解决了 " 数据从何而来 "，还要看数据若何 " 被消化 "，这就涉及到当前行衣凤的几条主流的技术路线。VLA 最常见，也最主流，它把视觉、说话、作为全数压进一个模型，输出节造信号，代表玩家是 RT-2 和 π 0，这一路线必要 " 图像 + 指令 + 作为 " 三者同时存在的数据，缺一不成，采集成本很高，也最难规；。第二条蹊径，是分层大模型。用 LLM 做高层规划，再挪用 VLA 或传统节造算法执行。它就义了一部门端到端的一致性，但换来了更高的数据利用效能。典型代表蕴含谷歌的 Gemini Robotics、北大的 RoboOS，以及前面提到的 PHYAgentOS。第三种是当前最受关注的世界模型路线，如 DreamDojo、PAR/PhysGen，强调直接从视坡凤 " 悟 " 出物理法规，以及零作为预训练，代表如国表的英伟达，国内的拓元智慧。但分歧玩家对统一路线也有着分歧的理解。拓元智慧选择在隐层空间（而非视频画面）做世界推演。拓元智慧结合首创人陈添水在接受奇点采访时提到：" 英伟达的 One Action Model 重要指建模 action（作为），拓元同时建模 action 和 physical，隐层特点（几千维）比视频像素（200 万像素）更高效，且能更好地支持 action 预测。"物理 token 自回归的运作方式：预测未来的帧与作为结合体，与真实环境同步演化图灵奖得主杨立昆提出的 JEPA 同样属于这一范式，但它更左袒 " 预测式进建 "，即在抽象空间里推演未来状态，进建因果关系。写到这里，我们会发现，在具身智能领域，脱离模型架构去谈 " 高质量数据 "，自身并没有太大意思。零次方结合首创人马晓龙采访中的话，精准点出了性质：" 数据有没有效，性质是匹配问题。对你的模型有效，对我的架构可能毫无意思，第三方换了场景又可能齐全没用。"群核建路场，百度铺管路，京东搭舞台带着这样思路再来看最近大厂的数据之争，就会发现他们固然都在 " 抢数据 "，但抢的，底子不是一个器材。差距不在 " 量 "，而在 " 层 "。最底层，是群核科技。群和科技占据的是 Scaling Law 最可能成立的那一层：" 物理正确 " 的空间数据。凭据招股书，群核已经堆集了 5 亿个 3D 室内场景、4.8 亿个 3D 模型，这些数据并非 " 采集 "，而是来自真实贸易使用中被反复挪用、批改、验证的了局。群核科技推出的 InteriorNet 数据集（蕴含约 1 亿 3 千万图像数据）基于这些数据构建的 SpatialVerse，是一个 " 可推算的物理空间 "：球被抛出去会着落，门被推开会有阻力，地板存在摩擦力。物理正确性，意味着它不依赖任何具体模型架构的演进。无论未来是 Transformer、世界模型，还是其他范式，机械人最终都必须在切合真实物理法规的环境中实现进建和决策。这意味着，一旦底层数据的 Scaling Law 成立，群核的价值会被指数级放大。它不必要押注 " 哪一个模型会赢 "，它押注的是所有模型，都必须进入 " 路场 "。若是说群核解决的是 " 数据从哪里来 "，那么往上一层，就是百度在做的事件：回覆 " 数据若何流动 "。百度具身智能数据超市，是一个中立的数据流通平台。它不参加机械人本体，也不直接出产数据，而是试图把分散在分歧企业、分歧场景中的数据 " 组织起来 "。凭据官方披露，目前具身智能数据超市已经接入十余家具身智能企业的数据，总量超过 1000 万条。同时推出了 " 繁星打算 "，打算招募约 100 家场景方盛开真实空间。更值得一提的是它的 " 沉服务模式 "。" 百度数据超市上的数据需专业处置，暂无免费上传机造。我们有高 T 工程师团队免费支持客户，仅收取算力和存储用度。" 百度智能云泛科技创新行业销售总监徐良在采访中提到。这意味着，它并非一个单一的撮合平台，而更像一个带有强加工能力的 " 数据代工厂 "：数据必要被洗濯、标注、结构化，能力进入可用状态。与此同时，百度还在补另一块更底层的基础设施：数据可信流通。蕴含云网端安整个系，以及面向出海的合规能力。" 目前百度结合头部客户开发的云网端安全规划，已经被利用到出口欧洲的产品中。" 徐良补充路。若是用一个更直观的类比，百度更像是具身智能时期的 "Visa"：它不直接参加买卖，但决定了数据这笔 " 买卖 "，能不能产生、若何产生。再往上走，是京东。其实京东的价值有被严沉低估。上线具身智能数据买卖平台，发起 60 万人采集 1000 万幼时人类真实场景视频数据，在亦庄马拉松机械人赛事中，京东又作为 AI 科技战术合作同伴，提供了运输、接济、换电、维建等全周期保险。赛事直接带头了超过 20 个机械人品牌销售额翻倍，有关搜索量激增 300%。表表看是一次品牌和供给链能力的展示，但它真正解决的问题，其切实数据层。具身智能里，有一类数据天然无法复用：活动节造数据。它高度绑定具体本体、具体结构，险些不具备跨平台迁徙能力，也就很难像互联网数据一样形成规；魍。这刚好是 Scaling Law 最难成立的一层。京东做的事件，是绕过 " 数据自身的可复用性 "，直接让这类数据在真实世界中产生贸易价值：通过赛事、销售、服务，把机械人推入高频使用场景，让每一次真实运行，都造成一次有效的数据堆集。当数据自身无法流通时，就用 " 买卖 " 去放大它的价值。价值驱动需要，需要再反过来推动数据回流，这是在 Scaling Law 不成立的顶层，少数可行的贸易关环。群核在最底层，提供 " 能够无限扩大的路场 "；百度在中央层，买通 " 数据若何被加工与流通的管路 "；京东在最上层，搭建 " 让数据产生价值的真实舞台 "。三者别离押注数据供给金字塔的分歧层级，彼此错位，却又环环相扣。和谈之争与终局设想PHYAgentOS 论文中有一句话让我印象很深：Docs as API，不是让 Agent 和硬件系统通过大量隐式新闻、一时状态和难以追踪的接口直接耦合，而是通过结构化文档进行交互，主题载体蕴含 Markdown 文件。我感触这指向了具身智能数据之战的终局设想：尺度化和谈，即分歧数据层，若何被统一个系统理解？底层是空间与视觉，中层是工作与流程，顶层是具体本体的节造信号，它们的数据结构、表白方式、甚至功夫尺度都齐全分歧。若是没有一套统一的 " 诠释机造 "，这些数据就只能各自为政。问题的主题从 " 数据供给 "，转向 " 和谈衔接 "。不外近况是，各人都在做自己的尺度，构建自己的 " 部门最优 "。幼鹏、阿里、腾讯接连颁布了各自的世界模型，英伟达的 Cosmos 已经在工业仿真上成立了壁垒，李飞飞的 Marble API 已对表盛开，杨立昆的 JEPA 固然还在科研期，但代表了最远期的颠覆可能。各家有各自的数据体式、仿真环境与 API 系统，背后绑定的是分歧的技术路线与产品如果。短期看，这种割裂不成预防，由于没人会在早期阶段自动烧毁对系统的节造权。同时也意味着，和谈层的统一，会比设想中更难。它不会是一挥而就的尺度落地，更可能是一个漫长的博弈，在效能、节造力与生态盛开之间反复拉扯，直到某种 " 足够好 " 的共识形成。结尾庆幸「闪电」用 50 分 26

热点排行

【网站地图】