• 首页
  • 世界杯官网
  • 世界杯赛程
  • 世界杯积分榜
  • 世界杯直播
  • 世界杯最新消息
  • 2026世界杯直播app
  • 世界杯积分榜你的位置:2026年世界杯中国官网 > 世界杯积分榜 > 2026年世界杯官网 吐槽一下, 找外包采了几百条数据, 能用的剩下一百条!

    2026年世界杯官网 吐槽一下, 找外包采了几百条数据, 能用的剩下一百条!

    发布日期:2026-06-12 08:00    点击次数:184

    2026年世界杯官网 吐槽一下, 找外包采了几百条数据, 能用的剩下一百条!

    头图:具身智能行业图片

    寰球好,我是瓦力,具身算法究诘员。

    先说个事情。前一阵咱们找外包采了一批遥操数据,三百多条。临了能进磨真金不怕火集的,一百条出面。剩下的两百条数据,有行动徜徉、末端定位偏差、要道帧被讳饰的。一条条看数据,真实挺熬东谈主。历程都对,东谈主也到位,钱也花了,终局一泰半的数据都没办法用。

    我折服这亦然大部分作念算法的实践感受。模子调到一定进程,瓶颈基本都不在模子本人,是喂进去的数据。何况这个问题还不是费钱堆量就能解决的。你跟外包把需求讲了半天,对方点头说懂了,采出来的东西评释根柢没懂。

    卡到其后,我运行四处问东谈主,有莫得靠谱的办法能把数采作念塌实点。问了身边搞具身的同学,发现寰球遭遇的问题大差不差,然后有个一又友给我指了条路,说不错问问数采厂。

    我一运行是不折服的。数采厂嘛,无外乎把历程作念法式、把东谈主宰好。外包的东谈主也大多是他们提供。实践厂商和标注公司我也斗争过,大同小异。

    抱着取经的气魄,我照旧问了下之前天南斗争过的几家公司。聊完之后,我才发现我方想的有些窄了。他们想干的,不只单是把网罗历程优化得更好。有些公司甚而想作念更大的事情,把数据和模子这两件事,融在一都。

    这家厂是乐聚,我差未几从他们那里找到了一些特原理的想路,是以和寰球共享一下know how。

    1. 采数据这件事,外包只可处治一半

    先把问题说清晰。

    当今行业里采数据,大多数是两拨东谈主。一拨在磨真金不怕火端,懂模子、懂算法,知谈一条好数据长什么样;另一拨在网罗端,可能是外包,也可能是数据标注公司,厚爱遥操或者无实践的数采。

    这两拨东谈主之间,其实不太贯串对方。

    磨真金不怕火端的东谈主,常常不会亲身去采几百小时。网罗端的东谈主,又基本碰不到模子磨真金不怕火。终局便是,需求在传递的过程中一层层失真。

    比如我想告诉外包的同学说「我想要这个握取的斗争短暂稳少许」,传到网罗端可能就酿成了「很慢的把东西握起来」。这中间丢掉的信息,其实便是我想要模子学习的东西。

    所之外包能处治的,其实唯唯一半:量。它能给你堆出几百上千小时的数据。但另一半,质,或者说跟模子需求的对都,它给不了太多。

    这让我想起之前写许华哲那篇时,Pete 抛过的一个问题:全世界的机器东谈主学家,该不该放下究诘一年,专门去网罗数据。

    那时我的判断是不成真这样干,但确乎值得算法的同学试一试。是以我也真实去试了试,就在乐聚那里。

    我那时通过遥操把天平上的砝码放到盒子里的时刻,我对了好须臾才把最大的砝码放进去。但从数据本人的角度,或者从东谈主类的角度,我认为应该很告成能放进去才对。

    但你说数采员能作念的更好么,我认为也不大可能了。

    实践体验下来,我最大的感受之一便是:当今其实不是没东谈主采数据,是采回想的数据,和算法想要的还有很大的距离。

    想要把数据作念成工业品,前提是采的东谈主得懂模子,懂模子的东谈主也得知谈网罗实践的状态。不然你历程作念得再门径,采的东西不一定是模子需要的。

    这便是为什么我说,外包只可处治一半。不是外包不戮力,是这套单干从结构上就注定了数据质料的天花板。

    2. 数据和模子分不开,我认为有两层含义

    聊到这,得说回乐聚让我认为特原理的地方。

    许多东谈主讲「数据和模子分不开」,聊的都是名义:你得罕有据才能训模子。这层太浅了,谁都懂。我认为信得过的分不开,是两层。

    第一层是硬件层。你得真实用过各家的实践,才知谈不同构型的实践在采数据时会踩什么坑。轮臂的坑、双足的坑、不同智慧手的坑,都不一样。 一个只作念自家实践的厂商,数据重点可能只会 focus 在自家居品上,他莫得能源、也莫得场景去试水别家实践的坑。乐聚参与建造寰球多个东谈主形磨真金不怕火场,他们实践的数目多,数采需求大。本人就在采全身运控、智慧手操作、轮臂基础运控这些不同构型的数据,它对跨实践的底层各别,贯串是更全的。

    开运体育中国官方网站

    第二层是组织层,这点更艰巨。采数据的东谈主,必须懂算法要什么。前边说的问题,外包搞不定,实践厂商其实也隔着半谈墙,因为模子团队和数据团队通常是两拨东谈主、两个 KPI。

    而乐聚此次干的事,是把数据工场和后磨真金不怕火算法库,作念到了一都。网罗端和磨真金不怕火端,是统一拨东谈主在对都需求。采数据的时刻,脑子里装着的便是模子要什么。

    这两层叠在一都,才是好意思满的「数据和模子分不开」。我知谈这里有东谈主要反问:乐聚我方不亦然实践厂吗?夸父便是它的机器东谈主,凭什么说实践厂不行,它就行?

    这个问题问得很对,我我方的第一反应亦然这样。

    但我周末在他们线下体验完,能嗅觉获取乐聚正在从一个「卖实践」的公司,转向作念 infra,现阶段在作念的便是「网罗和磨真金不怕火对都」。

    三月份天南和寰球聊乐聚,就在说他们也要作念的具身基座,我体验完之后撑持这个见解。

    是以他们此次发布的后磨真金不怕火系统,我认为是沿着这个场地再鼓舞。

    3. 四款实践里,唯一跑通闭环的是双足

    这套后磨真金不怕火系统主如果乐聚我方作念的,测试用的 LingBot-VLA预磨真金不怕火灵验到乐聚的真机数据。

    信得过让我感兴趣的不是这个,是他们如何去评释这套后磨真金不怕火系统。乐聚没只秀「我的实践跑通我的模子」,他们搭了两个场地的对照。

    横朝上,以夸父 KUAVO 4 Pro 这台实践,去适配 5 个主流模子,看哪个阐扬最佳。纵朝上,拿 LingBot-VLA 这一个模子,放到 4 款不同实践上去跑,看各家实践的适配情况。

    这种横纵交叉的打算,是会清晰站位的。

    一个纯实践厂,只会秀「我的实践加我互助的模子,颖慧活」。一个纯模子厂,只会秀「我的模子,在常见实践上能跑」。

    唯唯一个把我方定位成中间层、定位成后磨真金不怕火这一层的玩家,才会良友去作念这种横纵交叉的对照。因为唯独站在中间,这两个场地才都是你的业务。

    更特原理的是纵向的终局,参与的 4 款实践里,夸父是唯一的双足东谈主形,何况它把整条闭环跑通了。双足是很难的实践,这个毋庸我多说。轮臂、机械臂底盘稳、行动空间规整,双足光是站着不晃就还是在消费一堆结果余量。

    把我方难啃的双足,2026年世界杯官网放到蚂蚁的模子下面去跑。

    我的解读是,乐聚这是把赌注摆明了:模子是谁的不艰巨,实践是不是最难的也不艰巨,他们押的是中间这套从真机数据到失败归因的闭环,能不成把难的组合跑通。

    虽然,这个行动些许是作念给寰球看的,咱们暂且岂论。但双足这关真跑通了,至少阐发这套闭环能 work。

    这条闭环,买通的是 真实机数据 → 模子后磨真金不怕火 → 多实践部署 → 真实机评测 → 失败归因回流。它 solid 的不是某一段,是「回流」两个字,失败的案例能自动喂且归驱动下一轮迭代。

    站位,便是这样用一个行动摆出来的。

    4. 平均不到20%的见着力,我有些疑问

    再聊点现实。

    乐聚后磨真金不怕火在 95 个场景的横向测评里,平均见着力(SR)是 17.59%,平均过程得分(PS)是 36.22%。坦率讲,17.59% 的终局,有点低。我的第一反应便是:这到底是数据不行,照旧模子不行?

    这个问题我也径直问了乐聚的厚爱东谈主,他们跟我解释的约略原理如下:

    第一,任务是真实难。这 95 个场景里,许多不是单步握放,而是精良插入、器具使用、擦抹消亡、小主张按压、动态斗争、褂讪搬运、多阶段状态调养。这些任务你换成东谈主手去作念,都得屏住呼吸。

    我现场拍的测试过程,好阻隔易见效的一条。

    第二,真机实施难。统一个模子,换一台机器东谈主,实践结构、末端夹爪、相机视角、行动空间、结果频率全变,终局随着变。这无意反证了前边说的,跨实践有多难。

    第三,SR 体现的并不好意思满。SR 只看临了有莫得好意思满作念完,中间任何一步崩了就算 0 分。而 PS 过程分才响应过程鼓舞到了哪一步。复杂的多阶段任务,只盯着 SR 是抗击正的,GM-100 论文也专门说了这点,是以才另外界说了算计子任务完成度的方针。也便是说,PS 的 36.22% 比 SR 更能阐发模子真实的才智。

    第四,它考的是长尾泛化,不是纪念。LingBot-VLA 论文里提到,测试继续大致 50% 的行动,根柢不在磨真金不怕火集前 100 高频行动里。等于专门挑模子没如何见过的组合来考,考的是举一反三,不是背谜底。

    讲到这,得直面一个问题,我我方一运行亦然这样问的:就 150 条数据磨真金不怕火,会不会仅仅为了考证一下历程跑得通,拿来比见着力有点站不住脚? 乐聚的同学跟我强调,他们不是浅易的历程考证,是小样本要求下的压力测试,外加一次结伙预算的横向比拟。

    给悉数模子一样 150 条的后磨真金不怕火预算,平正地比谁泛化得更好。在这个结伙预算下,LingBot-VLA 的两项方针都是最优,PS 比强基线 π0.5 超越近 10 个点。

    这个解释倒能说得通,不外倒也算是揭了真机责任的遮羞布。

    通盘行业距离可靠的通用操作,差距还很大啊。

    乐聚顺遂还作念了垂直场景的落地。一样这套系统,到了具体的场景,比如汽车制造里的料箱拆垛,详细见着力作念到了 95% 以上,本领后果从最初的 30% 出面,提到了 80% 到 90%。

    一个是通才压力测试上的 17.59%,一个是专才落地场景里的 95%。这两个数不矛盾,它恰正是「通才变专才」这条路的字据。

    而把通才逼成专才的,便是中间那套后磨真金不怕火系统。

    5. 把通才逼成专才的,是中间那套系统

    这套系统的中枢,是一个自研的后磨真金不怕火算法库。细节我不逐个张开,Github上还是开源了。

    挑两个我认为比拟真实的,用东谈主话讲一下。

    一个是针对「可怜性渐忘」的。

    VLA 基模微调有个老转折:新本领学会了,预磨真金不怕火阶段的资门径却丢了。乐聚用的是基于 LoRA 的轻量微调,你不错贯串成,给模子注入新本领的时刻,尽量别去动它原本那套繁密的先验,这样它面临没见过的物体,泛化才智才不会塌。

    另一个是交融了生成式世界模子的后磨真金不怕火。

    传统 VLA 许多时刻是在机械地师法示范行动,并不睬解行动背后的物理因果。加了世界模子之后,终点于让模子脱手之前,先在脑子里预演一下「我这样操作,接下来会发生什么」,再据此选当下合理的行动。说东谈主话便是,从背谜底,酿成了边推理边干。

    算法库之外,是三条器具链:数据网罗处理平台、后磨真金不怕火器具链、端侧部署测评器具链。

    串起来,便是一条从数据到现场的好意思满活水线。其中阿谁数据平台很戳我,它把门径化的数据清洗作念成了活水线,采完径直输出干净数据,传说能把原本 3 到 5 天的清洗工时压到一天。

    开源的代码库我周末也用他们数据跑了一下,没什么很大的坑。

    这套东西成不熟习,还有个侧面的字据:在刚杀青的 ICRA 2026 的 REAL-I 挑战赛里,全球高校的学生,依托乐聚绽开的数据集和全栈器具链,一天之内就能从零起步,把模子部署到真机上,跑通金属件翻正、日化瓶取放、快递包裹扫描这三个真实工业场景。

    学生一天,从零到真机跑通。

    能把上手门槛压到这个进程,阐发这套后磨真金不怕火系统,确乎在往「工业品」的场地作念。

    写在背面

    回到最运行。我之是以去找乐聚,是因为我我方的数据采得不顺,外包采回想一泰半不成用,根子在于采的东谈主不懂模子需求。

    是以乐聚遴荐我方买通数据和模子,我认为他们照旧有我方的想法。

    在我的视角看来,他们想解决的可能是一个结构性问题:当搞数采的东谈主我方就懂算法,那么获取的每一条数据都是带着模子需求的。

    数据和模子,背面可能从数采的开首就走到一都。

    但还有两件事,我还有点疑问。

    一是模子用的蚂蚁的,乐聚作念的是后磨真金不怕火和数据,从我的体感上来说,这一层的壁垒是短期照旧恒久,当今还说不太准,照旧说换个罕有据有算力的玩家也能砸出来。

    二是横向测评里低 SR 就摆在那儿,通盘行业对通用具身的预期照旧不成太乐不雅,乐聚当今的最初能不成保持,也要看背面的迭代。

    从我的不雅感上来看,我仅仅认为数采厂我方作念模子和算法,起点上会有我方的想考。况且本年通盘行业都在喊落地,搞运控的卷舞蹈,搞大脑的找落地场景(进家庭/进工场),产业正在繁殖大都的开导需求。

    这样大的需求,只靠当今行业的算法团队限制根柢吃不用。乐聚这套后磨真金不怕火体系一定进程上裁汰了开导门槛,想加入但莫得训诲的开导团队也能快速参与进来。

    -END-2026年世界杯官网



    Powered by 2026年世界杯中国官网 @2013-2022 RSS地图 HTML地图

    czblgj.com备案号 备案号: 

    技术支持:®世界杯 RSS地图 HTML地图