ob电竞·(中国)电子竞技平台

服务热线:400-123-4567

谁困住了具身智能?16位人形机器人DB电竞官网,高管激辩戳破行业真相

时间:2024-12-03 13:21:34 文章作者:小编 点击:

  智东西12月2日报道,11月27日,2024年中关村仿生机器人大会在北京海淀举行,邀请了30多位机器人和具身智能领域的院士、学术专家和企业家作分享。

  他们畅聊了人形机器人产业的核心壁垒与落地难点,密集输出数据集建设、系统设计、具身智能算法、世界模型、AI Agent、灵巧手操作、应用场景与量产时机、传感器、本体感知控制、大脑类器官、人工肌肉、算力资源等诸多热点干货。

  会上足足有16家明星人形机器人公司的创始人分别发表演讲或参与圆桌讨论。据智东西此前统计,今年有33家国内人形机器人创企公布新融资,公开融资总额超过50亿元。(人形机器人融资,爆爆爆!)

  谈到可以通过使用世界模型协同学习来解决数据质量问题;宇树科技创始人、CEO、CTO王兴兴谈到机器人领域应采用统一的模型,而不是分裂的多模态大模型;加速进化创始人兼CEO程昊预测具身智能将构建一个庞大的AI Agent生态系统,预计会包含上万个Agent和百万级的开发者。

  说,人形机器人过度对标人类的行为导致产品研发难度极大;月泉仿生创始人兼CEO李天灵、松延动力技术副总监覃帮羽都谈道,人形机器人大规模应用的关键障碍之一是产业链不完善;云深处科技联合创始人兼CTO李超说,AI将在提升仿生机器人自适应能力和智能水平方面继续扮演核心角色。还有一些专注于做人形机器人灵巧手的创企代表。

  谈道,微型化和柔性化将成为未来关键突破点,尤其是在小型精密运动部件的研发上;灵心巧手联合创始人兼CTO周永预测未来传感器的种类将大幅增加,或超过5至10种。

  说,类器官-脑机接口技术是未来创新方向;国家优青、清华大学机械工程系的长聘副教授赵慧婵重点谈到“仿生”技术,认为“自清理”机制是提高人工肌肉寿命的关键创新。

  、跨维智能创始人贾奎、国讯芯微CTO兼执行总裁蒋琛、乐聚机器人合伙人兼副总裁柯真东、青瞳视觉创始人兼CEO张海威、灵初智能联合创始人柴晓杰、他山科技联合创始人兼CEO马扬和北京软体机器人科技CTO鲍磊,分别分享了他们对数据质量、商业化落地难度、下肢移动和灵巧手、材料应用和感知技术等观点。

  在优必选联合创始人兼CTO、国家地方共建具身智能机器人创新中心总经理熊友军的演讲中,他分享了人形机器人产业的最新进展与未来趋势。

  熊友军称,人形机器人已经进入产业化落地阶段,市场前景巨大。根据高盛的报告,全球人形机器人市场规模预计从2023年初的60亿美元提升至2035年的380亿美元,这一增长将主要得益于出货量的增加和制造成本的降低。预计到2035年,人形机器人的出货量将达到140万台,且行业盈利速度将加快。

  人形机器人技术已有50多年的发展历史。2023年以来,海外企业已开始将人形机器人应用于实际场景,并计划在2025年推出多款产品。国内科技公司自2018年开始布局,2023年被视为“人形机器人元年”,多家公司已发布产品并进入量产阶段。

  。传统的基于经典模型的控制算法和优化控制算法,正在被深度强化学习等先进方法取代,从而提升机器人的运动控制能力,尤其是在动态环境下的自适应能力。其次,

  。熊友军强调,机器人技术的进步离不开高质量的数据集,尤其是跨模态融合的数据生成体系。这些数据集用于训练具身智能体,使机器人能够更好地理解和处理现实世界中的任务、物体和环境。因此,建设机器人数据生成平台是一个行业方向。最后,

  。具体来说,AI大模型主要负责任务规划(“大脑”),例如支持人与机器的交互,用于写作、编程、设计和办公等。具身智能体通过数据驱动的端到端技能执行(“小脑”)来实现机器人与物理世界的交互,广泛应用于工业、商业、家庭和特种行业。

  北京银河通用成立于2023年5月,今年累计融资12亿元,以投资方阵容豪华闻名,不仅有美团、科大讯飞等科技名企,还有北京、上海、香港、深圳四大地方国资。

  其创始人王鹤也是北京大学前沿计算研究中心助理教授、博士生导师,北京智源人工智能研究院具身智能研究中心主任。王鹤讨论了通用机器人在多种应用场景中的潜力,并分享了当前机器人研发中的关键进展。

  目前,主流的机器人训练数据收集方法是通过遥控操作(teleoperation)。这种方法是指人类远程控制机器人,收集不同环境下的动作和感知数据。特斯拉等公司通过遥控操作提供了大量的训练数据。

  此外,谷歌团队近期开发了一个名为OpenVLA的大模型,用于机器人训练。该模型被设计为能够在不同的环境、物体和摆放方向下进行训练,但现实中的效果却不理想,几乎无法成功抓取物体。王鹤谈道,数据的不足、杂乱和质量不高是导致这一问题的核心原因。

  相比自动驾驶,机器人技术的复杂性更高,特别是在物理交互方面。为了提高机器人的适应性,训练所需的数据不仅需要数量庞大,还必须具备极高的质量。这意味着,机器人训练的第一步必须从二维视觉提升至三维世界,这样才能更好地模拟现实环境中的物体和场景。然而,单靠传感器不足以解决这一问题,

  深度传感器通过激光或红外线等技术测量物体与传感器之间的距离,能够帮助机器人准确感知并理解物体形状,进而做出更有效的抓取动作。在这一过程中,机器人通过监督学习获取动作标签,从而逐步掌握如何执行各种任务,包括精准抓取。

  宇树科技成立于2016年,今年B2轮单笔融资额近10亿元,是2024年人形机器人领域单笔融资额最大的公司,投资方包括美团、深创投、中国互联网投资基金等。

  其创始人、CEO、CTO王兴兴谈道,深度强化学习算法已在四足机器人和人形机器人中得到充分验证,但在手臂和手指操作方面,是否能够同样实现成功应用仍是一个待解的问题。

  当前,许多机器人使用触觉感知来操作三指力控灵巧手,但如果能够实现本体感知控制,就可以避免依赖外部传感器,从而简化操作系统。

  关于运动控制,王兴兴说,目前的挑战是如何通过一个统一的模型来实现各种全身运动。现有的强化学习方法虽然已在仿真环境中取得一定成效,但其效率仍然较低,且当这些算法移植到实际机器人上时,由于硬件差异,往往会产生许多偏差。

  王兴兴还谈道,目前许多大语言模型存在幻觉问题,即它们缺乏逻辑思考能力,像人做梦一样迷失在数据海洋中,无法区分真假和对错。要实现具身智能的目标,必须将强化学习与实际机器人数据相结合。对于复杂的机器人系统来说,直接用实物机器人进行机器学习是至关重要的。

  王兴兴说,当前AI模型的最大问题在于缺乏自我理解和学习的能力。现有的AI模型架构通常是纯数据驱动的,即数据越多,模型能力越强。但这种方式导致了AI模型的泛化能力较差,难以适应新的场景和任务。王兴兴设想了一个理想中的AI智能模型——一个能够自我持续学习、理解、推理的完备模型。这种模型从小数据开始,通过持续的强化学习,能够实现指数级增长和快速学习。

  在谈到世界模型时,他说,这种模型可能实现了理想中AI的自我迭代能力,并且能使机器人越来越快速地学习和增强能力。此外,

  例如,灵巧手的操作本质上与机器人的导航避障和决策问题类似,完全可以通过一个统一的模型来实现。最后,王兴兴总结道,

  。当前的GPT模型主要处理文本数据,缺乏足够的认知理解能力。未来,可能需要首先实现类似动物的认知理解能力的AI模型,再进一步发展成人类认知能力的AI模型。

  星动纪元成立于2023年,是一家由清华大学持股的人形机器人公司。今年1月,该公司获得了来自联想创投等机构超过亿元人民币的天使轮投资。其创始人陈建宇也是清华大学交叉信息研究院的助理教授。

  陈建宇谈道,当前的技术趋势是将自然语言处理模型(如ChatGPT)与机器人技术结合,打造“原生”机器人模型。该模型具有全模态特点,能够与物理世界进行全面的交互,并采用端到端架构,无需复杂编程或人类先验知识,从而提高系统的通用性和灵活性。通过这一架构,具身智能体能够在简洁的算法下实现规模化(scaling up)。

  在实现通用具身智能体的过程中,陈建宇强调了三个核心要素:本体、算法和数据。他说,本体与算法需要联合优化,而数据和算法也应通过反馈优化,以不断提升系统性能。此外,本体反馈数据进一步推动优化。

  关于数据,陈建宇说,构建通用具身智能体需要大规模、高质量的专门数据。GPT-3的训练数据已经达到45TB,类似的大规模数据集对提高机器人智能至关重要。除了传统的文本和图像数据,行为、触觉等来自现实世界的反馈维度也必不可少,这些数据能够帮助机器人更好地理解环境。

  在算法方面,陈建宇谈道,通用、可扩展的具身智能算法研究是关键。像预测下一个Token这样的算法将是未来具身智能研究的重要方向,能够在不同情境下做出智能决策。

  陈建宇还谈道,当前的研究通过将大规模视频数据与机器人数据融合进行预训练,尽管数据质量仍面临挑战。

  ,从而提升机器人的感知和理解能力。他还提到了具身智能体的zero-shot泛化能力,即机器人能够在没有预训练的情况下,处理新的、未知的任务和环境。

  最后,陈建宇基于机器人图灵测试的概念,提出了一个问题:机器人是否能通过图灵测试,自动执行任务而无需遥控操作?这是他对机器人是否能够具备与人类相似智能的深入思考。

  加速进化成立于2023 年,今年9月完成了亿元Pre-A系列轮融。其团队核心成员出身于清华机器人控制实验室及清华火神足球队。其创始人兼CEO程昊在演讲中重点讨论了具身智能领域的行业发展、技术迭代和开发者生态。

  ,虽然许多公司已展示出相关技术的Demo,但这些并未转化为实际落地的产品。现阶段,具身智能的应用场景主要集中在科研、教育、竞赛和展览等领域,并且随着技术的发展,开发成本正在逐步降低。

  这一生态系统需要强大的端侧支持(设备端计算与处理能力)和云侧支持(云端计算与数据存储)。最终的模型可能是基于具身算法,核心是开发者能够将这些算法应用到机器人中,使其成为具体的AI Agent。

  程昊还谈道,开发者的迁移是具身智能发展的一个重要趋势。他指出,开发者将从PC时代的软件开发者、到互联网时代的网站开发者、再到移动互联网时代的APP开发者,

  。然而,当前具身智能领域仍处于起步阶段,开发者面临诸多困难,必须首先完善开发者生态。随着开发平台的成熟,更多开发者将能参与其中,共同推动人形机器人技术的普及与应用。

  在欧洲科学院院士、哈尔滨工业大学交叉科学研究中心主任高会军的演讲中,他重点介绍了类器官领域的最新研究进展,特别是类器官与脑机接口的结合,作为一个全新的前沿研究课题。近年来,类器官作为体外模拟人体器官功能的生物模型,逐渐成为疾病研究的重要工具,相关研究成果也频繁出现在Nature和Science等顶级期刊上。

  目前类器官普遍依赖人工培养,且在自然再生过程中存在一致性差、批次效应严重和细胞组成单一等问题。这使得类器官难以实现标准化批量生产,从而限制了其在医学转化中的应用。解决这一问题的

  ,这仍然是当前研究中的一大难题。高会军谈道,类器官再生的研究涉及三个核心问题:如何对细胞进行显微操作、分析类器官再生的机制、以及如何智能控制类器官的生长过程。针对这些问题,研究者已将研究领域细分为多个方向,包括生物材料合成、类器官芯片、细胞间通讯机制等方面。

  1、利用心肌细胞驱动机器人,类似于哈佛大学2022年基于生物组织制造的自发运动机器人。

  3、AI与自然智能的结合,利用类器官替代传统AI实现类似人类智能的行为。

  在国家优青、清华大学机械工程系的长聘副教授赵慧婵的演讲中,她探讨了软体机器人领域的发展背景、关键技术进展,以及柔性人工肌肉的应用。她谈道,机器人发展已有70多年,但现有机器人在特殊环境适应和人机接触方面仍面临挑战。因此,构建更加安全、柔顺、生物兼容的机器人本体是软体机器人技术发展的重要方向。

  赵慧婵介绍了机器人柔性驱动技术的三大关键:柔性驱动、外界感知,以及本体设计方法与应用形态。

  关于机器人柔性驱动,赵慧婵说下一代机器人的驱动器是高性能人工肌肉。人工肌肉作为一种重要的柔性驱动技术,虽然已经取得一定进展,但但尚未形成工业化应用。挑战主要在于驱动电压过高,接近材料的击穿极限,以及材料的退化和寿命较短。解决方案是,通过电流对瑕疵点进行绝缘,从而确保材料在长时间使用中的稳定性,这被称为

  有了这些核心技术,人工肌肉就能广泛应用于昆虫级仿生机器人、微细管道的探测与检修以及柔性微型隔膜泵等领域。赵慧婵谈道,人工肌肉技术经历了从低电压驱动到高功率、高频率驱动,再到多介质驱动的发展。目前,

  未来的挑战包括将人工肌肉技术应用于更极端的环境,扩大制备工艺以实现大规模制造,并进一步提高技术的寿命,力求在现有基础上再提升1至2个寿命极限。在感知方面,赵慧婵谈道,过去的研究主要依赖基于光学原理的柔性光波导技术,使得机器人能够感知应变、气压变化和手指的触觉力度等信息。现在,

  具体而言,新的软材料被用来制造微小电片,通过这些电片,机器人可以实现三向力感知。该技术可以布置在机械手指尖或协作机械臂的外表面,只需贴上即可实现感知。

  除了力触感知DB电竞官网,,赵慧婵还谈到了复杂形状感知的进展。由于机器人本体的形状通常为复杂的三维结构,赵慧婵称,利用更先进的光学检测技术,

  ,并实时获取整体的本体形态。通过这些技术,机器人不仅能够感知力的变化,还能更加准确地了解自身形态和与环境的互动。

  在圆桌论坛环节中,围绕“AI驱动机器人进入具身智能时代”这一主题,北京邮电大学“拔尖人才”教授、中国人工智能学会认知系统与信息处理专委会秘书长方斌主持了讨论。

  与会嘉宾包括千寻智能联合创始人、清华大学交叉信息学院博导、清华大学视觉与具身智能实验室主任高阳,跨维智能创始人、香港中文大学(深圳)终身教授贾奎DB电竞官网,,以及国讯芯微CTO兼执行总裁蒋琛。

  千寻智能成立于2024年1月,是一家具身智能机器人研发商,今年8月完成了2亿元天使轮融资,投资方为顺为资本;跨维智能成立于2021年6月,是一家以Sim2Real技术为核心的人工智能企业,今年5月完成了A轮融资,投资方包括联想创投,广州华南理工资管。

  高阳首先讨论了“scaling law”在具身智能中的应用,特别是与数据和大语言模型相关的研究。高阳说,具身智能与大语言模型的最大不同在于,具身智能并没有无限的数据源,因此在构建具身智能的“scaling law”时需要特别考虑这一点。

  高阳谈道,据研究,在通用场景中,机器人只需几千条数据即可实现任务的广泛泛化。这意味着,通过相对较少的数据量,具身智能能够有效地应对多种任务,表现出较强的适应能力和灵活性。

  然而,贾奎对高阳的结论提出了不同看法。贾奎说,现实情况远比理论推断复杂,特别是在不同异构数据之间存在显著差异的情况下,几千条数据的量级并不足以支撑机器人在复杂环境下的任务泛化。

  几千条数据通常属于一维信号,而在感知层面的复杂度要高得多,尤其是在信息量较大的情境下,如图像拍摄或三维数据的处理。贾奎说,单凭几千条数据难以实现数据泛化,数据量至少要达到上亿条才能有效支持机器人的智能行为。此外,如何构建高效的数据管道和工具链,降低成本并推动应用落地,才是当前面临的真正挑战。

  蒋琛从芯片算力的角度谈到了具身智能面临的困难。他说,当前的具身智能仍处于非常早期的阶段,且面临着算力限制。对于VLA模型(超大规模语言模型)而言,尚不明确该模型需要多少参数,以及哪些数据是基于真实世界的数据,哪些是基于模拟数据。蒋琛谈道,现有的算力限制了具身智能的进一步发展,并且预计

  ,难以迅速突破。在讨论行业共识和共同构建数据集的问题时,高阳谈道,虽然一些基准测试(benchmark)已经取得了一定进展,但机器人领域尚未形成一个普遍认可的标准基准。特别是机器人技术需要与环境进行交互,因此创建通用的基准测试标准非常困难。高阳举例说,李飞飞教授的行为数据集(behavior 100k)就是一种尝试,或许可以通过提升指标和进行算法比较来推动这一领域的研究进展。

  贾奎补充道,在不同硬件环境下的机器人系统,模拟和真机之间的差异使得标准化和比较变得困难。当前的研究应多做尝试,并加大投入,以推动技术的进步。

  蒋琛从数据质量出发,谈到了只有在高质量数据集的支持下,机器人系统才能实现有效的标准化。当前,数据集的来源尚未标准化,这导致了后续的标准化工作变得困难,无法形成统一的基准测试。此外,

  蒋琛补充道,将高质量数据集的采集作为核心研究命题,解决数据质量问题是推动具身智能发展的关键。

  在山东大学教授、博士生导师张伟的主持下,乐聚机器人合伙人兼副总裁柯真东、青瞳视觉创始人兼CEO张海威、帕西尼CEO许晋诚、月泉仿生CEO李天灵,以及松延动力技术副总监覃帮羽,围绕当前人形机器人研发的技术突破、瓶颈问题以及未来商业化落地展开了深入讨论。

  青瞳视觉创立于2015年,专注于3D智能感知和人机交互系统的研发;帕西尼成立于2021年,是一家触觉传感器和人形机器人公司,今年5月已完成数亿元A轮及A1轮融资,投资方包括新奥资本、北汽产投、南山战新投等机构。

  覃帮羽谈道,大部分应用场景下,机器人手部的抓取和操作是核心任务,而下半身的移动则更依赖于具体场景的需求。李天灵说,虽然双足机器人移动仍面临高能耗问题,但在实现目标时,机器人手部的灵巧操作才是突破的关键。许晋诚也说,虽然下肢的选择性较多,但上肢的通用工具能力才是推动机器人广泛应用的关键因素。张海威称,复杂环境下任务完成的关键仍然是双手,灵巧手加遥操作将是未来的核心技术方案。柯真东谈道,随着技术发展,移动不再是限制因素,未来的重心可能会转向极限应用场景中对下肢移动的需求。

  讨论进一步聚焦到当前人形机器人研发中的最大技术瓶颈。柯真东说,当前最大的问题是缺乏足够的高质量数据,尤其是用于泛化操作的数据来源存在较大争议。随着技术的不断进步,这一瓶颈可能会被突破,但现阶段数据问题仍然困扰着研发。

  许晋诚谈道,人形机器人与人类进行对标的挑战很大,产品定义的不明确使得这一对标困难重重,

  。李天灵补充道,科研突破到工程化应用的转化过程中,材料选择与供应链的问题是难点。覃帮羽说,除了数据问题,算法的部署与硬件一致性、电池能源问题也是制约技术发展的瓶颈,此外,产业链尚未成熟,成本依旧高昂。在讨论到未来5年人形机器人商业化的落地及行业爆发点时,柯真东谈道,当前机器人最有潜力的应用场景仍然是科研领域,工业应用也在逐步落地,但要达到理想的投入产出比(ROI),还需要时间。他预计,随着数据能力和作业效率的提升,机器人将在服务行业和家庭场景中逐渐崭露头角,但具体量产的时机尚不明朗。

  ,因此未来人形机器人在家庭中的应用前景更为广阔。许晋诚称,产业应用将率先取得突破,特别是在规则明确的场景中,而家庭场景的挑战则主要来源于对机器人的评价标准问题。李天灵谈道,目前人形机器人在工业场景中已有应用,不过终极目标仍是进入家庭,尤其是在陪护等领域的需求逐渐明确。覃帮羽说,人形机器人和工业机器人存在本质差异,

  ,但其在家庭陪护等领域的潜力巨大,短期内可以从娱乐导览和科研教育等场景入手。

  在这场圆桌论坛中,多个专家围绕仿生机器人技术的发展现状与未来趋势进行了探讨。论坛由南京航空航天大学教授、神源生智能董事长戴震东主持,参与的嘉宾包括云深处科技联合创始人兼CTO李超、因时机器人CEO蔡颖鹏、灵心巧手CTO周永、灵初智能联合创始人柴晓杰、他山科技联合创始人兼CEO马扬和北京软体机器人科技CTO鲍磊。

  云深处科技成立于2017年,是一家四足仿生机器人研发商;因时机器人成立于2016年,提供机器人核心零部件以及整机解决方案;灵初智能成立于2024年,致力于打造通用操作智能体;他山科技成立于2017年,是一家人工智能触觉传感芯片创企。

  。他补充道,底层技术的创新是关键,尤其是在如何将不同领域的技术痛点统一方面,例如小型化精密部件的研发。关于感知与机械手的关系,周永说,机械手本质上只是一个载体,所有的智能操作都依赖于感知技术。他谈道,未来仿生机器人将采用多种传感器进行数据采集,目前的主要技术路线有两种:一是侧重力传感的自动化路线,二是侧重视觉感知。周永预测,

  。在材料应用方面,柴晓杰谈道,高性能材料(如碳纤维和高强度硅胶)可以减少机器人在复杂应用中的误操作和碰撞风险,提高安全性,并降低生产成本。此外,触觉传感器的性能也与材料的选择息息相关,良好的材料可以提升触觉反馈的稳定性和灵敏度,从而改善机器人在实际场景中的表现。

  关于触觉传感技术,马扬谈道,触觉传感与视觉传感的最大区别在于其需要更高密度的传感器布置,依赖快速反应和高精度感知。当前,触觉传感的前端技术面临的主要挑战是如何在硬件层面提供支持,尤其是在边缘计算中实现高效的数据处理。

  ,推动机器人的自适应能力和智能水平进一步提升。蔡颖鹏说,微型化和柔性化将成为未来技术突破的关键,尤其是在精密小型运动部件的开发上。马扬谈道,触觉技术与力控技术将在医疗、家居和工业自动化等领域的精细操作中发挥重要作用。

  数据量和数据质量的不足被广泛认为是制约机器人在复杂环境中实现任务泛化的主要障碍。虽然关于机器人泛化所需的具体数据量级仍存在不同看法,但建设高质量的数据集已成为行业的共识。此外,芯片算力的局限性也限制了机器人广泛应用的可能性。而在软体机器人领域,力控感知和复杂形状感知已成为研究的关键方向。

  目前,机器人行业的各家公司,无论是专注硬件、软件,还是深度学习或大模型的研发,都面临着方法论和数据集不统一的问题。这一现象与ChatGPT等AI应用不同,机器人不仅涉及复杂的硬件设计,还需应对与物理环境交互的适应性和智能化问题。OB电竞,OB电竞,OB电竞,


标签:行业动态

【产品推荐】