亚洲国产成人久久综合_久久99国产精品成人_久久久精品免费视频_欧美特黄一级大片

AI大模型賦能人形機器人

2023-05-25 06:35:11 來源:雪球網

(報告出品方/作者:國泰君安證券,肖群稀、鮑雁辛)


【資料圖】

1. 通用——解決機器人高需求和低滲透率的矛盾

服務機器人商業化落地的前提是產品能提供真實價值,真實價值的判斷在于機器人能否通用。在全球勞動力短缺的背景下,機器人產業蓬勃發展,2022 年全球服務機器人市場規模 217 億美元,過去 5 年復合增速超過 20%。然而,在高速發展背景 下,服務機器人滲透率仍然不高,規模化商業落地并不順利。

我們認為原因在于:目前大多數服務機器人都或多或少的存在場景適應性的問題, 如無法適應環境變化,環境變化后,用戶無法通過簡單操作實現場景適配;智能化程度低,行人避障及功能表現不理想;機器人部署流程復雜(如 SLAM 建圖、目標點標注等),所有部署操作只能由機器人現場部署工程師執行,使用者難以操作及參與,且當需要變更時,仍需現場部署工程師進行操作。

以商超場景為例: 環境復雜:場景中鏤空的貨架(超高類障礙物)、狹窄的通道、易跌落區域、低矮類障礙物及臨時的攤鋪,考驗機器人的通過性、感知能力、任務規劃能力。 高動態化:商場人流大,易聚集,動態障礙物多,對機器人安全避障能力要求高。 特殊物體較多,場景光線變化大:如玻璃護欄、自動扶梯、玻璃轉門、玻璃墻等高透物體大多數機器人基本無法識別,且容易對激光雷達產生干擾,導致機器人誤判, 發生碰撞、跌落、無法靠近作業。對于依賴視覺傳感器的機器人來說,要在普通光線、黑暗、過曝等光照條件都能穩定運行難度較大。

以上問題在工業機器人領域同樣存在,影響了工業機器人滲透率的提升,直到協作機器人的出現。 2022 年全 球協 作機 器人市 場規 模 89.5 億元人 民幣 ,預 計 2022~2028 年市場規模將以 22.05%的增速達到 300 億元。2017~2022 年中國協作機器人銷量從 3618 臺增長至 19351 臺,預計 2023 年出貨將超過 2.5 萬臺, 2016~2021 年市場規模從 3.6 億人民幣增長至 20.39億人民幣,復合增速 41.5%。 協作機器人也可以被認為是服務機器人,因為他們旨在與人類并肩作戰。傳統工業機器人在柵欄后與人分開作業,完成的工作也有限,例如焊接、噴涂、吊裝等。協作機器人更靈活,更智能,更容易合作,更具有適應能力,使汽車、電子等制造行業能夠將自動化擴展到最終產品組裝,完成任務(例如拋光和施涂涂層)以及質量檢查等等。

使機器人更加通用,需要機器人的感知能力、思考和決策能力、行動執行能力的全面提升。我們認為 GPT(預訓練大預言模型)和人形機器人的出現,是機器人在邁向通用人工智能的道路上的一大步。

感知世界的能力(機器人的眼睛):機器人自主移動的感知和定位技術中激光和視覺導航是主流應用方案。計算機視覺的發展經歷了基于以特征描述子代表的傳統視覺方法、以 CNN 卷積神經網絡為代表的深度學習技術,目前通用的視覺大模型正處于研究探索階段,人形機器人的場景相對工業機器人更通用、更復雜,視覺大模型的 All in One 的多任務訓練方案能使得機器人更好地適應人類生活場景。一方面, 大模型的強擬合能力使得人形機器人在進行目標識別、避障、三維重建、語義分割等任務時具備更高的精確度;另一方面,大模型解決了深度學習技術過分依賴單一任務數據分布,場景泛化效果不佳的問題,通用視覺大模型通過大量數據學到更多的通用知識,并遷移到下游任務中,基于海量數據獲得的預訓練模型具有較好的知識完備性,提升場景泛化效果。

思考和決策的能力(機器人的大腦):目前的機器人都是專用機器人,只能在限定場景中應用,即使是機器人抓取,基于計算機視覺,仍然是在限定場景中,算法僅用于識別物體,如何做、做什么仍需要人的定義。要讓機器人通用,叫他去澆花,他就知道去拿水壺,接水,然后澆花,這是需要常識才能完成的事情。如何能讓機器人擁有常識?在大模型出現之前,這個問題幾乎是無解的。大模型讓機器人可以擁有常識,從而具備通用性去完成各種任務,徹底改變通用機器人實現的模式。

人類工具和環境的適應性,不用再為了機器人而造工具。

執行能力 (機器人的四肢):行動能力(腿)+精細操作(手)。把機器人做成人形,就是為了讓機器人的執行能力更加通用。機器人執行任務時所處的環境是按照人類的體型建造起來的:建筑、道路、設施、工具等,這個世界是為了方便人類這種人形生物才這樣設計。如果出現了某種新形態的機器人,人們就必須重新設計一套機器人適應的全新環境。設計在某個特定范圍內執行任務的機器人相對容易,如果想要提高機器人的通用性,就必須選擇可以作為分身的人形機器人。此外,人類與人形機器人更容易有情感上的交流,人形機器人會讓人感到親近。日本機器人專家森昌弘的假設指出:由于機器人與人類在外表、動作上相似,所以人類亦會對機器人產生正面的情感。

從 2015 年 DARPA Robotics Challenge,到 2019 年人形機器人各種科研項目被砍,業內普遍唱衰,再到 2022 年特斯拉帶動的百花齊放,人形機器人產業處于螺旋式向上的發展之中。波士頓動力的 Atlas、Tesla 的 Optimus、小米 CyberOne、 ihmc 的 Nadia,Agility Robotics 的 Nadia、日系 Asimo 與 HRP-5P 都在探索人形機器人的商業形態。

我們對人形機器人發展過程中有代表性的產品進行了梳理: 第一臺人形機器人 WABOT-1(1973 年)。1973 年日本早稻田大學加藤一郎帶領團隊研發出世界上第一臺真人大小的人形智能機器人——WABOT-1。該機器人有肢體控制系統、視覺系統和對話系統,胸部裝有兩個攝像頭,手部裝有觸覺傳感器。

本田 E 系列機器人(1986~1993 年),奠定穩定行走基礎。本田推出 E 系列雙足機器人,E0 到 E6,走路速度由慢變快,從走直線到在臺階或坡地上均可實現穩定行走,為下一步 P 系列類人機器人的研發奠定了基礎,是機器人歷史的里程碑。 本田 P 系列機器人(1993-1997 年)& ASIMO(2000~2011)。1993 年本田開發第 1 個仿人機器人原型 P1,2000 年 P 系列中的第 4 臺也是最后一臺機器人 P4 誕生,通俗稱呼阿西莫(ASIMO)。2011 年推出的第三代 ASIMO 身高 1.3 米,體重 48 公斤,行走速度是 0-9km/h,2012 最新版的 ASIMO,除具備了行走功能與各種人類肢體動作之外,還可以預先設定動作,并依據人類的聲音、手勢等指令, 做出相應動作。他還具備了基本的記憶與辨識能力。2018 年本田宣布停止人形機器人 ASIMO 的研發,專注于該技術的更多實際應用。

HPR 系列機器人(1998~2018)代替建筑行業的繁重工作:這是由日本經濟產業省和新能源與產業技術開發組織贊助,川田工業株式會社(Kawada Industries)牽頭與國立先進工業科學技術研究院(AIST)和川崎重工株式會社共同研發的通用家庭助手機器人的開發項目。項目起始于 1998 年 HPR-1(Honda P3),先后推出了 HPR-2P、HRP-2、HRP-3P、HRP-3、HRP-4C、HRP-4 等多個人形機器人。目前最新的機器人 HPR-5P 于 2018 年發布,該機器人身高 182cm,體重 101kg,全身總共 37 個自由度,旨在替代建筑行業中的繁重工作。

波士頓動力(1986~2023):腿足式機器人運控技術最前沿,軍事化應用特征明顯。 波士頓動力最早因研發的 Big Dog 而被世界聞名,公司發布了 BigDog、Rise、 LittleDog、PETMAN、LS3、Spot、Handle、Atlas 等多個機器人,從單足、多足機器人到人形機器人,有著明顯的軍事化應用的路線特征。波士頓動力是一家典型的技術驅動的公司,從機械結構、算法步態控制、動力系統耗能等方面對機器人持續迭代更新,核心在于發展腿式機器人以適應不同環境的使用,技術關鍵在于動力學研究和機器人平衡態的控制。

Digit 系列機器人(2019~2023):具備行走能力,專注物流領域商業化。Digit 系列是 Agility Robotics 公司在物流領域商業化的嘗試,公司是從俄勒岡州立大學 (OSU)拆分出來的機器人公司,致力于研發和制造雙足機器人,前后開發了 MABEL、ATRIAS、CASSIE、DIGIT 系列足式機器人。其中 CASSIE 可實現 4m/s 的驚人配速,是腿足式機器人在快速行走能力上里程碑式的成果。2019 年,Agility 推出了人形機器人 Digit,在 Cassie 的基礎上加上了軀干、手臂,并增加了更多計算能力,支持負載 18kg 的箱子,可進行移動包裹、卸貨等工作。

小米“鐵大“機器人(2022):21 年小米曾發布一款機械狗 Cyberdog,是其在足式機器人的首次嘗試。2022 年 8 月,小米首個全尺寸人形仿生機器人 CyberOne 亮相秋季發布會。CyberOne 身高 177cm,體重 52kg,藝名“鐵大”,能感知 45 種人類語義情緒,分辨 85 種環境語義;搭載小米自研全身控制算法,可協調運動 21 個關節;配備了 Mi Sense 視覺空間系統,可三維重建真實世界;全身 5 種關節驅動,峰值扭矩 300Nm。

特斯拉 Optimus 機器人(2022 年):推動人形機器人商業化。Optimus 原型機亮相于 2022 年特斯拉 AI day,身高 1.72m,體重 57kg,可負載 20kg,最快運動速度 8km/h。目前 Optimus 仍處于研發進展迅速,僅 8 個月機器人已可實現直立行走、搬運、灑水等復雜動作。

交互型機器人索菲亞(2015)和阿梅卡(2021),面部表情擬人化的嘗試: 索菲亞 (Sophia)是由漢森機器人技術公司(Hanson Robotics)開發的類人機器人,2015 年面世。索菲婭皮膚由 Frubber 仿生材料制成,基于語音識別、計算機視覺技術, 可以識別和復制各種各樣的人類面部表情,并通過分析人類表情和語言同人類對話。 阿梅卡(Ameca)由英國領先的仿生娛樂機器人設計和制造公司——工程藝術有限公司(Engineered Arts)打造,具有 12 個全新的面部致動器,經過面部表情升級后,能對著鏡子眨眼、抿嘴、皺眉、微笑。阿梅卡能夠自由進行幾十種仿人類的肢體運動,被認為是“世界上最逼真機器人”。

2. AI 大模型+人形機器人:給機器人提供常識

大模型 = 預訓練+微調。從 2017 年 Transformer 開始,到 GPT-1、BERT、GPT2、GPT-3、GPT-4 模型的出現,模型的參數量級實現了從億到百萬億量級的突破, 大模型(預訓練模型、Foundation Models)在無標注的數據上進行預訓練,利用專用的小規模的標注數據對模型進行微調(fine- tuning),可用于下游任務預測。 遷移學習是預訓練模型的主要思想,當目標場景數據不足時,先在數據量大的公開數據集上訓練基于深度神經網絡的 AI 模型,然后將其遷移到目標場景中,通過目標場景中的小數據集進行微調,使模型達到要求的性能。預訓練模型極大地減少了模型在標記數據量下游工作的需要,從而適用于一些難以獲得大量標記數據的場景。

大模型的發展過程和趨勢:從參數規模上看,大模型經歷了從預訓練模型、大規模預訓練模型、超大規模預訓練模型的階段,參數量實現了從億級到百萬億級的發展。 從數據模態來看,大模型正在從文本、語音、視覺等單一模態大模型,向著多種模態融合的通用人工智能方向發展。

AI 大模型將會從語音、視覺、決策、控制等多方面實現同人形機器人的結合,形成感知、決策、控制閉環,大大提升機器人的“智慧”程度:

語音:ChatGPT 作為一種預訓練語言模型,可以被應用于機器人與人類之間的自然語言交互。例如,機器人可以通過 ChatGPT 來理解人類的自然語言指令,并根據指令進行相應的動作。自然語言是人類最通用的交互媒介,語音作為自然語言的載體將會是機器人擬人化的關鍵任務。盡管深度學習的出現已經將以語音識別技術、 自然語言處理、語音生成技術為構成模塊的語音交互技術推向相對成熟的階段,但實際過程中仍然容易出現語義理解偏差(反諷等)、多輪對話能力不足、文字生硬的情況。語言大模型為機器人的自主語音交互難題提供了解決方案,在上下文理解、 多語種識別、多輪對話、情緒識別、模糊語義識別等通用語言任務上,ChatGPT 表現出了不亞于人類的理解力和語言生成能力。在以 ChatGPT 為代表的大模型的加持下,人形機器人對通用語言的理解和交互才能提上日程,這將會是通用 AI 賦能通用服務機器人的開始。

視覺:視覺大模型賦能人形機器人識別更精確,場景更通用。計算機視覺的發展經歷了基于以特征描述子代表的傳統視覺方法、以 CNN 卷積神經網絡為代表的深度學習技術,目前通用的視覺大模型正處于研究探索階段。一方面,大參數量模型的強擬合能力使得人形機器人在進行目標識別、避障、三維重建、語義分割等任務時具備更高的精確度;另一方面,通用大模型解決了過去以卷積神經網絡為代表的深度學習技術過分依賴單一任務數據分布,場景泛化效果不佳的問題,通用視覺大模型通過大量數據學到更多的通用知識,并遷移到下游任務中,基于海量數據獲得的預訓練模型具有較好的知識完備性,大大提升場景泛化效果。人形機器人的場景相對工業機器人更通用、更復雜,視覺大模型的 All in One 的多任務訓練方案能使得機器人更好地適應人類生活場景。

決策:通用語言、環境感知能力是自動化決策的基礎,多模態大模型契合人形機器人的決策需求。單一模態智能無法解決設計多模態信息的決策問題,如“語音告知機器人去取桌子上綠色蘋果”的任務。多模態統一建模,目的是增強模型的跨模態語義對齊能力,使模型逐步標準化,使得機器人能綜合視覺、語音、文本多維度信息,實現各感官融合決策的能力。基于多模態的預訓練大模型或將成為人工智能基礎設施,增強機器人可完成任務的多樣性與通用性,讓其不只局限于文本和圖像等單個部分,而是多應用相容,拓展單一智能為融合智能,使機器人能結合其感知到的多模態數據實現自動化決策。

控制:生成式 AI 賦能機器人自我控制,最終形成感知、決策、控制閉環。使得人形機器人具備通用能力,首先需要其具備“常識”,即通用的語言理解能力(語音)和場景理解能力(視覺);其次需要其具備決策能力,即接收指令后產生的對任務的拆解;最后,需要其具備自我控制和執行性能,生成式 AI 的代碼生成能力將最終使得機器人的感知、決策、動作形成閉環,達到自我控制的目的。事實上,近來微軟團隊已經嘗試將 ChatGPT 應用于機器人控制的場景中,通過提前寫好機器人底層函數庫,并對其描述功能作用及目標,ChatGPT 能生成完成任務的代碼。在生成式 AI 的推動下,機器人編程的門檻將會慢慢降低,最終實現自我編程、自我控制,并完成人類習以為常的通用任務。

OpenAI 領投挪威人形機器人公司 1X Technologies。2017 年 OpenAI 推出了用于機器人的開源軟件 Roboschool,在機器人中部署了新的單樣本模仿學習算法, 通過人類在 VR 中向機器人演示如何執行任務。2018 年,OpenAI 發布了 8 個模擬機器人環節和事后經驗回訪基線實施,并用來訓練在物理機器人上工作的模型。22 年,Halodi Robotics 在挪威 Sunnaas 醫院測試了醫護助理機器人 EVE,讓其執行后勤工作 。2023 年 3 月 28 日 ,OpenAI 領 投 挪威 人 形 機器 人 公 司 1X Technologies(前稱 Halodi Robotics)。Halodi Robotics 通過 Ansys 初創公司計 劃利用 Ansys 仿真軟件開發能在日常場景中與人安全協作的人形機器人。

微軟提出 ChatGPT for Robotics,利用 ChatGPT 解決機器人應用程序編寫問題。 2023 年 4 月,微軟在其官網發表了一篇名為《機器人 ChatGPT:設計原則和模型能力(ChatGPT for Robotics: Design Principles and Model Abilities)》論文, 這項研究的目標是觀察 ChatGPT 是否可以超越文本思考,并對物理世界進行推理來幫助完成機器人任務。人類目前仍然嚴重依賴手寫代碼來控制機器人,該團隊一直在探索如何改變這一現實,使用 OpenAI 的新人工智能語言模型 ChatGPT 實現自然的人機交互。

人類可以從機器人流程中的 in the loop 變為 on the loop。論文提出,不要求 LLM 輸出特定于機器人平臺或者庫的代碼,只是創造簡單的高級函數庫供 ChatGPT 調用,并在后端講高級函數庫鏈接到各個平臺,場景和工具的現有庫和 API。結果證明,ChatGPT 的引入,使得人類通過自然語言等高級語言命令于語言模型交互,用戶通過文本對話不斷將人類的感知信息輸入 ChatGPT,ChatGPT 解析觀察流并在對話系統中輸出相關操作,不需要生成代碼。這樣,人類可以實現無縫部署各種平臺和任務,人類對 ChatGPT 輸出的質量和安全性進行評估。

人類在機器人 pipeline 中的任務主要是: 1)首先,定義一組高級機器人 API 或函數庫。該庫可以針對特定的機器人類型進行設計,并且應該從機器人的控制棧或感知庫映射到現有的低層次具體實現。為高級 API 使用描述性名稱非常重要,這樣 ChatGPT 就可以推理它們的行為。 2)為 ChatGPT 編寫一個文本提示,描述任務目標,同時明確說明高級庫中的哪些函數可用。提示還可以包含有關任務約束的信息,或者 ChatGPT 應該如何組織 它的答案,包括使用特定的編程語言,或使用輔助解析組件等。 3)用戶通過直接檢查或使用模擬器來評估 ChatGPT 的代碼輸出。如果需要,用戶使用自然語言向 ChatGPT 提供有關答案質量和安全性的反饋。 4)當用戶對解決方案感到滿意時,就可以將最終的代碼部署到機器人上。

ChatGPT 可以以 zero-shot 的方式解決簡單的機器人任務。對于簡單的機器人任務,用戶只需要提供文本提示和函數庫描述,不需要提供具體的代碼實例,ChatGPT 就可以 zero-shot 解決時空推理(ChatGPT 控制一個平面機器人,用視覺伺服捕捉籃球位置)、控制真實無人機完成物體尋找、操縱虛擬無人機實現工業檢測等問題。

在人類用戶 on the loop 交互下,ChatGPT 可以完成更復雜的機器人控制任務。 1)課程學習:教授 ChatGPT 簡單的拾取和放置物體的技能,并將所學會的技能按照邏輯組合用于更復雜的區塊排列任務;2)Airsim 避障:ChatGPT 構建了避障算法的大部分關鍵模塊,但需要人工反饋無人機朝向等信息。人工反饋高級的自然語言,ChatGPT 能夠理解并在適當的位置進行代碼修正。

ChatGPT 的對話系統能夠解析觀察并輸出相關操作。1)帶 API 的閉環對象導航: 為 ChatGPT 提供了對計算機視覺模型的訪問,作為其函數庫的一部分。ChatGPT 在其“代碼“輸出中構建感知-動作循環,實現估計相對物體角度、探索未知環境、 并導航到用戶指定對象的功能;2)使用 ChatGPT 的對話進系統進行閉環視覺語言導航。在模擬場景下,人類用戶將新的狀態觀測值作為對話文本輸入,ChatGPT 的輸出僅返回向前的運動距離和轉彎角度,實現了用“對話系統”指導機器人一步步導航到感興趣區域。

3. 人形,讓機器人的運動執行更加通用

執行能力(機器人的四肢):行動能力(腿)+精細操作(手)。把機器人做成人形, 是為了讓機器人的執行能力更加通用。機器人執行任務時所處的環境是按照人類的體型建造起來的:建筑、道路、設施、工具等,這個世界是為了方便人類這種人形生物才這樣設計。如果出現了某種新形態的機器人,人們就必須重新設計一套機器人適應的全新環境。設計在某個特定范圍內執行任務的機器人相對容易,如果想要提高機器人的通用性,就必須選擇可以作為分身的人形機器人。本章選擇兩個代表性產品波士頓動力 Altas 和特斯拉 Optimus,從驅動、環境感知、運動控制三方面對比方案差異,探尋人形機器人運動控制方案商業化的趨勢。

波士頓動力 Altas 定位于技術的前瞻性研究,側重探索技術應用的可能性而非商業化。從硬件架構來看, Altas 具備出色的動態性能、瞬時功率密度和穩定的運動姿態,可以實現高負載、高復雜度的運動, 像是一場技術驅動的盛宴。商業化并非波士頓動力當前主要考量因素,Altas 項目更多作為一個研究平臺供研究者進行學術試驗,側重探索技術應用的可能性而非商業化。 特斯拉 Optimus 發心于人形機器人的規模化、商業化、標準化,商業化的目標驅動下,成本、能耗成為特斯拉團隊的考量指標。

主流人形機器人的驅動方案包括液壓驅動和電氣驅動(伺服電機+減速器)兩種。相比電氣驅動,液壓驅動輸出力矩大、功率密度高和過載能力強,因而能滿足波士頓動力 Atlas 高負載動作和快速運動的需求;但液壓驅動的方式能耗大、成本高,同時容易出現漏液等問題、可維護性差。一方面,商用場景下高負載動作(如跑酷、 后空翻等)屬于非必要行為,另一方面,隨著電驅系統功率密度和響應速度的不斷提升,我們認為結合電驅成本低、易于維護且技術應用成熟的優勢,基于電驅的人形機器人商業化可能性更高。

波士頓動力全身共 28 個液壓執行器,可執行高負載復雜動作。HPU(Hydraulic Power Unit)作為 Atlas 的液壓動力源具備極小尺寸的高能量密度(~5kW/5Kg), 電液經由流體管線連接至各液壓泵,可實現快速響應和精確力控,其高瞬時功率密度的液壓驅動器能支持機器人實現奔跑、跳躍、后空翻等復雜動作,機器人的結構強度得益于其高集成度的結構總成。根據官方披露影像及專利細節,我們推測:踝、 膝、肘關節由液壓缸驅動;髖、肩、腕關節及腰腹由擺動液壓缸驅動。

單臺 Optimus 全身 40 個執行器,是單臺多關節機器人的 6~7 倍。其中:身體關節部分采用減速器/絲桿+伺服電機的傳動方式,共計 28 個執行器;機械手基于欠驅動方案,采用電機+腱繩驅動(tendon-driven)的傳動結構,單手 6 個電機,11 個自由度。

根據 Testla AI Day,特斯拉自主研發的六種執行器中,旋轉關節方案繼承工業機器人,線性執行器和微型伺服電機是人形機器人新需求,具體看:

旋轉關節方案(肩、髖、腰腹):伺服電機+減速器,我們推測,單臺人形機器人將搭載 6 臺 RV 減速器(髖、腰腹)和 8 臺諧波減速器(肩、腕)。根據特斯拉 Optimus 執行器方案,RV 減速器體積大、負載能力強、剛度高,適用于髖、腰腹大負載關節, 其中髖關節 2*2 臺、腰腹兩個自由度 2 臺,共計 6 臺;諧波減速器體積小、傳動比高、精密度高,適用于肩、腕關節,其中肩關節 3*2 臺、腕關節 1*2 臺,共計 8 臺。 隨著更多廠商的涌入,其執行器方案可能存在差異,若線性執行器被旋轉執行器替代,單臺機器人減速器數量將有所提升。

擺動角度不大的關節(膝、肘、踝、腕):線形執行器(伺服電機+絲杠)。一體化伺服電動缸(伺服電機+絲杠)方案具備自鎖能力,能耗比純旋轉關節方案低。線性執行器空間利用率高、能提供較大的推動力。我們猜測,線性執行器基于力矩電機結合行星滾柱絲杠的方案將應用于線性執行器關節(髖、膝、踝、肘、腕)中,預計合計將使用 14 個線性執行器。

行星滾柱絲杠以其高承載、高剛度、長壽命的特點或成為人形機器人線性執行器的關鍵傳動裝置,通過適配人形機器人需求實現降本是大規模放量的前提。根據 Tesla AI Day 2022 會上展示的信息來看,Optimus 線性執行器采用的方案即為行星滾柱絲杠一體式伺服電動缸。我們認為下肢髖、膝、踝關節及上肢的肘關節的伺服電缸采用高承載、高剛度的行星滾柱絲杠作為傳動裝置可能性比較大。行星滾柱絲杠結構復雜、加工難度大因而成本很高,通過調整設計、工藝方案適配人形機器人的需要來實現降本是其大規模應用的前提。

機械手:Optimus 單手包括 6 個執行器,可實現 11 個自由度,由微型電機驅動, “欠驅動”方案性價比高,“繩驅“傳動結構不確定性較大。“欠驅動”,系統執行器的數目小于其自由度數目,因為機械手本身高自由度數目的特性,出于提高系統設計的集成性、緊湊性和降低成本、更出于簡化后續運動控制的考慮,設計者們會減少所使用電機的數目(即執行器的數目),形成了執行器的數目小于其自由度數目的欠驅動方案。通過通過機械結構的優化實現以較少的執行機構驅動更多的自由度, 節省成本,是目前商業產品及高校機械手研發的主流選擇。

機械手驅動方案差異較大,電機的輕量化、低成本是關鍵。機械傳動結構上,機械手的主流方案包括繩驅(Tendon Driven)、連桿、齒輪齒條、材料形變等。各機械手驅動方案差異很大:Ritsumeikan Hand Ritsumeikan Hand 通過耦合走線實現了 2 個驅動器對 15 個關節的驅動;Stanford/JPL 靈巧手單手 16 個電機;Shadow Hand 單手 30 個電機,合計 24 個自由度。人形機器人機械手需要滿足質量輕、結構緊湊和抓取力強的要求,因此電機應具有尺寸小、質量輕、精度高、扭矩大的特點。空心杯電機結構緊湊、能量密度高、能耗低,和人形機器人機械手需求契合度高。

特斯拉 Optimus 機械手采取電機+腱繩驅動的方式,可能對手部傳動方案進行優化。盡管繩驅給機械手帶來了極大的靈活性,且可以極大簡化設計難度和系統的復雜性,但其可靠性、傳動效率都低于傳統連桿、齒輪齒條等方式,可能是研發團隊短期開發的權宜之計。

用于實現機器人自主移動的感知和定位技術原理主要包括視覺、激光、超聲波、GPS、 IMU 等,對應機器人感知系統的不同傳感器類別。SLAM(即時定位與地圖構建) 是發展比較成熟、應用廣泛的定位技術,它是機器人通過對各種傳感器數據進行采集和計算,生成對其自身位置姿態的定位和場景地圖信息的系統。SLAM 問題可以描述為:機器人在未知環境中從一個未知位置開始移動,在移動過程中根據位置估計和傳感器數據進行自身定位,同時建造增量式地圖。獲取定位和地圖后,再根據路徑規劃算法(全局、局部、避障)實現自主移動。

波士頓動力 Atlas 感知方案融合深度相機和激光雷達,基于多平面分割算法實現步態規劃。Atlas 機器人感知視覺技術發展相對成熟,它借鑒 Google Transformer 模型,搭建 HydraNet 神經網絡模型,優化視覺算法,完成了自動駕駛純視覺系統的遷移; Atlas 使用 ToF 深度相機以每秒 15 幀的頻率生成點云,基于多平面分割算法從點云中提取環境表面,數據經過映射后完成對周邊物體的識別。之后,工控機基于識別到的表面和物體信息進行步態規劃,以實現避障、探測地面狀況以和巡航等任務。IHMC 全稱為“人類與機器認知研究所”,是一家專注于研發機器人控制算法的頂尖機構,主要研發人形機器人行走所需的關鍵算法,而指揮 Atlas 機器人站立、行走等算法就來自于 IHMC。

特斯拉 Optimus 環境感知采用基于攝像頭的純視覺方案,移植特斯拉全自動駕駛系統,成本更低。Optimus 頭部搭載三枚攝像頭(魚眼攝像頭+左右攝像頭),通過全景分割+自研的三維重建算法(Occupancy Network)實現環境感知,純視覺方案相比激光雷達等感知設備成本更低,但對算力要求高。機器人繼承了 Autopilot 算法框架,通過重新采集數據訓練適用于機器人的神經網絡,以實現環境的三維重建、路徑規劃、自主導航、動態交互等。特斯拉強大的全自動駕駛系統(FSD)的移植,使機器人視覺方案在不增加硬件成本的前提下朝著更精確、更智能的方向進步。

運控算法是核心競爭力,各家人形機器人控制算法均為自研。人形機器人對運動控制能力及感知計算能力要求較高,且不同廠商的執行器數量和類別差異較大,未來運控算法或成為廠商核心競爭力,且自研可能性較大;此外人形機器人控制方案, 對于客戶應用場景的了解程度及工藝要求也是重要因素,目前下游場景分散,單獨一家廠商還很難將人形機器人做到各個場景的通用。

波斯頓動力 Atlas:基于離線行為庫和模型預測控制(MPC)實現行為控制離線行為庫基于軌跡優化算法(質心運動學優化+運動學優化)和動作捕捉(Motion Capture)創建,技術人員可通過向庫中添加新軌跡為機器人添加新功能;機器人被指定行為目標后,從行為庫中選擇盡可能接近目標的行為,獲得理論上可行的動態連續動作。模型預測控制(MPC)根據傳感器反饋的實時信息,基于行為庫調整部分參數(力、姿勢、關節動作時間等)的細節,以適應真實環境同理想的差異和其他實時因素。MPC 這種在線控制方式允許機器人偏離模版行動,同時可以為兩個行為(如跳躍和后空翻)間預測過渡動作,簡化了行為庫的創建過程。

特斯拉 Optimus:步態規劃算法思路和 Altas 類似,運動規劃器生成參考軌跡,控制器根據傳感器信息實時調整優化行為,控制算法尚不成熟步態控制算法中,運動規劃器首先基于預期路徑,生成參考軌跡,確定機器人模型的動力學參數。控制器基于傳感器數據對機器人進行姿態估計,根據現實環境和理想模型的差異,對機器人行為參數進行校正,得到真實行為。此外,在連續的步態間,算法結合了人類行走時的腳步狀態(腳掌初始著地->腳趾最后離地),結合上半身的協調擺臂運動,實現自然擺臂、大跨步以及盡可能的直膝行走,提高行走效率與姿態。目前機器人的步態控制方案還不夠成熟,抗干擾能力較弱,動態穩定性差, 特斯拉技術人員表示 Optimus 的平衡問題可能需要 18~36 個月解決。

類似的,Optimus 上肢操作借助基于動捕和逆運動學映射構成的離線行為庫,通過實時軌跡優化實現自適應操作。

人形機器人采集并處理多種模態數據,執行機構復雜程度遠高于工業機器人,對控制器實時算力、集成度要求高。人形機器人傳感器類型、數量遠超工業機器人,行動過程中需同時完成 3D 地圖構建、路徑規劃、多傳感器數據采集、采集運算并實現閉環控制等等,流程相對繁雜,數據維度、數據量均高于工業機器人,對算力要求高。工業機器人一般通過外接的圖像采集卡和圖像處理軟件實現識別和檢測;移動場景下的人形機器人要求圖像處理器集成于控制器芯片中,對芯片集成度有要求。 人形機器人控制器多為自主設計,不同廠商需求差異大。目前人形機器人下游場景的不確定性較強,不同廠商研發的機器人驅動方案(如驅動方式、電機方案)、感知方案(純視覺、多傳感器融合等)、控制算法差異較大,機器人對控制器的算力、存儲等有不同的需求,因此控制器的組成有差異,以自主設計為主。我們認為人形機器人控制器采用分布式控制系統的方案可能性較大,即由一個核心控制器和多個小型控制器構成,其中小型控制器用于驅動各個身體區域的關節。

波士頓動力 Atlas:機器人本體搭載 3 臺工控機負責運控系統的計算 。控制器接收來自激光雷達、ToF 深度相機的數據,生成地圖和路徑后基于離線行為庫中規劃目標行為;實際運動過程中通過采集 IMU、關節位置、力、油壓、溫度等傳感器數據,針對動作序列進行實時調整和優化。

特斯拉 Optimus:復用特斯拉汽車的感知和計算能力,在全自動駕駛 FSD 芯片基礎上開發適合人形機器人的控制器系統 。FSD 芯片集成了中央處理器、神經網絡處理器(NPU)、圖像處理器(GPU)、同步動態隨機存儲器(SDRAM)、信號處理器(ISP)、視頻編碼器(H.265)和安全模塊,能高效率地實現圖像處理、環境感知、通用計算和實時行為控制。為了匹配人形機器人和汽車的需求差異,Optimus 控制器芯片在 FSD 芯片基礎上做了適應性修改,增加了對視、聽、觸覺等數據采集實現多模態信息輸入支持,植入語音交互和無線連接模塊支持人機溝通,具備硬件保護功能以保障機器人和周邊人員安全, 進而實現行為決策和運動控制。

關鍵詞:

相關文章

熱文推薦

AI大模型賦能人形機器人
AI大模型賦能人形機器人

(報告出品方 作者:國泰君安證券,肖群稀、鮑雁辛)......更多>

A股超強盈利能力的公司
A股超強盈利能力的公司

A股盈利能力能夠達到頂級的公司只有29家!我今天用銷......更多>

投機者終究虧光離場--寫在中國石化跌快一元之際
投機者終究虧光離場--寫在中國石化跌快一元之際

是的,我們肯定是要坐很多次過山車,坐電梯的。因為我......更多>

世界快報:蘋果手機怎么連接到電腦傳照片和視頻_蘋果手機怎么連接到電腦傳照片
世界快報:蘋果手機怎么連接到電腦傳照片和視頻_蘋果手機怎么連接到電腦傳照片

1、可以實現這種操作的工具軟件有iTunes以及同步助手......更多>

排行推薦

環球關注:賽馬板塊5月24日跌0.49%,中體產業領跌,主力資金凈流出8083.46萬元
環球關注:賽馬板塊5月24日跌0.49%,中體產業領跌,主力資金凈流出8083.46萬元
5月24日賽馬板塊較上一交易日下跌0 49%,中體產業領... 更多>
人到中年,女人最需要的男人,大多是這些類型的 每日速讀
人到中年,女人最需要的男人,大多是這些類型的 每日速讀
雖然成熟穩重型的男人能夠給予女人的生活帶來更多的安... 更多>
世界微動態丨cdrx7貝塞爾摳圖詳細_cdr貝塞爾摳圖教程
世界微動態丨cdrx7貝塞爾摳圖詳細_cdr貝塞爾摳圖教程
1、工具:CDR1,首先在計算機中打開CDR編輯軟件,導入... 更多>
播了兩集就從8.7分飆上9.3分,HBO又奉上一部生猛新劇!
播了兩集就從8.7分飆上9.3分,HBO又奉上一部生猛新劇!
在IMDb平臺,《間諜 大師》第一集的評分為8 7分,... 更多>
中證1000是什么時候(中證1000是什么意思)
1、中證500指數和中證1000指數都是中證指數有限公司開... 更多>
路虎攬勝多少錢,2023年路虎攬勝多少錢
路虎攬勝是一款豪華SUV車型,具有強大的越野性能和出... 更多>
高校畢業生注意了 這些就業政策與你相關
當前正值高校畢業生就業“百日沖刺”期,今天(5月24... 更多>
隆基綠能硅異質結轉換效率世界紀錄概念產品2681有望量產
5月24日,在全球最具影響力的光伏盛會——SNEC第十六... 更多>
焦點速讀:NVIDIA與微軟合作加速企業就緒的生成式AI
NVIDIA與微軟合作加速企業就緒的生成式AI,NVIDIAAIEnt... 更多>
守護正版、綠色閱讀……我市多區開展“護苗2023·綠書簽”行動_世界視點
記者從廣州市“掃黃打非”辦公室獲悉,近日我市多區開... 更多>
深圳樓市新政再傳利好!6類存量房可以籌集作為保障性租賃住房!-環球快訊
深圳樓市新政再傳利好!6類存量房可以籌集作為保障性... 更多>
查社保的網址是什么_查社保的網址
1、登陸所在城市的勞動保障網或社會保險業務網站,點... 更多>
鍥介檯浜轟綋褰╃粯澶ц禌鍙戝睍鏂瑰紡_國際人體彩繪大賽
世界人體彩繪藝術節(DaeguInternationalBodyPainting... 更多>
校企融合促發展 合作共贏開新篇!丨武漢輕工大學校長董仕節一行來公司調研_環球熱資訊
校企合作  武漢輕工大學  校長董仕節一行來公司調... 更多>

石門喜獲全國“紅茶重點產區”殊榮

世界快訊:最后一跳_對于最后一跳簡

小鵬汽車降本增效落地,四季度月交

飛鹿股份:對于半導體領域 將不再

納斯達克100指數跌幅擴大至1.1%-全

觀察家們認為 即便沙特對原油市場

買吧,不用猶豫_今日熱門

福萊特:周期加成長的光伏玻璃寡頭

統一回復:關于宋城演藝的估值

A股儲能萬花筒——振華股份,新能源

亚洲国产成人久久综合_久久99国产精品成人_久久久精品免费视频_欧美特黄一级大片
午夜一区二区三区在线观看| 影音先锋亚洲视频| 欧美成人午夜影院| 午夜精品一区二区三区在线| 亚洲视频综合| 亚洲淫性视频| 欧美一区二区在线| 久久精品官网| 久久人人97超碰人人澡爱香蕉| 久久深夜福利| 欧美波霸影院| 欧美性猛交xxxx乱大交蜜桃| 欧美午夜一区| 国产精品美女视频网站| 国产亚洲成年网址在线观看| 精品电影在线观看| 亚洲国产成人91精品| 亚洲人成啪啪网站| 亚洲影视在线播放| 欧美一区不卡| 免费国产自线拍一欧美视频| 欧美裸体一区二区三区| 国产精品欧美日韩| 好男人免费精品视频| 一区二区三区在线视频播放| 亚洲毛片av| 欧美在线影院| 欧美成人免费全部观看天天性色| 欧美日韩高清区| 国产无遮挡一区二区三区毛片日本| 韩国女主播一区| 亚洲无限av看| 玖玖综合伊人| 欧美日韩一区二区在线观看| 国产一区二区主播在线| 伊人狠狠色j香婷婷综合| 91久久视频| 久久精品99国产精品| 欧美激情视频免费观看| 国产色视频一区| 91久久香蕉国产日韩欧美9色| 小辣椒精品导航| 欧美日韩久久久久久| 国产精品欧美久久| 亚洲精品在线观看视频| 亚洲一区在线观看免费观看电影高清 | 麻豆精品网站| 国产精品播放| 亚洲精品老司机| 久久本道综合色狠狠五月| 欧美日韩午夜在线| 国产日韩欧美一区在线| 在线观看成人av| 亚洲综合欧美日韩| 欧美激情一区二区三区在线| 精久久久久久久久久久| 欧美亚洲综合在线| 欧美午夜精品伦理| 91久久精品一区| 欧美激情视频一区二区三区在线播放 | 久久精品国产999大香线蕉| 欧美日韩福利| 亚洲国产美女久久久久| 欧美中文日韩| 国产日韩精品一区二区三区在线| 在线一区二区三区做爰视频网站| 欧美成人亚洲| 狠狠久久亚洲欧美专区| 欧美一区二区在线免费观看| 国产精品久久久久久久久果冻传媒 | 欧美国内亚洲| 亚洲二区免费| 欧美xx69| 最新成人av网站| 欧美精品久久久久久久久老牛影院| 在线观看日韩av先锋影音电影院| 久久精品一区二区三区不卡| 国产亚洲欧美一区二区三区| 欧美亚洲一级片| 国产麻豆91精品| 久久精品国产99国产精品澳门| 欧美日韩精品在线播放| 一区二区三区色| 国产精品一国产精品k频道56| 亚洲欧美视频在线观看视频| 国产午夜久久| 久久久噜噜噜久久中文字幕色伊伊| 韩国av一区| 欧美成人在线免费观看| 国产在线观看91精品一区| 久久久精品性| 亚洲精品在线看| 欧美视频在线观看免费网址| 亚洲欧美日韩系列| 国产在线精品一区二区夜色| 六月婷婷一区| 亚洲午夜小视频| 欧美系列亚洲系列| 一本久久综合亚洲鲁鲁| 久久精品国产69国产精品亚洲| 亚洲高清色综合| 欧美三级日本三级少妇99| 亚洲女性喷水在线观看一区| 狠狠色噜噜狠狠色综合久 | 日韩亚洲欧美成人| 欧美国产第一页| 亚洲视频电影图片偷拍一区| 国产亚洲日本欧美韩国| 你懂的视频欧美| 亚洲欧美激情一区二区| 亚洲承认在线| 国产精品永久| 欧美日韩精品一区二区| 亚洲视频在线播放| 国产亚洲第一区| 欧美视频日韩视频在线观看| 久久久久国色av免费看影院 | 欧美色123| 一区二区高清在线观看| 国产精品国码视频| 免费短视频成人日韩| 亚洲欧美视频一区| 伊人成人开心激情综合网| 欧美片第一页| 亚洲女性裸体视频| 亚洲精品黄色| 在线欧美亚洲| 国产午夜精品久久久| 欧美日韩视频免费播放| 老鸭窝91久久精品色噜噜导演| 亚洲欧美日韩综合| 最近看过的日韩成人| 国产视频在线观看一区| 国产精品久久久久久久久| 欧美国产日韩一区二区三区| 久久婷婷久久| 久久aⅴ国产欧美74aaa| 亚洲视频在线观看三级| 在线观看亚洲一区| 欧美午夜电影网| 欧美14一18处毛片| 美女免费视频一区| 久久婷婷国产综合精品青草 | 久久久久九九视频| 欧美一级片一区| 午夜精品久久久久久久99水蜜桃| 亚洲一级在线观看| 久久成人精品| 欧美不卡视频一区| 欧美日韩亚洲一区二区三区在线观看 | 亚洲国产精品成人综合色在线婷婷| 怡红院精品视频| 亚洲人成免费| 亚洲一区二区三区高清| 欧美一区二区三区的| 久久一区二区三区国产精品| 欧美国产视频在线| 国产精品老女人精品视频| 国产午夜精品一区二区三区欧美| 伊人久久噜噜噜躁狠狠躁| 日韩一区二区精品葵司在线| 亚洲一区免费在线观看| 久久精品首页| 欧美日韩在线亚洲一区蜜芽| 国产欧美精品一区二区色综合| 樱桃视频在线观看一区| 一区二区三区高清不卡| 久久国产日本精品| 欧美日韩另类综合| 韩国精品在线观看| 日韩视频二区| 久久久久九九视频| 国产精品成人一区二区三区夜夜夜 | 怡红院精品视频| 亚洲午夜久久久久久尤物 | 老司机免费视频一区二区| 欧美日韩在线一二三| 国内精品久久久久影院 日本资源| 亚洲人体偷拍| 久久精品欧洲| 国产精品国内视频| 亚洲日韩欧美视频一区| 欧美一区二区私人影院日本| 欧美日韩大片| 亚洲第一视频| 久久成人18免费网站| 国产精品久久久久久久第一福利| 亚洲成色777777在线观看影院 | 激情久久一区| 欧美一级免费视频| 欧美日韩天堂| 亚洲欧洲美洲综合色网| 久久精品欧美| 国产精品久久久久久久一区探花 | 欧美激情亚洲国产| 激情综合色综合久久| 性8sex亚洲区入口| 国产精品二区影院| 中文日韩在线视频| 欧美日韩免费观看一区=区三区|