شرکت آمریکایی Figure موفق شده است با استفاده از یادگیری تقویتی (RL) به پیشرفت چشمگیری در توسعه حرکت طبیعی رباتهای انساننما دست یابد.
به گزارش اینترستینگ اینجیرینگ، در ویدیوی جدید منتشرشده رباتهای Figure ۰۲ با گامی روانتر و طبیعیتر حرکت میکنند و حرکات آنها شامل ضربه پاشنه، جدا شدن پنجه از زمین و تاب خوردن هماهنگ دستها است.
پیشرفت در راه رفتن طبیعی رباتها
به گفته شرکت Figure، مدل Figure ۰۲ با استفاده از یادگیری تقویتی در یک شبیهساز فیزیکی آموزش دیده است، به طوری که این شبیهساز، سالها داده را در عرض چند ساعت پردازش میکند. از سوی دیگر، بهرهگیری از تصادفیسازی حوزهای (Domain Randomization) باعث شده است که این رباتها بدون نیاز به تنظیمات اضافی، حرکت شبیهسازیشده را مستقیماً به دنیای واقعی منتقل کنند.
Figure در بیانیهای اعلام کرده است:
"ما یک کنترلکننده راه رفتن طبیعی را کاملاً در محیط شبیهسازی و از طریق یادگیری تقویتی انتهابهانتها توسعه دادهایم. این روش به ناوگان رباتهای Figure اجازه میدهد تا سریعاً استراتژیهای حرکتی مقاوم و مبتنی بر حس درونی (Proprioception) را بیاموزند و چرخههای مهندسی را با سرعت بیشتری طی کنند. "
یادگیری تقویتی و بهبود حرکت انساننما
این شرکت با استفاده از RL توانسته است کنترلکنندهای را توسعه دهد که راه رفتن ربات را از طریق سیگنال پاداش و فرآیند آزمون و خطا بهینه میکند. مدل RL در یک شبیهساز فیزیکی با شتاب GPU آموزش دیده که در آن هزاران ربات مجازی با پارامترهای فیزیکی متفاوت بهطور همزمان اجرا میشوند.
این روش باعث شده است که رباتهای Figure ۰۲ در معرض سناریوهای مختلف دنیای واقعی از جمله زمینهای ناهموار، دینامیک عملگرها و چالشهایی مانند لغزش، افتادن و فشارهای ناگهانی قرار بگیرند. در نتیجه، یک شبکه عصبی واحد برای مدیریت تمام حرکات ربات توسعه یافته است.
یکی از مزایای کلیدی این روش، انتقال مستقیم سیاستهای یادگرفتهشده از شبیهسازی به دنیای واقعی بدون نیاز به تنظیمات اضافی است که به آن "انتقال بدون نیاز به تنظیم (Zero-Shot Transfer) " گفته میشود. این ویژگی، عملکردی مقاوم و شبیه به انسان را در شرایط مختلف تضمین میکند.
طبق اعلام Figure، استفاده از روشهای مبتنی بر RL علاوه بر کاهش چرخههای توسعه، باعث افزایش انعطافپذیری و قابلیت اطمینان این رباتها شده است.
نمایش عملکرد همزمان چندین ربات Figure ۰۲
در ویدیوی جدید منتشرشده، ده ربات Figure ۰۲ در حال راه رفتن روی یک شبکه عصبی یادگیری تقویتی مشترک دیده میشوند، بدون آنکه نیاز به تنظیمات جداگانه برای هر یک از آنها باشد. این موضوع قابلیت مقیاسپذیری بالای این فناوری را نشان میدهد و میتواند زمینهساز تولید انبوه و استقرار هزاران ربات بدون تنظیمات دستی باشد.
Figure در کنار توسعه فناوری حرکت طبیعی، اخیراً از مدل جدیدی به نام Helix رونمایی کرده است. این مدل از ترکیب بینایی، پردازش زبان و کنترل (Vision-Language-Action یا VLA) برای اجرای دستورات پیچیده زبانی در رباتها استفاده میکند.
رقابت با غولهای رباتیک و چشمانداز آینده
شرکت Figure AI خود را به عنوان رقیبی جدی در حوزه رباتیک انساننما معرفی کرده و در کنار تسلا (با ربات Optimus)، Agility Robotics (با ربات Digit) و شرکتهای چینی مانند UBTech و Unitree Robotics فعالیت میکند.
این شرکت قصد دارد در سال ۲۰۲۵ تولید و ارسال رباتهای خود را گسترش دهد و به پیشرفتهای بیشتری در حوزه رباتهای خانگی دست یابد. با ادغام فناوری Helix و روشهای پیشرفته RL، Figure AI به دنبال افزایش توانایی رباتها در درک دستورات زبانی، مدیریت اشیای غیرمنتظره و همکاری مؤثر با انسانها است.
این پیشرفتها میتوانند مسیر جدیدی برای ادغام رباتهای انساننما در زندگی روزمره ایجاد کنند.
انتهای پیام/