
برت اَدکاک، بنیانگذار و مدیرعامل شرکت Figure، روز پنجشنبه از مدل جدید یادگیری ماشین برای رباتهای انساننما رونمایی کرد. این خبر دو هفته پس از اعلام تصمیم این شرکت در مورد قطع همکاری با OpenAI منتشر شده و بر توسعه Helix، یک مدل جدید Vision-Language-Action (VLA) متمرکز است.
به گزارش تک گرانچ، مدلهای VLA پدیدهای نوظهور در حوزه رباتیک هستند که از ترکیب بینایی و دستورات زبانی برای پردازش اطلاعات استفاده میکنند. در حال حاضر، شناختهشدهترین نمونه از این مدل، RT-۲ شرکت Google DeepMind است که از ترکیب ویدئو و مدلهای زبانی بزرگ (LLM) برای آموزش رباتها بهره میبرد.
Helix نیز عملکرد مشابهی دارد و با ترکیب دادههای بصری و دستورات زبانی، ربات را در لحظه کنترل میکند. شرکت Figure در این رابطه اعلام کرده است: "Helix توانایی بالایی در تعمیم اشیاء دارد و میتواند هزاران وسیله جدید خانگی با اشکال، اندازهها، رنگها و جنسهای مختلف را که قبلاً در فرآیند آموزش مشاهده نکرده است، صرفاً از طریق دریافت دستورات به زبان طبیعی، شناسایی و جابهجا کند."
ایده اصلی این مدل آن است که بتوان بهسادگی از ربات درخواست انجام کاری را داشت و آن نیز بدون نیاز به برنامهنویسی پیچیده، آن کار را انجام دهد. Helix برای پر کردن شکاف میان پردازش بینایی و زبان طراحی شده است. این سیستم پس از دریافت یک دستور صوتی به زبان طبیعی، محیط اطراف را بهصورت بصری ارزیابی کرده و سپس اقدام مناسب را انجام میدهد.
Figure برای نمایش تواناییهای این مدل، نمونههایی از عملکرد آن را ارائه داده است، از جمله:
"کیسه بیسکویت را به ربات سمت راست بده. "
"کیسه بیسکویت را از ربات سمت چپ بگیر و آن را در کشوی باز قرار بده. "
این مثالها نشان میدهند که Helix میتواند همزمان دو ربات را کنترل کند، به طوری که یکی از آنها وظیفه کمک به دیگری را در انجام کارهای مختلف خانگی بر عهده داشته باشد.
ورود رباتهای انساننما به محیطهای خانگی
Figure قصد دارد مدل VLA خود را با ربات انساننمای Figure ۰۲ در محیطهای خانگی آزمایش کند. خانهها به دلیل تنوع ساختاری و نبود استانداردهای یکسان، یکی از چالشبرانگیزترین محیطها برای رباتها محسوب میشوند. در مقابل، رباتهایی که برای صنایع طراحی میشوند، معمولاً در محیطهای ساختاریافتهتری مانند کارخانهها و انبارها فعالیت میکنند.
آموزش رباتهای انساننما برای کار در محیط خانه با چالشهای متعددی مواجه است، از جمله یادگیری نحوه کنترل دقیق حرکات و تطبیق با تغییرات متوالی در محیط. این مسائل، همراه با هزینههای بالای تولید (در محدوده صدها هزار دلار)، باعث شدهاند که بیشتر شرکتهای فعال در حوزه رباتیک، تمرکز اولیه خود را بر بازارهای صنعتی قرار دهند. به طور معمول، راهبرد این شرکتها آن است که ابتدا قابلیتهای رباتها را در محیطهای صنعتی ارتقا داده و هزینهها را کاهش دهند، سپس به توسعه کاربردهای خانگی بپردازند.
Figure نیز تاکنون تمرکز اصلی خود را بر پروژههای صنعتی، از جمله همکاری با شرکت BMW گذاشته بود. با این حال، معرفی مدل Helix نشان میدهد که این شرکت قصد دارد حضور در محیطهای خانگی را نیز جدیتر دنبال کند.
چالشهای آموزش رباتهای خانگی
برای اینکه رباتها بتوانند در محیط خانه کارآمد باشند، باید بتوانند رفتارهای جدید و هوشمندانهای را بهصورت آنی ایجاد کنند، بهویژه هنگام برخورد با اشیایی که قبلاً هرگز ندیدهاند. شرکت Figure در این باره میگوید: "آموزش یک رفتار جدید به رباتها در حال حاضر به تلاش انسانی زیادی نیاز دارد، از جمله ساعتها برنامهنویسی دستی توسط متخصصان سطح دکتری یا هزاران بار نمایش عملی یک عمل. "
روش برنامهنویسی دستی مقیاسپذیر نیست، زیرا خانهها از نظر طراحی، چیدمان و میزان نورپردازی بسیار متنوعاند. علاوه بر این، اشیای مورد استفاده در آشپزخانه، اتاق نشیمن و حمام از خانهای به خانه دیگر تفاوت زیادی دارند. به همین دلیل، روش جایگزین برای آموزش رباتها، استفاده از مدلهای یادگیری و تکرارهای آموزشی گسترده است.
در حال حاضر، رباتهای صنعتی برای انجام کارهایی مانند جابهجایی اشیا، به صدها ساعت تمرین نیاز دارند. این یعنی یک ربات برای آنکه بتواند در اولین تلاش خود یک شیء را درست بلند کند، باید صدها بار آن عمل را تمرین کرده باشد.
با این حال، فناوری Helix هنوز در مراحل ابتدایی توسعه قرار دارد. کارشناسان هشدار میدهند که ویدئوهای منتشرشده از عملکرد این مدل، تنها بخش کوچکی از فرآیندهای پیچیدهای را نشان میدهند که در پشت صحنه رخ میدهد. به نظر میرسد که Figure با انتشار این خبر، در تلاش است تا مهندسان بیشتری را برای پیشبرد این پروژه جذب کند.
انتهای پیام/