استفاده از تصاویر تولید شده با هوش مصنوعی به عنوان داده‌های آموزشی ربات‌ها

محققان با بهره‌گیری از مدل‌های انتشار پیش‌آماده‌شده در فضای وب، موفق به توسعه روشی نوین برای آموزش ماشین‌های رباتیک شده‌اند. این روش مبتنی بر انتقال اقدامات به فضای تصویر است و به تولید سیاست‌هایی منجر می‌شود که از پیشرفته‌ترین رویکردهای بینایی-حرکتی موجود پیشی می‌گیرند. به گزارش سرویس اخبار فناوری رسانه تکنولوژی تکنا، در این روش، […]

محققان با بهره‌گیری از مدل‌های انتشار پیش‌آماده‌شده در فضای وب، موفق به توسعه روشی نوین برای آموزش ماشین‌های رباتیک شده‌اند. این روش مبتنی بر انتقال اقدامات به فضای تصویر است و به تولید سیاست‌هایی منجر می‌شود که از پیشرفته‌ترین رویکردهای بینایی-حرکتی موجود پیشی می‌گیرند.

به گزارش سرویس اخبار فناوری رسانه تکنولوژی تکنا، در این روش، محققان از تصاویر تولید شده به کمک هوش مصنوعی برای ایجاد داده‌های آموزشی ربات‌ها استفاده می‌کنند. سیستم پیشنهادی که Genima نام دارد، با تنظیم دقیق مدل Stable Diffusion، قادر است حرکات ربات را به صورت تصویری ترسیم کند و بدین ترتیب به هدایت ربات در شبیه‌سازی‌ها و محیط‌های واقعی کمک نماید.

این سیستم که حاصل تلاش‌های محققان آزمایشگاه یادگیری رباتیک استیون جیمز در لندن است، قابلیت آموزش طیف گسترده‌ای از ربات‌ها را برای انجام وظایف مختلف فراهم می‌کند. از جمله این ربات‌ها می‌توان به بازوهای مکانیکی، ربات‌های انسان‌نما و خودروهای خودران اشاره کرد.

بر اساس یافته‌های پژوهشی، Genima به عنوان یک عامل تقلید رفتار عمل می‌کند و با تنظیم دقیق مدل Stable Diffusion، اقدامات مشترک را به عنوان اهداف بصری روی تصاویر RGB ترسیم می‌کند. این تصاویر سپس به یک کنترلر منتقل می‌شوند تا اهداف بصری را به دنباله‌ای از موقعیت‌های مفصلی نگاشت کند.

محققان با ارزیابی عملکرد Genima در 25 وظیفه RLBench و 9 وظیفه دستکاری واقعی، به نتایج قابل توجهی دست یافتند. آن‌ها نشان دادند که با انتقال اقدامات به فضای تصویر، مدل‌های انتشار پیش‌آماده‌شده قادرند سیاست‌هایی تولید کنند که در مقایسه با رویکردهای پیشرفته بینایی-حرکتی، عملکرد بهتری در مواجهه با تغییرات محیطی و تعمیم‌پذیری به اشیاء جدید از خود نشان می‌دهند. گفتنی است که این روش حتی در مقایسه با عوامل سه بعدی که از اطلاعات قبلی مانند عمق، نقاط کلیدی یا برنامه‌ریزان حرکت بهره می‌برند، عملکرد رقابتی دارد.

محققان معتقدند که Genima قابلیت تطبیق با سایر تجسم‌ها و ترسیم ویژگی‌های فیزیکی مانند نیرو و شتاب را نیز داراست. با این حال، این سیستم همچون سایر روش‌ها، محدودیت‌هایی نیز دارد. به عنوان مثال، Genima تنها قادر به تقلید رفتارهای متخصص است و نمی‌تواند رفتارهای جدیدی را کشف کند. همچنین، این سیستم برای رندر کردن اهداف به کالیبراسیون دوربین نیاز دارد و فرض می‌کند که ربات همیشه از زاویه دید خاصی قابل مشاهده باشد. محققان بر این باورند که مدل‌های انتشار پیش‌آماده‌شده پتانسیل متحول کردن حوزه رباتیک را دارند، همان‌طور که در حوزه تولید تصویر این تحول را ایجاد کرده‌اند.