بررسی عملکرد الگوریتم گرادیان سیاست قطعی عمیق (DDPG) در تصمیم گیری خودروی خودران در دو شرایط عادی و µ اسپلیت - لیدن
کد مقاله : 1316-ISME2024
نویسندگان
علی ریزه وندی *، شهرام آزادی، رضا کاظمی
دانشکده مهندسی مکانیک، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران
چکیده مقاله
در سال‌های اخیر با افزایش پیوسته‌ی نیاز جوامع به خودروها و وسایل نقلیه، همراه با فواید فراوان این ابزارها، همواره مسائل مربوط به خطرات مالی و عواقبی که از آنها به وجود می‌آید، مورد توجه پژوهشگران و صنعتگران این حوزه قرار گرفته است. برای حل این مشکل، محققان سعی داشته‌اند راهکارهایی برای حذف یا کاهش تأثیر مهمترین عامل در مرگ و زخمی شدن افراد ناشی از تصادفات جاده‌ای یعنی خطاهای انسانی را پیدا کنند، تا آنجایی که این تلاش‌ها به عرضه و معرفی خودروهای بدون راننده (AVs) منجر شد. در چند سال اخیر، با پیشرفت‌های چشمگیر در زمینه فناوری خودروهای خودران و مبحث هوش مصنوعی و پیرو آن یادگیری ماشین، مسأله تصمیم‌گیری در این نوع وسایل نقلیه بیش از پیش به توجه محققان رسیده است. به عنوان مغز وسایل نقلیه خودران، سیستم تصمیم‌گیری برای رانندگی ایمن و کارآمد وسایل نقلیه بسیار حیاتی است و نحوه طراحی یک سیستم تصمیم‌گیری هوشمند و قابل اعتماد به تدریج موضوع اصلی تحقیقات در زمینه رانندگی خودران شده است.
در این پژوهش به ارزیابی عملکرد روش یادگیری تقویتی عمیق (DRL) که یکی از مهم‌ترین و کاربردی‌ترین بخش‌های علم یادگیری ماشین محسوب می‌شود در حوزه‌ی خودروهای خودران پرداخته می-شود. در حقیقت، در این کار عملکرد الگوریتم گرادیان سیاست قطعی عمیق (DDPG) که یکی از پربازده‌ترین روش‌ها در مبحث یادگیری تقویتی عمیق می‌باشد در فاز تصمیم‌گیری خودروی خودران در دو شرایط عادی و µ-اسپلیت مورد ارزیابی و تحلیل قرار خواهد گرفت. نتایج گویای عملکرد ایمن و کارمد الگوریتم تصمیم گیری در دو شرایط مدلسازی شده می‌باشد.
کلیدواژه ها
خودروهای خودران، الگوریتم گرادیان سیاست قطعی عمیق، یادگیری تقویتی عمیق، فاز تصمیم‌گیری.
وضعیت: پذیرفته شده برای ارائه شفاهی