بررسی عملکرد الگوریتم گرادیان سیاست قطعی عمیق (DDPG) در تصمیم گیری خودروی خودران در دو شرایط عادی و µ اسپلیت - لیدن |
کد مقاله : 1316-ISME2024 |
نویسندگان |
علی ریزه وندی *، شهرام آزادی، رضا کاظمی دانشکده مهندسی مکانیک، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران |
چکیده مقاله |
در سالهای اخیر با افزایش پیوستهی نیاز جوامع به خودروها و وسایل نقلیه، همراه با فواید فراوان این ابزارها، همواره مسائل مربوط به خطرات مالی و عواقبی که از آنها به وجود میآید، مورد توجه پژوهشگران و صنعتگران این حوزه قرار گرفته است. برای حل این مشکل، محققان سعی داشتهاند راهکارهایی برای حذف یا کاهش تأثیر مهمترین عامل در مرگ و زخمی شدن افراد ناشی از تصادفات جادهای یعنی خطاهای انسانی را پیدا کنند، تا آنجایی که این تلاشها به عرضه و معرفی خودروهای بدون راننده (AVs) منجر شد. در چند سال اخیر، با پیشرفتهای چشمگیر در زمینه فناوری خودروهای خودران و مبحث هوش مصنوعی و پیرو آن یادگیری ماشین، مسأله تصمیمگیری در این نوع وسایل نقلیه بیش از پیش به توجه محققان رسیده است. به عنوان مغز وسایل نقلیه خودران، سیستم تصمیمگیری برای رانندگی ایمن و کارآمد وسایل نقلیه بسیار حیاتی است و نحوه طراحی یک سیستم تصمیمگیری هوشمند و قابل اعتماد به تدریج موضوع اصلی تحقیقات در زمینه رانندگی خودران شده است. در این پژوهش به ارزیابی عملکرد روش یادگیری تقویتی عمیق (DRL) که یکی از مهمترین و کاربردیترین بخشهای علم یادگیری ماشین محسوب میشود در حوزهی خودروهای خودران پرداخته می-شود. در حقیقت، در این کار عملکرد الگوریتم گرادیان سیاست قطعی عمیق (DDPG) که یکی از پربازدهترین روشها در مبحث یادگیری تقویتی عمیق میباشد در فاز تصمیمگیری خودروی خودران در دو شرایط عادی و µ-اسپلیت مورد ارزیابی و تحلیل قرار خواهد گرفت. نتایج گویای عملکرد ایمن و کارمد الگوریتم تصمیم گیری در دو شرایط مدلسازی شده میباشد. |
کلیدواژه ها |
خودروهای خودران، الگوریتم گرادیان سیاست قطعی عمیق، یادگیری تقویتی عمیق، فاز تصمیمگیری. |
وضعیت: پذیرفته شده برای ارائه شفاهی |