الگوریتمی ترکیبی برای آموزش شبکه های عصبی مصنوعی

خلاصه

آموزش شبکه های عصبی مصنوعی (ANN) یکی از چالش های بزرگ در استفاده از یک مدل پیش بینی بر اساس ANN می باشد. الگوریتم های بر پایه گرادیان شاع ترین الگوریتم ها آموزشی با چندین مورد اشکال می باشند. هدف این مقاله فراهم آوردن شیوه ای برای آموزش ANN می باشد. توانایی متاهوریستیک ها و الگوریتم های بر پایه گرادیان تند برای به دست آوردن بیهینه سازی انبوه ذرات برپایه مخالفتی بهبود یافته ترکیبی و یک الگوریتم انتشار به عقب با بیان مومنتوم، با هم ترکیب شدند. یادگیری برپایه مخالفت و اغتشاش تصادفی به تنوع جمعیتی در طول تکرار کمک می کند. استفاده از پارامتر متغییر زمانی توانایی جست و جوی PSO استاندارد را افزایش می دهد و عامل انقباض، همگرایی ذرات را تضمین می کند. از آنجایی که ممکن است چندین شرایط حداقل مشروط محلی در فضای وزنی رخ دهد، یک شیوه جدید اعتبارسنجی برای جلوگیری از جاسازی بیش از اندازه ارائه گشت. اثربخشی و بهره وری روش ارائه شده با چندین روش مشهور دیگر الگوریتم آموزشی ANN بر روی مشکلات علامت گذاری شده، مقایسه شد.

 

 

 

1. مقدمه

شبکه های عصبی مصنوعی (ANN) در حال حاضر در برنامه های مختلفی با موفقیت زیاد در حال استفاده می باشند. اولین مزیت اصلی آنها این می باشد که نیاز به تعیین الگریتم حل مشکل توسط خود استفاده کننده را ندارند (همانند مورد برنامهریزی کلاسیک) بلکه در عوض این شبکه ها از مثال ها یاد می گیرند، درست مثل انسان ها. دومین مزیت اصلی آنها این است که آنها دارای توانایی تعمیم ذاتی می باشند. بدین معنی که آنها می توانند الگو هایی که شبیه هم هستند اما با مواردی که برای آموزش مورد استفاده قرار گرفته اند یکسان نمی باشند، تشخیص داده و به آنها پاسخ دهند (Vosniakos and Benardos, 2007). ANN یکی از مهمترین تکنیک های داده کاوی می باشد. این شیوه هم برای یادگیری های تحت نظارت و هم غیر نظارتی استفاده می شود (Yaghini و همکارانش). آموزش ANN یک وظیفه پیچیده ای می باشد که در مسائل یادگیری تحت نظارت از اهمین بالایی برخوردار است. بیشتر الگوریتم های آموزشی ANN ما را واراد به جست و جوی مبتنی بر گرادیان می کند. این شیوه ها دارای مزیت جست و جوی مستقیم را دارند که وزن ها همواره به گونه ای که خطا را به حداقل می رساند به روز رسانی می شوند که فرایند آموزش ANN نامیده می شود. به هر حال چندین جنبه منفی در مورد این الگوریتم ها نیز وجود دارد که از جمله وابستگی به پارامتر نرخ یادگیری، از کار افتادگی شبکه، کند شدن با مرتبه بزرگی برای هر لایه پنهان اضافی که افزوده شده است و فضای خطای پیچیده و چند حالتی، می باشد. بنابراین این الگوریتم ها به احتمال زیاد در یک حداقل محلی گیر کرده اند که آنها را بهشدت به وزن های اولیه وابسته می کند و تنظیماتی که الگوریتم ها را می سازند مفید بودن جهانی آنها را تضمین نمی کند (Kiranyaz و همکارانش، 2009).

استرادژی جست و جوی جهانی متاهوریستیک آنها را قادر به جلوگیری از به دام افتادن در اوج ثانویه ی عملکرد و راه حل قوی برای مسئله ANN و آموزش آن، می سازد (Castellani و Rowlands، 2009). آنها توانایی این را دارند تا در هر نوع از ANN، روبه جلو باشد یا نه، با هر تابع فعال، مشتق پذیر یا نه، قابل کارکرد باشند (Kiranyaz و همکارانش، 2009). آنها راه حل ها قابل قبولی را در زمان های منطقی برای حل مسائل پیچیده و مشکل فراهم می سازند. آنها به خصوص برای سر و کار داشتن با مسائل پیچیده بزرگ استفاده می شوند که بهینه سازی محلی زیادی تولید می کند. آنها احتمال کمتری برای گیر افتادن در حداقل محلی نسبت به الگوریتم های جست و جوی بر پایه گرادیان مرسوم دارند. آنها بر اطلاعات گرادیانی وابسته نیستند و بنابراین برای مسائلی که چنین اطلاعاتی در دسترس نمی باشد و یا به دست آوردن یا تخمین آنها هزینه بر می باشد، مناسب می باشند (Talbi، 2009).

یادگیری الگوریتم جنبه مهمی از مدل ANN می باشد. در این مقاله یک بازبینی کلی و دسته بندی برای الگوریتم های یادگیری ANN ارائه شده است. شیوه ارائه شده استرادژی جست و جوی جهانی بهینه سازی بهبود یافته گروهی ذرات بر پایه مخالفتی (PSO) را با توانایی جست و جوی محلی الگوریتم انتشار به عقب سنتی (BPA) به بیان مومنتوم، ترکیب می کند. شیوه های بر پایه مخالفت و اغتشاش تصادفی دو مولفه گوناگونی الگوریتم می باشند. مولفه های اجتماعی و شناختی متغییر زمانی توانایی جست و جوی الگوریتم را افزایش می دهد و عامل انقباض پارامتر دیگری می باشد که همگرایی ذرات را تضمین می کند. در طول آموزش یک مدل پیش بینی ANN جاسازی بیش از اندازه برای مثال یادگیری بیش از حد مورد نیاز خصوصیات داده های آموزشی یکی از شایع ترین مشکلات به خصوص با گروه داده های بزگ می باشد (Prechelt، 1994). این مشکل یک تاثیر خارج از قرارداد بر روی مدل پیش بینی برای پیش بینی الگوی جدید دارد و باعث پیش بینی اشتباه و یا کمتر از حد مورد انتظار می شود (Yaghini و همکارانش، مجله). چندین روش برای حل مشکل ارائه شده است که هیچکدام چند حالتی بودن فضای وزن را در نظر نگرفته اند. بنابراین یک شیوه تکمیلی جدید ارائه می شود.

تشکیلات مقاله حاضر شامل موراد زیر می باشد. بخش دوم یک بازبینی کلی از تخقیقا گذشته می کند. در بخش سوم مولفه های الگوریتم ارائه شده، معیاری برای ارزیابی دقت و صحت، شیوه ارائه شده و گام های الگوریتم توضیح داده شده اند. در بخش 4 نتایج تجربی برای مسائل شاخص بیان شده اند. در بخش 5 نتیجه گیری ها و برخی نکات برای تحقیق بیشتر ارائه شده است.

دانلود اصل مقاله و ترجمه لینک اصلی

دانلود اصل مقاله و ترجمه لینک جایگزین

مطالب مشابه

کتاب های الکترونیکی-سری اول

  سری اول  کتاب های الکترونیکی آموزش فارسی نرم اف

کتاب آموزش شبیه سازی و مدل ساز

  مشخصات: مولف: دکتر نیکوبین (استاد دانشکده مکان

کتاب الکترونیکی سری سوم - آموز

      اي که برای دانلود قرار داده شده است براي

کتاب آموزش MATLAB

  نویسندگان: مهندس علی اکبر علمداری، مهندس نسرین

آموزش كاربردي مباحث پيشرفته با

آموزش كاربردي مباحث پيشرفته با Matlab            

کتاب های الکترونیک - روشهای طی

این کتاب شامل مباحث پیشرفته ریاضیات شامل روشهای

نوشتن دیدگاه


تصویر امنیتی
تصویر امنیتی جدید