انجام پروژه یادگیری ماشین خودکار در بیگ پرو1

به‌راحتی و تنها با چند کلیک ساده

automl , یادگیری خودکار
یادگیری خودکار , یادگیری ماشین خودکار , اتو ام ال

اجازه دهید تعریف یادگیری ماشین خودکار را با ذکر یک مثال شروع کنیم:

“من یک پروژه یادگیری ماشین دارم، اما وقت کافی برای انجام آن را ندارم”. این جمله‌ایست که امروزه از اغلب افراد، در بسیاری از صنعت‌ها، کسب و کار‌ها و خصوصا دانشجویان و محققین می‌شنویم.

همینطور انجام یک پروژه یادگیری ماشین علاوه بر صرف زمان، نیازمند تخصص می‌باشد. به همین دلیل انجام آن برای افراد غیر متخصص، کار راحتی به نظر نمی‌آید.

یادگیری ماشین خودکار، علاوه بر اینکه امکان بهره مندی از بهترین مدل‌ و تکنیک‌ یادگیری ماشین متناسب با داده و نیاز خود، بدون نیاز به یادگیری تخصصی الگوریتم‌های یادگیری ماشین را فراهم می‌کند؛ مزایای دیگری مانند تولید راه‌حل‌های ساده‌تر، ایجاد سریع‌تر این راه‌حل‌ها و ایجاد مدل‌هایی که اغلب از مدل‌هایی که به صورت دستی طراحی شده‌اند، بهترند، را نیز ارائه می‌دهد.

∇ یادگیری ماشین خودکار در بیگ پرو1

“دیگر نیازی به آزمایش دستی صدها یا حتی هزاران ترکیب ابر پارامتر برای یافتن بهترین مدل نیست.”

پیدا کردن و استفاده از ابزار‌های مناسب برای انجام یادگیری اتوماتیک خود به تنهایی حائز اهمیت است. ابزار انجام یادگیری خودکار بیگ پرو1، یکی از ابزار‌های قوی و پر کاربرد در یادگیری ماشین می‌باشد. بخش یادگیری خودکار در بیگ پرو1 به گونه‌ای طراحی شده است که به ساده‌ترین شکل ممکن، بدون تنظیم هیچگونه پارامتری، و تنها با مشخص کردن ستون هدف در مجموعه داده ها، به صورت کاملا خودکار، بهترین الگوریتم را انتخاب کرده و پس از انجام پردازش‌ها، نتایج و مشخصات مدل را به کاربر نمایش می‌دهد. از یادگیری خودکار در بیگ پرو1 می‌توان برای حل مسائل Classification، Regression استفاده کرد.

 

در بیگ پرو1 الگوریتم‌های با نظارت زیر در یادگیری ماشین خودکار مورد بررسی و استفاده قرار می‌گیرند:

الگوریتم های طبقه بندی(Classification):

Adaboost NB, Bernoulli-nb, Decision Tree, Extre Trees, Gaussian NB, Gradient Boosting, K Nearest Neighbors, LDA, Liblinear SVC, Libsvm SVC, MLP, Multinomial, Passive Aggressive, QDA, Random Forest, SGD

الگوریتم های رگرسیون(Regression):

Adaboost NB, Ard Regression, Extre Trees, Gaussian Process, Gradient Boosting, K Nearest Neighbors, Liblinear SVC, Libsvm SVC, MLP, Random Forest, SGD

این الگوریتم‌ها به صورت اتوماتیک با بهترین پارامترهای ممکن فراخوانی و اجرا می‌شوند و به صورت همزمان مورد ارزیابی و مقایسه قرار می‌گیرند.

هرکدام از الگوریتم‌ها که بهترین خروجی به همراه بهترین نتیجه را به دست آورد به عنوان خروجی یادگیری ماشین خودکار انتخاب و به همراه پارامترهای استفاده شده به کاربر اعلام می‌گردد.

همان گونه که بیان شد، در بیگ پرو1 کاربر تنها با تنظیم کردن داده‌های اولیه و سپردن مراحل به ابزار یادگیری خودکار، به راحتی و بدون نیاز به مهارت خاصی در زمینه یادگیری ماشین، به خروجی‌های مورد انتظار خود دست خواهد یافت.

MODELING1

استفاده از ابزارهای یادگیری ماشین بدون دانش فنی و تخصصی

icon-01

انجام عملیات مدلسازی به صورت کاملا خودکار

دقت مناسب مدل‌های ساخته شده

رسیدن به نتیجه در کمترین زمان 

∇ یادگیری ماشین خودکار چیست؟

یادگیری ماشین اتوماتیک، که به آن [AutoML] Auto Machine Learning نیز گفته می‌شود، فرایند اتوماتیک کردن مراحل تنظیم و  آموزش مدل ها در یادگیری ماشین است. اگر یادگیری ماشین و هر آنچه برای ساخت مدل یادگیری ماشین مورد نیاز است را در نظر بگیریم، AutoML تمام فرآیند انتخاب بهترین مدل، تنظیم پارامترهای آن و آموزش و ارائه نتایج حاصل از مدلسازی را در بر میگیرد.

∇ AutoML چگونه کار می کند؟

این بخش به گونه‌ای طراحی شده است که برای حل یک مسئله در حوزه‌ یادگیری با نظارت کاربرد دارد، برای حل یک مسئله هیچگونه تنظیماتی توسط کاربر انجام نمی‌شود و به صورت خودکار مدل‌های مختلف با بهترین پارامترها اجرا می‌شوند، در نهایت خروجی بهترین مدل به همراه پارامترهای بکار رفته در آن به کاربر نمایش داده می‌شود و نیازی نیست که کاربر با پیچیدگی‌های انتخاب مدل‌ها و تنظیم پارامترهای آنها سروکار داشته باشد.

نوع مسئله به نوع ستون هدفی که کاربر انتخاب کرده بستگی دارد و اگر ستون هدف کیفی بود نوع مسأله دسته‌بندی یاclassification  و اگر ستون هدف کمی بود مسئله از نوع Regression است که این مورد نیز به صورت خودکار تشخیص داده می شود. حال با توجه به نوع مسئله الگوریتم و معیار‌های ارزیابی مناسب برای پردازش داده انتخاب می‌شود. تقسیم بندی داده های آموزشی و آزمایش به این صورت است که 70 درصد داده‌ها به عنوان داده آموزشی و 30 درصد داده‌ها به عنوان داده آزمایش در نظر گرفته می‌شوند.

در نهایت بهترین مدل انتخاب شده و نتایج (بر اساس معیار‌های مختلف) و مشخصات مدل به کاربر نمایش داده می‌شوند.

AutoML مدل‌ها و پارامترهای مختلف را تست می‌کند و در پایان مدلی انتخاب می‌شود که بر اساس معیار‌هایی که برای آن نوع مسأله وجود دارد (مثلا معیار دقت یا accuracy برای مسائل دسته بندی) بهترین عملکرد را داشته است. این روند پس از رسیدن به معیارهای مورد انتظار برای خروج، متوقف خواهد شد.

در کل الگوریتم‌های مختلفی برای کاهش ابعاد مختلف و همینطور بهترین روش برای تمامی مجموعه‌های داده وجود ندارد. اما در داشبورد بیگ پرو1 کاهش ابعاد به طور خودکار و با الگوریتم‌های از پیش تعیین شده انجام می‌پذیرد.

 

لینک کوتاه شده منبع:yun.ir/vuerm4