یادگیری ماشین با نظارت
اجازه بدهید بحث یادگیری با نظارت را با مثالی شروع کنیم:
فرض کنید که یک سری تصاویر از حیوانات مختلف دارید و میخواهید آنها را از هم جدا کنید و در دستههای مختلف طبقهبندی کنید. اولین قدم این است که تمام حیوانات داخل تصاویر را به دستگاه معرفی کنید:
اگر یکی از آنها جثه کوچک با گوشهای دراز و پنجههای پهن داشته باشد برچسب آن خرگوش است. اگر یکی از آنها جثه بزرگ همراه با خرطوم بلند داشته باشد برچسب آن فیل است.پس از آموزش دادهها تصویر دیگری از تصاویر به دستگاه دادهاید و میخواهید آن را شناسایی کنید.
دستگاه با توجه به آموختههای خود از دادههای قبلی، هوشمندانه رفتار میکند، در قدم اول تصویر حیوان را با جثه و خصوصیات ظاهری آن دستهبندی میکند و تصویر را تایید میکند و در دسته خرگوش قرار میدهد. بنابراین دستگاه از دادههای آموزشی (تصاویر حیوانات مختلف) چیزها را میآموزد و سپس دانش به دست آمده را برای آزمایش دادههای جدید (تصویر جدید) به کار میگیرد. به این الگوریتم، الگوریتم یادگیری ماشین با نظارت گفته میشود.
پیش از این در مقاله انجام پروژه یادگیری ماشین در بیگ پرو1 خلاصهای از یادگیری ماشین تحت نظارت را گفتیم. در قسمتهای بعدی به صورت مفصل به معرفی یادگیری ماشین با نظارت و الگوریتم های آن و انجام پروژه یادگیری نظارت شده در بیگ پرو1 میپردازیم.
انجام پروژه یادگیری ماشین با نظارت در بیگ پرو1
امروزه در دانشگاهها یادگیری ماشین بحث داغی است و انجام پروژهها و پایاننامههای یادگیری ماشین گواه این موضوع است. یکی از الگوریتم های یادگیری ماشین که مهمترین آنها نیز میباشد، الگوریتم یادگیری ماشین با نظارت میباشد.
انجام پروژه های یادگیری ماشین با نظارت به دلیل استفاده از ابزارهای متعدد و نیاز به تخصص کافی جهت استفاده از این ابزارها امری طاقتفرسا و نیازمند صرف زمان و هزینه بسیاری است.
در حالی که تصور میشود که بهترین روش انجام پروژه یادگیری ماشین با نظارت، سپردن آن به یک متخصص است؛ شما به راحتی میتوانید بدون نیاز به وجود یک متخصص، پردازش خود را در بیگ پرو1 انجام دهید.
بیگ پرو1 این امکان را به کاربران میدهد که تنها با چند کلیک ساده و بدون داشتن تخصص کافی در استفاده از ابزارهای مورد نیاز، با ثبت پارامترهای لازم برای این الگوریتم ها بتوانند پروژههای یادگیری ماشین تحت نظارت خود را انجام دهند و دقیقترین و کاملترین نتیجه را دریافت کنند.
یادگیری ماشین با نظارت چیست؟
یادگیری ماشین با نظارت، زیرمجموعه یادگیری ماشین و هوش مصنوعی است. الگوریتم یادگیری ماشین تحت نظارت با استفاده از مجموعه دادههای دارای برچسب برای آموزش الگوریتمهایی برای طبقهبندی دادهها یا پیشبینی دقیق نتایج تعریف میشود. مدل یادگیری تحت نظارت تا زمانی که بتواند الگوهای اساسی و روابط بین دادههای ورودی و برچسبهای خروجی را تشخیص دهد، آموزش داده میشود و به آن امکان میدهد نتایج دقیق برچسبگذاری را هنگام ارائه دادههایی که قبلاً دیده نشده، ارائه دهد.
یادگیری با نظارت به سازمانها کمک می کند تا انواع مختلفی از مشکلات دنیای واقعی را در مقیاس مختلف حل کنند، مانند طبقهبندی هرزنامه در یک پوشه جداگانه از صندوق ورودی جیمیل. یادگیری با نظارت در طبقهبندی و مشکلات رگرسیون، از قبیل طبقهبندی هرزنامه در یک پوشه جداگانه از صندوق ورودی شما، تعیین اینکه یک مقاله خبری متعلق به کدام دسته است یا پیشبینی میزان فروش برای تاریخ معین آینده، مورد استفاده قرار میگیرد.
موفقیت، ساخت، مقیاسگذاری و بهکارگیری دقیق مدل های یادگیری ماشین با نظارت، به تیم و دانشمندان بسیار ماهر داده، زمان و مهارت فنی دارد.
به عنوان مثال، شما میخواهید یک ماشین را آموزش دهید تا به شما کمک کند پیش بینی کنید چه مدت طول میکشد تا شما از محل کار خود به خانه بروید؛ در اینجا، شما با ایجاد مجموعهای از داده های دارای برچسب شروع میکنید. این داده ها شامل: شرایط آب و هوایی، زمان روز، تعطیلات میشود.
تمام این جزئیات ورودی شما هستند، خروجی مدت زمانی است که برای بازگشت به خانه در آن روز خاص لازم بوده است. شما بهطور غریزی میدانید که اگر بیرون باران ببارد، رانندگی به خانه بیشتر طول میکشد. اما دستگاه به داده و آمار احتیاج دارد.
اولین چیزی که شما برای ایجاد نیاز دارید مجموعه آموزشی است، این مجموعه آموزشی شامل کل زمان رفت و آمد و فاکتورهای مربوطه مانند آب و هوا، زمان و غیره است. بر اساس این مجموعه آموزش، دستگاه شما ممکن است ببیند که رابطه مستقیمی بین میزان باران و زمانی که برای رسیدن به خانه خواهید داشت وجود دارد.
بنابراین، اطمینان مییابد که هرچه بیشتر باران ببارد، مدت طولانیتری رانندگی میکنید تا به خانه خود برگردید. همچنین ممکن است ارتباط بین زمان ترک کار و زمان حضور در جاده را مشاهده کند. هرچه به ساعت 6 بعد از ظهر نزدیکتر شوید مدت زمان بیشتری طول میکشد تا به خانه برسید. ممکن است دستگاه شما برخی از روابط با دادههای برچسب خورده شما را پیدا کند. این شروع مدل داده شما است. این تأثیر میگذارد که چگونه باران بر نحوه رانندگی افراد تأثیر میگذارد. همچنین مشاهده میشود که افراد بیشتری در یک ساعت خاص از روز به مسافرت میروند.
الگوریتم یادگیری تجمعی در یادگیری ماشین با نظارت
الگوریتم یادگیری تجمعی یک متا رویکرد کلی به ماشین لرنینگ است که با ترکیب پیشبینیهای چند مدل، عملکرد پیشبینی بهتری را دنبال میکند. روشهای یادگیری تجمعی زمانی محبوب و رایج است که بهترین عملکرد در یک پروژه مدلسازی پیشبینی کننده مهمترین نتیجه باشد.
اگرچه ظاهراً تعداد نامحدودی از مجموعههایی وجود دارد که میتوان برای مشکل مدلسازی پیشبینی ایجاد کرد، اما سه روش وجود دارد که بر حوزه یادگیری تجمعی مسلط است. به حدی که هر کدام به جای الگوریتم به خودی خود، زمینهای است که روشهای تخصصیتری را ایجاد کرده است. سه کلاس اصلی از روشهای یادگیری تجمعی عبارتند از: بگینگ ، بوستینگ و استاکینگ.
بگینگ (Bagging): این الگوریتم برای بهبود ثبات و دقت الگوریتم های یادگیری ماشین استفاده میشود.
بوستینگ (Boosting): روش بوستینگ یا تقویت یکی دیگر از الگوریتمهای یادگیری تجمعی است.
انباشته سازی (stacking): هدف آن پیش بینی بهترین خروجی است.
الگوریتم طبقه بندی در یادگیری ماشین با نظارت
یک الگوریتم طبقه بندی در یادگیری نظارت شده با هدف طبقهبندی ورودیها به تعداد مشخصی از دستهها یا کلاسها ، بر اساس دادههای برچسبی که روی آنها آموزش داده شده است، می باشد. طبقهبندی از یک الگوریتم برای تعیین دقیق دادههای آزمون به دستههای خاص استفاده میکند. این نهادهای خاص را در مجموعه داده شناسایی میکند و تلاش میکند تا نتیجهگیری کند که چگونه این موجودیتها باید برچسبگذاری یا تعریف شوند. به عبارت دیگر طبقهبندی به معنی گروهبندی خروجیها در داخل یک کلاس است. اگر الگوریتم سعی کند ورودی را در دو کلاس مجزا برچسبگذاری کند، آن را طبقهبندی باینری مینامند. انتخاب بین بیش از دو کلاس، به عنوان طبقهبندی چند طبقه نامیده میشود.
از الگوریتم های طبقه بندی میتوان برای طبقهبندیهای باینری مانند فیلترکردن ایمیل به هرزنامه یا غیر هرزنامه و طبقهبندی بازخورد مشتری به عنوان مثبت یا منفی استفاده کرد. تشخیص ویژگیها، مانند شناسایی حروف و اعداد دستنویس یا طبقهبندی داروها در بسیاری از دستههای مختلف، یکی دیگر از مشکلات طبقهبندی است که با یادگیری با نظارت حل میشود.
الگوریتم های طبقه بندی عبارتند از: طبقهبندی کنندههای خطی، الگوریتم ماشین بردار پشتیبان (SVM)، درختان تصمیم، K- نزدیکترین همسایه، جنگل تصادفی.
الگوریتم رگرسیون در یادگیری ماشین با نظارت
الگوریتم های رگرسیون برای مسائلی بکار میروند که هدف پیش بینی یک مقدار پیوسته کمی است. از کاربردهای الگوریتم های رگرسیون میتوان به پیش بینی تعداد کلیک کاربران در تبلیغات آنلاین، پیش بینی قیمت مسکن بر اساس ویژگیهایی که دارد و… اشاره کرد.
الگوریتم های یادگیری ماشین زیادی برای حل مسائل رگرسیون وجود دارد مانند:
Linear Regression, Neural Network , Support Vector Machines(SVM), Decision Tree, Random ForestK-Nearest Neighbors (KNN), Elastic Net, Stochastic gradient descent (SGD) , Ada Boost, Gradient Boosting, XGBoost
ماشین بردار پشتیبان هم در الگوریتم طبقه بندی و هم در الگوریتم رگرسیون مورد استفاده قرار میگیرد، هدف الگوریتم SVM ایجاد بهترین خط یا مرز تصمیمگیری است که بتواند فضای n بعدی را به کلاس تفکیک کند تا در آینده بتوان بهراحتی نقطه داده جدید را در دستهبندی صحیح قرار داد، به این مرز بهترین تصمیم، ابرصفحه گفته میشود.
کاربردهای یادگیری ماشین با نظارت
یادگیری ماشین با نظارت در دنیای امروز کاربردهای بسیاری دارد که چند نمونه از آنها عبارتند از:
BioInformatics:
این یکی از شناختهشدهترین برنامههای یادگیری با نظارت است زیرا بسیاری از ما در زندگی روزمره از آن استفاده میکنیم.BioInformatics ذخیره اطلاعات بیولوژیکی ما انسانها مانند اثر انگشت، بافت عنبیه، لاله گوش و غیره را برعهده دارد.
تلفنهای همراه امروزی قادر به یادگیری اطلاعات بیولوژیکی ما هستند و پس از آن میتوانند در تأیید امنیت سیستم مؤثر باشند. گوشیهای هوشمند مانند آیفون و Google Pixel قادر به شناسایی چهره هستند، در حالیکه OnePlus و Samsung قادر به تشخیص انگشت در صفحه نمایش هستند.
تشخیص گفتار:
این نوعی برنامه است که در آن شما الگوریتم مربوط به صدای خود را آموزش میدهید و میتواند شما را تشخیص دهد. شناختهشدهترین برنامههای دنیای واقعی دستیارهای مجازی مانند Google Assistant و Siri هستند که فقط با صدای شما از کلمه کلیدی باز میشوند.
Object-Recognition for Vision:
این نوع برنامهها هنگامی که شما نیاز به شناسایی چیزی دارید استفاده میشود. شما یک مجموعه داده عظیم دارید که از آن برای آموزش الگوریتم خود استفاده میکنید و میتواند برای شناسایی یک نمونه جدید استفاده شود. الگوریتمهای Raspberry Pi که اشیا را تشخیص میدهند مشهورترین نمونه هستند.
انجام پروژه یادگیری ماشین با نظارت با بیگ پرو1
امروزه به دلیل اهمیت ویژه یادگیری ماشین و الگوریتم های یادگیری ماشین مانند یادگیری با نظارت، پژوهشگران، صاحبان کسب و کار و دانشجویان به دنبال انجام پروژه خود به بهترین شکل ممکن هستند.
اما همانطور که در بالا هم گفته شد انجام پروژه یادگیری ماشین تحت نظارت توسط خود شخص به دلیل اینکه به ابزارهای زیادی نیاز است و استفاده از آنها نیازمند داشتن مهارت کافی است، امری سخت و زمانبر است.
سامانه بیگ پرو1 تمام نیازهای کاربران در حوزه یادگیری ماشین را بهخوبی شناسایی کرده و به همین دلیل بسیاری از الگوریتم های یادگیری ماشین با نظارت را در سیستم خود پیادهسازی کرده است تا پاسخگوی نیازهای کاربران به صورت دقیق و جامع باشد.
برای انجام پروژه یادگیری ماشین با نظارت ، کاربران میتوانند با ورود به داشبورد کاربری خود و انتخاب الگوریتم مورد نظر، پارامترهای لازم را وارد کرده و با سپردن پروژه خود به سامانه بیگ پرو1 منتظر نتیجه پروژه خود در کوتاهترین زمان ممکن باشند.
برای شروع انجام پروژه یادگیری با نظارت خود، روی دکمه زیر کلیک کنید: