کاظم تقندیکی
استاد دانشگاه فني و حرفه اي و مجری پروژه های علم داده (داده کاوی، یادگیری ماشین، پردازش زبان طبیعی و ...)

بررسی انواع الگوریتم های یادگیری ماشین (Machine Learning)

یادگیری ماشین | Machine Learning زیرمجموعه ای از هوش مصنوعی است که به ماشین ها اجازه می دهد به طور خودکار از داده های گذشته یاد بگیرد و عملکرد ماشین را از تجربیات گذشته بهبود بخشد و پیش بینی کند. یادگیری ماشین | ماشین لرنینگ شامل مجموعه ای از الگوریتم هایی است که بر روی حجم عظیمی از داده ها به کار گرفته می شود. در واقع داده ها برای آموزش اولیه به این الگوریتم های یادگیری ماشین | ML داده می شود و بر اساس آموزش صورت گرفته شده یک مدل به دست می آید، حال از مدل به دست آمده برای عملیات مختلف دسته بندی، خوشه بندی، استخراج قواعد انجمنی، پیش بینی و ... استفاده می شود.

دوره های شبکه، برنامه نویسی، مجازی سازی، امنیت، نفوذ و ... با برترین های ایران

شکل : انواع الگوریتم های یادگیری ماشین | ماشین لرنینگ

انواع الگوریتم های یادگیری ماشین

در دوره آموزشی جامع علم داده مدرس کاظم تقندیکی تمام A-Z علم داده (یادگیری ماشین، داده کاوی) را به شکل کاملاً عملی و با زبانی ساده به شما آموزش می دهد

از طریق دوره های آموزشی زیر به الگوریتم های یادگیری ماشین مسلط شده و تبدیل دانشمند داده | Data scientist شوید:

انواع یادگیری ماشین | Machine Learning

الگوریتم‌های ML به حل مسائل مختلف تجاری در قالب عملیات رگرسیون، طبقه‌بندی، پیش‌بینی، خوشه‌بندی استفاده می شود. ماشین لرنینگ بر اساس روش ها و نوع یادگیری، عمدتاً به چهار نوع تقسیم می شود:

  • یادگیری ماشینی با نظارت | Supervised Machine Learning
  • یادگیری ماشینی بدون نظارت | Unsupervised Machine Learning
  • یادگیری ماشین نیمه نظارت شده | Semi-Supervised Machine Learning
  • یادگیری تقویتی | Reinforcement Learning

انواع یادگیری ماشین | ML

در ادامه این مقاله، شرح مفصلی از انواع یادگیری ماشین به همراه الگوریتم‌های مربوطه ارائه خواهیم کرد:

1. یادگیری ماشینی با نظارت | Supervised Machine Learning

همانطور که از نام این الگوریتم پیداست، یادگیری ماشین با نظارت، بر اساس مشاهدات انجام شده کار می کند، این بدان معناست که، کاربر ماشین‌ها را بر روی مجموعه داده‌هایی | دیتاست هایی که دارای "برچسب‌"هستند، آموزش می‌دهد و بر اساس آموزش صورت گرفته، ماشین خروجی یا رویداد آینده را پیش‌بینی می‌کند. کلمه "برچسب" یا لیبل مشخص کننده این است که مجموعه ای از داده ها و سوابق وجود دارد (ورودی ها) که قبلا یک تصمیم درست (خروجی صحیح) برای آن ها در دیتاست ثبت شده است که بسیار با ارزش هستند. حال می توان ماشین را با ورودی ها و خروجی های موجود در دیتاست آموزش دهیم و سپس از ماشین بخواهیم با توجه به آموزشی که دیده است، خروجی صحیح را برای ورودی های جدید پیش بینی کند.

به عنوان مثال، فرض کنید یک مجموعه ای از داده های ورودی با تصاویر گربه و سگ داریم. بنابراین ما ابتدا ماشین را با توجه به مختصات آماری و سایر ویژگی های تصاویر مجموعه داده موجود مانند شکل و اندازه دم گربه و سگ، شکل چشم، رنگ، قد (سگ ها بزرگتر، گربه ها کوچکتر) و غیره آموزش می دهیم. پس از اتمام آموزش، می توانیم یک تصویر را به سیستم دهیم و از سیستم یا ماشین بخواهیم نوع تصویر ( گربه یا سگ) را شناسایی و خروجی را پیش بینی کند. لذا از آنجا که دستگاه به خوبی از داده های سالم و اولیه آموزش دیده است، می تواند برای تصاویر جدید تمام ویژگی های تصاویر مانند اندازه، شکل، رنگ، چشم، گوش، دم و غیره را بررسی می کند و گربه یا سگ بودن تصویر را تشخیص دهد. این فرآیندی است که در آن ماشین اشیاء را در یادگیری نظارت شده | Supervised Machine Learning شناسایی می کند.

هدف اصلی روش یادگیری با نظارت | Supervised Machine Learning، ترسیم یا نگاشت متغیر ورودی (x) به متغیر خروجی (y) است. برخی از کاربردهای دنیای واقعی یادگیری با نظارت | Supervised Machine Learning عبارتند از ارزیابی ریسک، کشف تقلب، فیلتر کردن هرزنامه و غیره.

در دوره آموزشی جامع علم داده (یادگیری ماشین، داده کاوی و ...) مدرس کاظم تقندیکی تمام A-Z علم داده را به شکل کاملاً عملی و با زبانی ساده به شما آموزش می دهد.

از طریق دوره های آموزشی زیر به الگوریتم های یادگیری ماشین مسلط شده و تبدیل دانشمند داده | Data scientist شوید:

انواع یادگیری ماشین با نظارت | Supervised Machine Learning

یادگیری ماشین نظارت شده را می توان به دو گروه تقسیم کرد:

  • دسته بندی | Classification
  • رگرسیون | Regression

الف) دسته بندی | Classification

الگوریتم های دسته بندی | Classification برای حل مسائل دسته بندی استفاده می شود که در آن متغیر خروجی یا برچسب دارای مقادیر بله یا خیر، مرد یا زن، قرمز یا آبی و غیره می باشد. الگوریتم‌های دسته بندی، دسته‌های موجود در مجموعه داده‌ها را تشخیص و پیش‌بینی می‌کنند. برخی از نمونه های عملی الگوریتم های دسته بندی عبارتند از: تشخیص هرزنامه، فیلتر ایمیل و غیره.

از جمله الگوریتم های دسته بندی رایج عبارتند از:

  • الگوریتم جنگل تصادفی | Random Forest Algorithm
  • الگوریتم درخت تصمیم | Decision Tree Algorithm
  • الگوریتم رگرسیون لجستیک | Logistic Regression Algorithm
  • الگوریتم ماشین بردار پشتیبان | Support Vector Machine Algorithm

ب) رگرسیون | Regression

الگوریتم های رگرسیون | Regression برای حل مسائل رگرسیونی که در آن رابطه خطی | Linear بین متغیرهای ورودی و خروجی وجود دارد استفاده می شود. این الگوریتم ها برای پیش بینی متغیرهای خروجی پیوسته مانند پیش بینی سهام، پیش بینی آب و هوا و غیره استفاده می شوند.

برخی از الگوریتم های رگرسیون رایج در زیر فهرست شده اند:

  • الگوریتم رگرسیون خطی ساده | Simple Linear Regression Algorithm
  • الگوریتم رگرسیون چند متغیره | Multivariate Regression Algorithm
  • الگوریتم درخت تصمیم | Decision Tree Algorithm

مزایا و معایب الگوریتم های یادگیری با نظارت

مزایا:

  • الگوریتم های یادگیری بانظارت در پیش بینی خروجی بر اساس تجربیات گذشته بسیار مفید هستند.

معایب:

  • الگوریتم های یادگیری بانظارت | Supervised Learning قادر به حل وظایف پیچیده نیستند.
  • زمانی که داده های تست با داده های آموزشی متفاوت است، احتمال دارد خروجی (Y) را اشتباه پیش بینی کنند.
  • آموزش الگوریتم های یادگیری بانظارت به زمان محاسباتی زیادی نیاز دارد.

کاربردهای یادگیری با نظارت | Supervised Learning

برخی از کاربردهای رایج یادگیری با نظارت در زیر ذکر شده است:

  • تقسیم بندی تصویر:

الگوریتم های یادگیری نظارت شده در تقسیم بندی تصویر استفاده می شود. در این فرآیند، یک دسته بندی تصویر بر روی داده های تصویری مختلف با برچسب های از پیش تعریف شده انجام می شود.

  • تشخیص گفتار:

الگوریتم های یادگیری نظارت شده نیز در تشخیص گفتار استفاده می شود. الگوریتم با داده های صوتی آموزش داده شده است و شناسایی های مختلفی را می توان با استفاده از آن انجام داد، مانند رمزهای عبور صوتی، دستورات صوتی و غیره.

در دوره آموزشی جامع علم داده (یادگیری ماشین، داده کاوی و ...) مدرس کاظم تقندیکی تمام A-Z علم داده را به شکل کاملاً عملی و با زبانی ساده به شما آموزش می دهد.

از طریق دوره های آموزشی زیر به الگوریتم های یادگیری ماشین مسلط شده و تبدیل دانشمند داده | Data scientist شوید:

2. یادگیری ماشین بدون نظارت | Unsupervised Machine Learning

یادگیری بدون نظارت | Unsupervised Machine Learning

یادگیری بدون نظارت | Unsupervised Machine Learning با تکنیک یادگیری با نظارت | Supervised Machine Learning متفاوت است. همانطور که از نام الگوریتم یادگیری بدون نظارت پیداست، نیازی به نظارت نیست. این بدان معناست که در یادگیری ماشین بدون نظارت، ماشین با استفاده از مجموعه داده بدون برچسب آموزش داده می شود و ماشین خروجی را بدون هیچ نظارتی پیش بینی می کند. در یادگیری بدون نظارت، مدل ها با داده هایی که نه طبقه بندی شده اند و نه برچسب گذاری شده، آموزش داده می شوند و مدل بدون هیچ نظارتی بر روی آن داده ها عمل می کند. هدف اصلی الگوریتم یادگیری بدون نظارت، گروه بندی یا دسته بندی مجموعه داده های مرتب نشده بر اساس شباهت ها، الگوها و تفاوت ها است. به ماشین ها دستور داده می شود که الگوهای پنهان را از مجموعه داده ورودی پیدا کنند.

بیایید برای درک بهتر آن مثالی بزنیم. فرض کنید سبدی از تصاویر میوه وجود دارد و آن را در مدل یادگیری ماشین بدون نظارت وارد می کنیم. تصاویر کاملاً برای مدل ناشناخته هستند و وظیفه دستگاه یا مدل یافتن الگوها، شباهت ها و در نهایت دسته بندی یا خوشه بندی اشیا می باشد.

انواع الگوریتم های یادگیری ماشین بدون نظارت

یادگیری بدون نظارت را می توان به دسته های زیر تقسیم بندی کرد:

  • خوشه بندی | Clustering
  • قواعد انجمنی | Association

الف : خوشه بندی | Clustering

تکنیک خوشه بندی | کلاسترینگ زمانی استفاده می شود که بخواهیم گروه های ذاتی را از دل داده ها پیدا کنیم. این روشی است برای گروه بندی اشیاء در یک خوشه، به طوری که اشیاء با بیشترین شباهت در یک خوشه | کلاستر باقی می مانند و این اشیاء شباهت کمتری با اشیاء سایر خوشه ها دارند. نمونه ای از الگوریتم خوشه بندی، گروه بندی مشتریان بر اساس رفتار خرید آنهاست.

برخی از الگوریتم های خوشه بندی | کلاسترینگ محبوب در زیر آورده شده است:

  • الگوریتم خوشه بندی K-Means
  • الگوریتم خوشه بندی تغییر میانگین
  • الگوریتم خوشه بندی DBSCAN
  • الگوریتم خوشه بندی سلسه مراتبی | Hierarchical Clustering

ب : استخراج قواعد انجمنی

یادگیری قوانین انجمنی یک تکنیک یادگیری بدون نظارت است که روابط جالبی را بین متغیرها یا فیلدها در یک مجموعه داده بزرگ | دیتاست پیدا می کند. هدف اصلی این الگوریتم یادگیری ماشین، یافتن وابستگی یک آیتم داده به آیتم داده دیگر و ترسیم آن متغیرها بر اساس آن است تا بتواند حداکثر سود را ایجاد کند. این الگوریتم عمدتاً در تحلیل سبد بازار کاربرد دارد.

برخی از الگوریتم‌های رایج یادگیری قوانین انجمنی عبارتند از  Apriori Algorithm، Eclat، FP-growth.

مزایا و معایب الگوریتم یادگیری بدون نظارت

مزیت - فایده - سود - منفعت:

  • این الگوریتم ها را می توان برای کارهای پیچیده در مقایسه با موارد الگوریتم های با نظارت استفاده کرد زیرا این الگوریتم ها روی مجموعه داده بدون برچسب کار می کنند.
  • الگوریتم های بدون نظارت برای کارهای مختلف به راحتی می شوند زیرا دریافت مجموعه داده بدون برچسب در مقایسه با مجموعه داده برچسب دار آسان تر است.

معایب:

  • خروجی یک الگوریتم بدون نظارت می تواند دقت کمتری داشته باشد زیرا مجموعه داده اولیه برچسب گذاری نشده است.

کاربردهای یادگیری بدون نظارت

  • تجزیه و تحلیل شبکه:

یادگیری بدون نظارت برای شناسایی سرقت ادبی و حق چاپ در تجزیه و تحلیل شبکه اسنادی داده های متنی برای مقالات علمی استفاده می شود.

  • سیستم های توصیه گر:

سیستم های توصیه گر به طور گسترده از تکنیک های یادگیری بدون نظارت برای استفاده می کنند.

  • تشخیص ناهنجاری یا آنومالی:

تشخیص ناهنجاری یک کاربرد محبوب یادگیری بدون نظارت است که می تواند نقاط داده غیرمعمول را در مجموعه داده شناسایی کند. برای کشف تراکنش های تقلبی استفاده می شود.

در دوره آموزشی جامع علم داده (یادگیری ماشین، داده کاوی و ...) مدرس کاظم تقندیکی تمام A-Z علم داده را به شکل کاملاً عملی و با زبانی ساده به شما آموزش می دهد.

از طریق دوره های آموزشی زیر به الگوریتم های یادگیری ماشین مسلط شده و تبدیل دانشمند داده | Data scientist شوید:

3. یادگیری نیمه نظارتی | Semi-Supervised Learning

یادگیری نیمه نظارت شده بین یادگیری ماشین نظارت شده و بدون نظارت قرار دارد. این نشان‌دهنده وجود یک زمینه میانی بین الگوریتم‌های تحت نظارت (با داده‌های آموزشی برچسب‌گذاری‌شده) و یادگیری بدون نظارت (بدون داده‌های آموزشی برچسب‌دار) است و از ترکیب مجموعه داده‌های برچسب‌دار و بدون برچسب در طول دوره آموزشی استفاده می‌کند. اگرچه یادگیری نیمه نظارت شده حد وسط بین یادگیری نظارت شده و بدون نظارت است و بر روی داده هایی که از چند برچسب تشکیل شده است عمل می کند، اما عمدتاً داده ها در این نوع الگوریتم ها بدون برچسب هستند چرا که دسترسی به داده های بدون برچسب بسیار راحت تر از مجموعه داده های دارای برچسب می باشد.

مزایا و معایب یادگیری نیمه نظارتی

مزیت - فایده - سود - منفعت:

  • درک الگوریتم ساده و آسان است.
  • کارایی بالایی دارد.
  • برای حل مشکلات الگوریتم های یادگیری تحت نظارت و بدون نظارت استفاده می شود.

معایب:

  • ما نمی توانیم این الگوریتم ها را برای داده های سطح شبکه اعمال کنیم.
  • دقت پایین است.

4. یادگیری تقویتی | Reinforcement Learning

یادگیری تقویتی بر اساس یک فرآیند مبتنی بر بازخورد کار می کند، که در آن یک عامل هوش مصنوعی (یک جزء نرم افزاری) به طور خودکار محیط اطراف خود را درک و کاوش کرده و اقدامات لازم را انجام می دهد، همچنین سعی می کند با توجه به اقدامات انجام شده تجربیات و عملکرد خود کم کم بهبود دهد. عامل برای هر عمل خوب و مثبتی که انجام می دهد، پاداش می گیرد و برای هر عمل بد مجازات می شود. از این رو هدف عامل یادگیری تقویتی، به حداکثر رساندن پاداش است تا تجربیات و عملکرد خود را با توجه به بازخوردهای مثبت بهبود دهد. در یادگیری تقویتی، هیچ داده برچسب‌گذاری شده‌ای مانند یادگیری تحت نظارت وجود ندارد و عوامل فقط از تجربیات خود یاد می‌گیرند. فرآیند کاری الگوریتم تقویتی، شبیه به فرایند رشد یک انسان است. مانند کودکی که از طریق تجربیات زندگی روزمره خود چیزهای مختلفی را یاد می گیرد. یادگیری تقویتی به دلیل نحوه کار خود در زمینه های مختلفی مانند نظریه بازی، تحقیق عملیات، نظریه اطلاعات، سیستم های چند عاملی به کار گرفته می شود.

در دوره آموزشی جامع علم داده (یادگیری ماشین، داده کاوی و ...) مدرس کاظم تقندیکی تمام A-Z علم داده را به شکل کاملاً عملی و با زبانی ساده به شما آموزش می دهد.

از طریق دوره های آموزشی زیر به الگوریتم های یادگیری ماشین مسلط شده و تبدیل دانشمند داده | Data scientist شوید:



کاظم تقندیکی
کاظم تقندیکی

استاد دانشگاه فني و حرفه اي و مجری پروژه های علم داده (داده کاوی، یادگیری ماشین، پردازش زبان طبیعی و ...)

استاد دانشگاه فنی و حرفه ای، فعال در حوزه های علم داده، يادگيري ماشين، داده کاوی، بازیابی اطلاعات، متن کاوی و پایگاه داده ها با بیش از صد ساعت تدریس آنلاین و صدها پروژه موفق در حوزه علم داده، برای آموزش يا سفارش انجام پروژه با شماره 09157202653 (واتس اپ، تلگرام و تماس تلفنی) و ایمیل taghandiky@gmail.com در تماس باشید.

نظرات