کلاسه بند بیز ساده

کلاسه بند چیست؟

کلاسه بند یک مدل یادگیری ماشین است که برای تشخیص اشیا مختلف براساس ویژگی های خاص مورد استفاده قرار می گیرد.

اصول دسته بندی  بیز ساده :

کلاسه بند  بیز ساده ( Naive Bayes ) یک مدل یادگیری ماشین است که معمولا برای کلاسه بندی بکار می رود. اصول این کلاسه بند براساس قضیه بیز است.

قضیه بیز :

فرمول تئوری بیز

با استفاده از قضیه بیز می توان احتمال وقوع  اتفاق A را در صورت پیش آمد B در نظر گرفت. در اینجا، B شواهد و A فرضیه است. فرض این است که فرضیات / مشخصه ها مستقل باشند. وجود یک ویژگی خاص بر دیگری تاثیرنمی گذارد. به همین خاطر ساده نامیده می شود.

مثال:

یک مثال برای درک بهتر ارائه می کنیم. مساله بازی گلف را در نظر بگیرید. داده ها به صورت زیر نشان داده می شوند.

مثال قضیه بیز

ما با توجه به ویژگی های روز، کلاسه بندی می کنیم که آیا روز برای بازی گلف مناسب است یا خیر. ستون ها نشان دهنده این ویژگی ها و سطرها نشان دهنده ورودی های منحصر به فرد هستند. اگر ردیف اول مجموعه داده را در نظر بگیریم، می توانیم مشاهده کنیم که اگر هوا بارانی باشد، دما گرم باشد، رطوبت بالا باشد و باد نوزد، برای گلف بازی کردن مناسب نیست. ما دو فرضیه را در اینجا مطرح می کنیم. اول این که همانطور که گفته شده، ما در نظر می گیریم که این فرضیات از هم مستقل هستند. یعنی، اگر دما گرم باشد، لزوماً به این معنی نیست که رطوبت بالا است. فرض دیگر این است که همه فرضیات روی نتیجه تاثیر یکسانی دارند. یعنی روز بادی در تصمیم گیری برای بازی گلف اهمیت بیشتری نسبت به سایر ویژگی ها ندارد.

با توجه به این مثال، قضیه بیز را می توان به صورت زیربازنویسی کرد :

فرمول بیز ساده

متغیر y متغیر کلاس (گلف) است، که با توجه به شرایط داده شده نشان می دهد که آیا بازی گلف مناسب است یا نه. متغیر x نشان دهنده پارامترها / مشخصه ها است.

x به صورت زیر داده می شود:

بیز ساده ورودی ها

در اینجا x_1 و x_2 تا x_n نمایانگر مشخصه ها هستند، به عنوان مثال آن ها را می توان با چشم انداز، دما، رطوبت و باد جایگزین کرد. با جایگزینی برای x و بسط دادن آن استفاده از قاعده زنجیری داریم،

بسط فرمول بیز ساده

حال می توانید مقادیر هر یک را با نگاه کردن به داده ها و جایگزین کردن آن ها در معادله به دست آورید. برای تمام ورودی های مجموعه داده، مخرج تغییر نمی کند، بلکه ثابت باقی می ماند. بنابراین، مخرج کسر را می توان حذف کرد و تناسب را می توان جایگزین آن کرد.

فرمول بیز ساده تناسب

در مورد مثال ما، متغیر کلاس (y) تنها دو نتیجه دارد: بله یا خیر. مواردی وجود دارند که کلاسه بندی می تواند چند متغیره باشد. بنابراین، باید کلاس y را با حداکثر احتمال پیدا کنیم.

فرمول بیز ساده متغیر کلاس

با استفاده از تابع فوق، می توانیم کلاس را با فرضیات داده شده به دست آوریم.

انواع کلاسه بند بیز ساده : 

 بیز ساده چند جمله ای :

این کلاسه بند عمدتاً برای مساله کلاسه بندی اسناد مورد استفاده قرار می گیرد، به عنوان مثال این که آیا یک سند متعلق به مقوله ورزش، سیاست، فناوری و غیره است. ویژگی ها / فرضیات مورد استفاده توسط کلاسه بند، فراوانی کلمات موجود در سند است.

بیز ساده برنولی :

این شبیه بیز ساده چند جمله ای است، اما فرضیات متغیرهای بولی هستند. پارامترهایی که ما از آن ها برای پیش بینی متغیر کلاس استفاده می کنیم فقط مقدار بله یا نه را می گیرند، برای مثال اگر یک کلمه در متن رخ داده یا نه.

بیز ساده گوسی :

وقتی فرضیات یک مقدار پیوسته را اشغال می کنند و گسسته نیستند، فرض می کنیم که این مقادیر از توزیع تک گوسی نمونه برداری می شوند.

توزیع گوسی
توزیع گاوسی (توزیع نرمال)

با توجه به تغییر مقادیر در مجموعه داده ها، فرمول برای احتمالات شرطی به شکل زیر تغییر می کند،

فرمول بیز ساده گوسی

نتیجه گیری :

استفاده از الگوریتم های بیز ساده عمدتاً در آنالیز احساس ، فیلتر اسپم ، سیستم های توصیه و غیره مورد استفاده قرارمی گیرند. کلاسه بند های بیز ساده سریع هستند و پیاده سازی آن ها آسان است، اما بزرگ ترین عیب آن ها این است که نیاز دارد فرضیات مستقل باشند. در اکثر موارد واقعی، فرضیات وابسته هستند که این مانع عملکرد کلاسه بند می شود.

بیشتر بخوانید :

منبع Towards Data Science

همچنین ببینید

پلاک خوان هوشمند چیست

پلاک خوان هوشمند چیست و چگونه عمل می کند + معرفی بهترین پلاک خوان ایران

پلاک خوان هوشمند دستگاهی است که از فناوری پیشرفته هوش مصنوعی (AI) و بینایی ماشین …

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *