بلاگ

پایگـاه اطلاعات علمی جهاد دانشگاهی

نایو بیز چیست؟


ارتباط قانون بیز با روش دسته‌بندی

قانون بیز چیست؟

یکی از قوانین مهم احتمال، قانون احتمال "بیز" است که توسط فردی به نام بیز[1] مطرح شد. قانون طبقه بندی کننده بیز، محتمل ترین کلاس را به یک داده اختصاص می‌دهند. به این معنا که با استفاده از قانون بیز می‌توان احتمال برچسب طبقه یک نمونه از داده‌ها را تعیین کرد.

قانون بیز:

قانون بیز

یعنی اگر B رخ داده باشد، چقدر احتمال دارد تا A نیز رخ دهد.

مزایای استفاده از نایو بیز 

Naïve Bayes یکی از معروف ترین روش‌های احتمالاتی است. یعنی احتمال تعلق یک نمونه به یک کلاس را تخمین می‌زند. میزان دقتNaïve Bayes قابل قبول است. Naïve Bayes سرعت بالایی دارد و روش سریعی برای داده‌های بزرگ است. روش بیز یک روش افزایشی است. به این معنا که اگر شما داده آموزشی داشتید و قبلا مدلی با آن طراحی کرده باشید ولی در حال حاضر داده‌های جدیدی به آن اضافه کنید، با استفاده از روش بیز فقط به آپدیت مدل جدید می‌پردازیم و نیازی به ساخت مدل جدید و آموزش آن از ابتدا نیست.

Naïve Bayes، مکانیسمی برای استفاده از اطلاعات را در داده‌های نمونه برای تخمین احتمال قبلی P(y| x) هر کلاس y با توجه به کلاس x ارائه می‌دهد. با استفاده از Naïve Bayes می توان به طبقه بندی یا سایر برنامه ها برای تصمیم گیری استفاده کرد.

قانون بیز

ارتباط قانون بیز با روش دسته‌بندی

نایو بیز ، یکی از روش‌های طبقه بندی است. Naïve Bayes، الگوریتم یادگیری ساده ای بر اساس قانون بیز است.

برای مثال Bبه دسته‌ای تعلق دارد که برچسب آن برای ما مشخص نیست. B  در اینجا مقاله‌ای است که سال انتشار، تعداد استنادات، نام نویسندگان و مجله آن مشخص است ولی حوزه موضوعی آن مشخص نیست و با استفاده از لیبل‌های مشخص آن می‌خواهیم حوزه موضوعی مقاله را پیش بینی کنیم. در اینجا A فرضیه ای است که در آن B به یک دسته تعلق دارد، فرضیه اینکه B به دسته A تعلق دارد.

در ادامه به بررسی فرمول می پردازیم.

P(A | B) یعنی احتمال اینکه مقاله B با توجه به لیبل‌هایی که دارد چقدر احتمال دارد در دسته موضوعی A قرار بگیرد. به( P(A | B احتمال پسین و به P(A) احتمال پیشین گفته می شود. احتمال پیشین به احتمال وقوع یک رخداد نسبت به کل گفته می شود. مثلا چون 20 درصد از مقالات متعلق به حوزه موضوعی علوم انسانی است، پس به احتمال 20 درصد این مقاله هم متعلق به همان حوزه موضوعی است. اما احتمال پیشین یعنی اینکه با توجه به ویژگی‌هایی که در مورد یک مقاله داریم مثل مجله، نام نویسنده و غیره به این نتیجه می‌رسیم که مقاله متعلق به حوزه موضوعی علوم انسانی نیست و ما پس از آنکه تمام ویژگی ها را دیدیم نظرمان نسبت به موضوع مقاله عوض می‌شود. (P(B | A نیز درست نمایی گفته می شود، در واقع احتمال این هست که برای یک فرضیه خاص، نمونه B مشاهده شود.

استفاده از قانون بیز در دسته بندی

برای استفاده از قانون بیز در دسته بندی باید احتمالات گوناگون را در نظر بگیریم. در مثال حوزه موضوعی مقاله، باید احتمال وقوع مقاله در حوزه‌های مختلف موضوعی را بدست بیاوریم، یعنی احتمال وقوع مقاله در همه حوزه‌های موضوعی محاسبه ‌شود. در اینجا، بر اساس برچسب‌های مقاله هم احتمال حوزه موضوعی آن را در دسته مهندسی و هم در علوم انسانی محاسبه می‌کنیم. اگر احتمال وقوع مقاله در دسته مهندسی بیشتر از دسته علوم انسانی بود، پس مقاله متعلق به دسته مهندسی است.

منبع

غلام نژاد, لطفیان و میرزائیان لرد کیوان. (2020). مقایسه روش های طبقه بندی، شبکه عصبی مصنوعی و رگرسیون چندمتغیره در برآورد بازیابی فلز از بلوک کانسنگ. نشریه مهندسی منابع معدنی, 5(2), 21-41.‎

 


 

 

 


[1] Bayes’ rule

پست های مرتبط

اینفوگرافی استفاده از روشهای یادگیری عمیق در تحلیل احساس

تاریخ: 1397/06/13

بازدید: 1202

1397

زمان مطالعه: 5 دقیقه دقیقه

اینفوگرافی

مدرس

@ins

بیشینه آنتروپی یک توزیع چقدر است؟

تاریخ: 1401/01/17

بازدید: 1411

1401

زمان مطالعه: 5 دقیقه دقیقه

مفهوم آنتروپی ، در مقاله ای که در سال 1948 توسط شانون مطرح شد .

مدرس

@ins

LSTM چیست؟

تاریخ: 1401/02/24

بازدید: 2288

1401

زمان مطالعه: 5 دقیقه

Long short-term memory (LSTM) ، یک شبکه عصبی مصنوعی است که در حوزه های موضوعی هوش مصنوعی و یادگیری عمیق به کار گرفته می شود.

مدرس

@ins

چند مجموعه یا خورجین

تاریخ: 1400/04/01

بازدید: 1708

1400

زمان مطالعه: 5 دقیقه دقیقه

آشنایی با ریاضی

مدرس

@ins

قضیه حد مرکزی

تاریخ: 1400/01/03

بازدید: 8172

1400

زمان مطالعه: 5 دقیقه دقیقه

Central limit theorem

مدرس

@ins

آشنایی با داده train و test

تاریخ: 1400/02/26

بازدید: 2882

1400

زمان مطالعه: 5 دقیقه دقیقه

کد پایتون برای داده های train و test

مدرس

@ins

چگونه در بیب اکسل ماتریس هم آیندی ایجاد کنیم؟

تاریخ: 1400/01/14

بازدید: 2743

1400

زمان مطالعه: 5 دقیقه دقیقه

نرم افزار بیب اکسل

مدرس

@ins

بررسی تحلیلی موضوعات "زبان فارسی" و "فردوسی" در پایگاه SID به مناسبت پاسداشت زبان فارسی و بزرگداشت حکیم ابوالقاسم فردوسی

تاریخ: 1400/02/25

بازدید: 4938

1400

زمان مطالعه: 5 دقیقه دقیقه

براساس گزارش مرکز اطلاعات علمی جهاددانشگاهی، مقاله‌های علمی فارسی پربازدید با کلیدواژه‌های "زبان فارسی" یا "فردوسی" در بازه هزارروزه معرفی شدند.

مدرس

@ins

ماتریس تحول چیست؟

تاریخ: 1399/12/23

بازدید: 2447

1399

زمان مطالعه: 5 دقیقه دقیقه

Transition Matrix

مدرس

@ins

ابزار تحلیل شخصیت بر اساس واژگان

تاریخ: 1399/10/24

بازدید: 2432

1399

زمان مطالعه: 5 دقیقه دقیقه

معرفی AnalyzeWords

مدرس

@ins