بلاگ

پایگـاه اطلاعات علمی جهاد دانشگاهی

نایو بیز چیست؟


یکی از قوانین مهم احتمال، قانون احتمال "بیز" است که توسط فردی به نام بیز مطرح شد.

قانون بیز چیست؟

یکی از قوانین مهم احتمال، قانون احتمال "بیز" است که توسط فردی به نام بیز[1] مطرح شد. قانون طبقه بندی کننده بیز، محتمل ترین کلاس را به یک داده اختصاص می‌دهند. به این معنا که با استفاده از قانون بیز می‌توان احتمال برچسب طبقه یک نمونه از داده‌ها را تعیین کرد.

قانون بیز:

قانون بیز

یعنی اگر B رخ داده باشد، چقدر احتمال دارد تا A نیز رخ دهد.

مزایای استفاده از نایو بیز 

Naïve Bayes یکی از معروف ترین روش‌های احتمالاتی است. یعنی احتمال تعلق یک نمونه به یک کلاس را تخمین می‌زند. میزان دقتNaïve Bayes قابل قبول است. Naïve Bayes سرعت بالایی دارد و روش سریعی برای داده‌های بزرگ است. روش بیز یک روش افزایشی است. به این معنا که اگر شما داده آموزشی داشتید و قبلا مدلی با آن طراحی کرده باشید ولی در حال حاضر داده‌های جدیدی به آن اضافه کنید، با استفاده از روش بیز فقط به آپدیت مدل جدید می‌پردازیم و نیازی به ساخت مدل جدید و آموزش آن از ابتدا نیست.

Naïve Bayes، مکانیسمی برای استفاده از اطلاعات را در داده‌های نمونه برای تخمین احتمال قبلی P(y| x) هر کلاس y با توجه به کلاس x ارائه می‌دهد. با استفاده از Naïve Bayes می توان به طبقه بندی یا سایر برنامه ها برای تصمیم گیری استفاده کرد.

قانون بیز

ارتباط قانون بیز با روش دسته‌بندی

نایو بیز ، یکی از روش‌های طبقه بندی است. Naïve Bayes، الگوریتم یادگیری ساده ای بر اساس قانون بیز است.

برای مثال Bبه دسته‌ای تعلق دارد که برچسب آن برای ما مشخص نیست. B  در اینجا مقاله‌ای است که سال انتشار، تعداد استنادات، نام نویسندگان و مجله آن مشخص است ولی حوزه موضوعی آن مشخص نیست و با استفاده از لیبل‌های مشخص آن می‌خواهیم حوزه موضوعی مقاله را پیش بینی کنیم. در اینجا A فرضیه ای است که در آن B به یک دسته تعلق دارد، فرضیه اینکه B به دسته A تعلق دارد.

در ادامه به بررسی فرمول می پردازیم.

P(A | B) یعنی احتمال اینکه مقاله B با توجه به لیبل‌هایی که دارد چقدر احتمال دارد در دسته موضوعی A قرار بگیرد. به( P(A | B احتمال پسین و به P(A) احتمال پیشین گفته می شود. احتمال پیشین به احتمال وقوع یک رخداد نسبت به کل گفته می شود. مثلا چون 20 درصد از مقالات متعلق به حوزه موضوعی علوم انسانی است، پس به احتمال 20 درصد این مقاله هم متعلق به همان حوزه موضوعی است. اما احتمال پیشین یعنی اینکه با توجه به ویژگی‌هایی که در مورد یک مقاله داریم مثل مجله، نام نویسنده و غیره به این نتیجه می‌رسیم که مقاله متعلق به حوزه موضوعی علوم انسانی نیست و ما پس از آنکه تمام ویژگی ها را دیدیم نظرمان نسبت به موضوع مقاله عوض می‌شود. (P(B | A نیز درست نمایی گفته می شود، در واقع احتمال این هست که برای یک فرضیه خاص، نمونه B مشاهده شود.

استفاده از قانون بیز در دسته بندی

برای استفاده از قانون بیز در دسته بندی باید احتمالات گوناگون را در نظر بگیریم. در مثال حوزه موضوعی مقاله، باید احتمال وقوع مقاله در حوزه‌های مختلف موضوعی را بدست بیاوریم، یعنی احتمال وقوع مقاله در همه حوزه‌های موضوعی محاسبه ‌شود. در اینجا، بر اساس برچسب‌های مقاله هم احتمال حوزه موضوعی آن را در دسته مهندسی و هم در علوم انسانی محاسبه می‌کنیم. اگر احتمال وقوع مقاله در دسته مهندسی بیشتر از دسته علوم انسانی بود، پس مقاله متعلق به دسته مهندسی است.

منبع

غلام نژاد, لطفیان و میرزائیان لرد کیوان. (2020). مقایسه روش های طبقه بندی، شبکه عصبی مصنوعی و رگرسیون چندمتغیره در برآورد بازیابی فلز از بلوک کانسنگ. نشریه مهندسی منابع معدنی, 5(2), 21-41.‎

 


 

 

 


[1] Bayes’ rule

پست های مرتبط

زیرشمولی و فراشملوی

تاریخ: 1400/01/16

بازدید: 686

1400

زمان مطالعه: 5 دقیقه دقیقه

مدرس

@ins

جستجوی حریصانه

تاریخ: 1400/01/12

بازدید: 1382

1400

زمان مطالعه: 5 دقیقه دقیقه

مدرس

@ins

قضیه حد مرکزی

تاریخ: 1400/01/03

بازدید: 5623

1400

زمان مطالعه: 5 دقیقه دقیقه

Central limit theorem

مدرس

@ins

آشنایی با داده train و test

تاریخ: 1400/02/26

بازدید: 1901

1400

زمان مطالعه: 5 دقیقه دقیقه

کد پایتون برای داده های train و test

مدرس

@ins

بررسی تحلیلی موضوعات "زبان فارسی" و "فردوسی" در پایگاه SID به مناسبت پاسداشت زبان فارسی و بزرگداشت حکیم ابوالقاسم فردوسی

تاریخ: 1400/02/25

بازدید: 3593

1400

زمان مطالعه: 5 دقیقه دقیقه

براساس گزارش مرکز اطلاعات علمی جهاددانشگاهی، مقاله‌های علمی فارسی پربازدید با کلیدواژه‌های "زبان فارسی" یا "فردوسی" در بازه هزارروزه معرفی شدند.

مدرس

@ins

ماتریس تحول چیست؟

تاریخ: 1399/12/23

بازدید: 1571

1399

زمان مطالعه: 5 دقیقه دقیقه

Transition Matrix

مدرس

@ins

بیشینه آنتروپی یک توزیع چقدر است؟

تاریخ: 1401/01/17

بازدید: 461

1401

زمان مطالعه: 5 دقیقه دقیقه

مفهوم آنتروپی ، در مقاله ای که در سال 1948 توسط شانون مطرح شد .

مدرس

@ins

چند مجموعه یا خورجین

تاریخ: 1400/04/01

بازدید: 1025

1400

زمان مطالعه: 5 دقیقه دقیقه

آشنایی با ریاضی

مدرس

@ins

LSTM چیست؟

تاریخ: 1401/02/24

بازدید: 543

1401

زمان مطالعه: 5 دقیقه

Long short-term memory (LSTM) ، یک شبکه عصبی مصنوعی است که در حوزه های موضوعی هوش مصنوعی و یادگیری عمیق به کار گرفته می شود.

مدرس

@ins

دسترسی رایگان به مجموعه داده ها

تاریخ: 1401/03/01

بازدید: 1651

1401

زمان مطالعه: 3 دقیقه

در فرآیند یادگیری ماشین ، محقق برای انجام کارهای مورد نظر خود نیاز به مجموعه داده استاندارد دارد . در این پست به معرفی یکی از پایگاه هایی که به طور رایگان ، مجموعه داده را در اختیار محققان قرار می دهد می پردازیم .

مدرس

@ins