برای اطلاع از آخرین مقالات علمی و اخبار کرونا(COVID-19) کلیک کنید

مشخصات مقاله

عنوان: 

ارائه یک روش خوشه بندی موضوعی متون فارسی مبتنی بر داده های با مربی

نوع ارائه: مقاله
نویسنده: فيلي هشام,عرب سرخي محسن
 
 
 
عنوان همایش: كنفرانس ملي سالانه انجمن كامپيوتر ايران
نوع همایش:  انجمن هاي علمي
حامی:  انجمن کامپیوتر ایران، دانشگاه صنعتی امیرکبیر
زمان:  1387دوره 14
 
 
چکیده: 

هدف از خوشه بندي متون تقسيم بندي مستندات به يک يا چند خوشه بر اساس محتويات موجود در متن آن است که از ابزارهاي مهم در حوزه پردازش زبان هاي طبيعي به شمار مي آيد. خوشه بندي متون در ابزارهايي مانند موتورهاي جستجو و سيستم پاسخگويي به سوالات کاربردهاي فراواني دارد. روشهاي مختلفي براي خوشه بندي موضوعي متون وجود دارد که استفاده از مدل احتمالاتي بيزين يکي از متداولترين روش ها به شمار مي آيد. در اين مقاله گزارشي از بکارگيري اين روش در خوشه بندي متون فارسي ارائه مي شود و سپس از ترکيب اين روش با ايده نگهداري کلمات هماورد کيفيت الگوريتم بهبود داده مي شود. استفاده از اين ايده بر روي 200,000 متن خبري از منابع خبرگزاري جمهوري اسلامي ايران (ايرنا ) توانسته است ميزان دقت خوشه بندي در زبان فارسي را به %87 افزايش دهد.

 
کلید واژه: خوشه بندي متون، زبان فارسي، مدل بيزين، کلمات هماورد
 
مقالات نشریه ای مرتبط: 
 
مقالات همایشی مرتبط: 
 
 
بازدید یکساله 154   pdf-file
 
آخرین های بلاگ
ورود به بلاگ مرکز اطلاعات علمی