مشخصات مقاله

عنوان: 

معرفي يک معيار شباهت حساس به پرسش براي خوشه بندي اسناد در سيستم هاي بازيابي اطلاعات متني

نوع ارائه: مقاله
نویسنده: ولي زاده محمدرضا,ذوالقدري جهرمي منصور
 
 
 
عنوان همایش: كنفرانس ملي سالانه انجمن كامپيوتر ايران
نوع همایش:  انجمن هاي علمي
حامی: انجمن کامپیوتر ایران، مرکز فن آوری دانشگاه صنعتی شریف
زمان:  1382دوره 9
 
 
چکیده: 

خوشه بندي در زمينه بازيابي اطلاعات به صورت گسترده اي در سالهاي اخير با هدف بالا بردن سرعت و کارايي سيستم مورد استفاده قرار گرفته است. ارتقاء کارايي سيستم بر پايه اين فرضيه استوار است که اسناد مرتبط با يک پرسش خود شبيه يکديگر هستند و انتظار مي رود که در عمل خوشه بندي در يک خوشه قرار گيرند. جهت عمل خوشه بندي يک معيار شباهت مورد نياز است که با آن بتوان شباهت دو سند را اندازه گرفت. معيارهاي شباهت ايستا مانند کوسينوس، شباهت دو سند را بدون توجه به پرسش کاربر محاسبه مي کنند و در نتيجه شباهت دو سند تحت پرشس هاي مختلف کاربر يکسان خواهد بود. معيارهاي شباهت حساس به پرسش (Query sensitive similarity Measures) سعي در آشکار کردن شباهت دو سند تحت يک پرسش خاص را دارند. در اين مقاله يک معيار شباهت حساس به پرسش ارايه شده است که با استفاده از چندين مجموعه اسناد استاندارد در زمينه بازيابي اطلاعات مورد ارزيابي قرار گرفته است و کارايي آن با معيار شباهت ايستا که به پرسش توجهي ندارند و همچنين با معيارهاي شباهت حساس به پرسش ارايه شده توسط ساير محققان، مقايسه شده است. نتايج آزمايش ها، نشان دهنده پيشرفت قابل ملاحظه معيار ارايه شده است. بر اساس اين نتايج انتظار مي رود که استفاده از اين معيار پيشنهادي، باعث افزايش کارايي سيستم هاي بازيابي اطلاعات مبتني بر خوشه بندي شود.

 
کلید واژه: خوشه بندي متن، معيارهاي شباهت، سيستم هاي بازيابي اطلاعات متني
 
مقالات نشریه ای مرتبط: 
 
مقالات همایشی مرتبط: 
 
بازدید یکساله 51   pdf-file
 
tabligh

moavenatelmi
آخرین های بلاگ
ورود به بلاگ مرکز اطلاعات علمی