بلاگ

پایگـاه اطلاعات علمی جهاد دانشگاهی

تقطیع کلمات انگلیسی بهم چسبیده


نصب پکیج wordninja

این پکیج امکان تفکیک یک رشته متصل انگلیسی (بدون فاصله) را به اجزای سازنده‌اش به محتمل‌ترین شکل فراهم می‌کند. به عنوان مثال:

thisisagoodexample

به صورت زیر تفکیک خواهد شد:

['this', 'is', 'a', 'good', 'example']

برای نصب پکیج از دستور pip استفاده می‌کنیم:

pip install wordninja

برای تفکیک متن نیز به صورت زبر عمل می‌کنیم:

import wordninja
wordninja.split('thisisagoodexample'.lower())

توجه کنید که به منظور عملکرد بهتر پکیج از تابع lower استفاده کردیم.

دوره آموزشی متن کاوی با پایتون مقدماتی (مجازی)

پست های مرتبط

یادگیری ماشین در پزشکی

تاریخ: 1400/02/06

بازدید: 3160

1400

زمان مطالعه: 5 دقیقه دقیقه

فعالیت های اداره تحلیل دادگان در حوزه پزشکی

مدرس

@ins

پردازش زبان طبیعی چیست ؟

تاریخ: 1400/09/30

بازدید: 842

1400

زمان مطالعه: 5 دقیقه دقیقه

پردازش زبان طبیعی یکی از زیرشاخه های مهم در حوزه علوم کامپیوتر ، هوش مصنوعی و نیز زبان شناسی محاسباتی است که به تعامل بین کامپیوتر و زبان های طبیعی یا انسانی می پردازد .

مدرس

@ins

روابط اصطلاحات در پردازش زبان طبیعی

تاریخ: 1400/01/18

بازدید: 2098

1400

زمان مطالعه: 5 دقیقه دقیقه

تعاریف برخی از اصطلاحات پردازش زبان طبیعی

مدرس

@ins

تحلیل احساس در شبکه‌های اجتماعی

تاریخ: 1401/05/11

بازدید: 61

1401

زمان مطالعه: 2 دقیقه

شبکه‌های اجتماعی آنلاین، محیطی هستند که افراد جامعه وقت زیادی را در آن‌ها می‌گذرانند. با توجه به امکانات این شبکه‌های اجتماعی، افراد می‌توانند افکار و احساس خود را آزادانه به اشتراک بگذارند.

مدرس

@ins