فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها


گروه تخصصی



متن کامل


نشریه: 

زبان پژوهی

اطلاعات دوره: 
  • سال: 

    1403
  • دوره: 

    16
  • شماره: 

    52
  • صفحات: 

    219-246
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    43
  • دانلود: 

    10
چکیده: 

پیکره ­ها براساس زبان به کاررفته در متن های تشکیل ­دهندة آن­ها به پیکره­های تک­ زبانه، دوزبانه و چندزبانه گروه بندی می­شوند. پیکرة مقایسه ­ای، پیکره­ای است دوزبانه یا چندزبانه که شامل متن هایی است مشابه در حوزه­های موضوعی یکسان. با وجود کاربرد فراوان این نوع پیکره ها در پژوهش های گوناگون همچون پژوهش­های زبانی، ترجمة ماشینی و سامانه های خودکار بازیابی اطلاعات بینازبانی، پژوهشگران همواره با کمبود پیکره های مقایسه­ ای مواجه بوده اند. در این مقاله، به معرفی مراحل ساخت یک پیکرة مقایسه ای تخصصی به نام «پارسا» پرداخته شده است. این پیکره از چکیده­های فارسی و انگلیسی پایان­ نامه ­ها و رساله ­های ثبت شده در پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک) ساخته شده است و شامل بیش از 89 میلیون واژه فارسی و 79 میلیون واژه انگلیسی است. محتوای این پیکره عمومی نیست و مشتمل بر متن های بسیار تخصصی در حوزه­های موضوعی کلان مانند علوم اجتماعی، علوم انسانی و هنر، فنی­ ومهندسی و رشته ­های مربوط به این حوزه­ها است و ازاین جنبه، برای پردازش­های زبانی که نیازمند بهره ­گرفتن از متن های تخصصی است، بسیار ارزشمند است. برای ساخت این پیکره، پس از نمونه ­گیری، داده­های فارسی وارد فرایند پیش ­پردازش (هنجارسازی و واحدسازی) شدند. برای ارزیابی این مرحله دقت (P)، فراخوان (R) و F1 سنجیده شد. دقت، 5614035088. 0، فراخوان،   0531561462. 0 و در پایان، F1 09711684370257966. 0 محاسبه شده است. سپس، داده­ها برچسب گذاری شدند (برچسب ­گذاری اجزای کلام) و برچسب­های متون فارسی کنترل شدند. داده­های انگلیسی نیز به صورت ماشینی برچسب گذاری شدند. شمار واژه های محتوایی (فعل، اسم، صفت، قید) داده­های فارسی این پیکره 57653813 و شمار واژه­های دستوری به همراه اعداد و علائم سجاوندی 31350125  است و بن­ واژه­های فارسی استخراج ­شده نیز شامل 41064 بن­ واژه است. شمار واژه­های محتوایی متون انگلیسی 45606686 و شمار واژه­های دستوری به همراه اعداد و علائم سجاوندی شامل 33662304 و بن واژه­های انگلیسی استخراج ­شده نیز شامل 12937 بن ­واژه است. پیکرۀ ساخته ‎شده قابلیت بسیار بالایی برای داده کاوی، پژوهش­های مربوط به ترجمه ماشینی و به کارگیری در تمام پژوهش هایی که بر روی متون علمی انجام می شود را دارا است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 43

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 10 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1392
  • دوره: 

    -
  • شماره: 

    2 (پیاپی 20)
  • صفحات: 

    69-86
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1464
  • دانلود: 

    272
چکیده: 

واحدسازی، از مهم ترین مسائل در پردازش زبان های طبیعی است که عبارت از فرآیند تقسیم متن به واحدهای معنادار نظیر واژه، عبارت نحوی، جمله و غیره است. واحدسازی گروه های نحوی یک متن، از جمله وظایف واحدسازی متن محسوب می شود که در بسیاری از کارهای پردازش زبان طبیعی، نظیر سامانه های ترجمه ماشینی، استخراج اطلاعات، پرسش و پاسخ و سامانه های تبدیل متن به گفتار، به عنوان پیش پردازشی مهم، می تواند حضور داشته باشد. واحدسازی عبارات نحوی، در هر زبان، متناسب با ویژگی های نوشتاری آن زبان مشکلات و پیچیدگی هایی دارد. زبان فارسی به دلیل وجود رسم الخط های مختلف، جملات بدون ترتیب، افعال مرکب، ابهامات معنایی و عدم نمایش مصوت ها مشکلاتی دارد. در این مقاله روشی مبتنی بر روش های آماری و یادگیری و اطلاعات و ویژگی های دستور زبانی جهت تشخیص مرز و نوع گروه های نحوی در متون فارسی فاقد علایم سجاوندی، ارائه شده است که در آن از روش های یادگیری ماشین بردار پشتیبان و میدان تصادفی شرطی استفاده شده است. در روش ارائه شده ویژگی های مختلف زبانی مرتبط با زبان فارسی استخراج و برای نخستین بار مورد بررسی و استفاده قرار گرفته اند. بهترین دقت به دست آمده توسط این سامانه، 84.02% بر اساس معیار F و 87.45%، بر اساس تعداد برچسب های صحیح به کل در تعیین مرز، و 78.04%، در تعیین مرز و نوع به صورت توام، بوده است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1464

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 272 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1401
  • دوره: 

    19
  • شماره: 

    3
  • صفحات: 

    175-188
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    127
  • دانلود: 

    28
چکیده: 

متون نگاشته شده فارسی به طورمعمول دو مشکل ساده، ولی مهم دارند. مشکل نخست واژه های چندواحدی هستند که از اتصال یک واژه به واژه­ های بعدی حاصل می­شوند. مشکل دیگر واحدهای چندواژه­ای هستند که از جداشدگی واژه ­هایی که با هم یک واحد واژگانی را تشکیل می ­دهند، حاصل می شوند. ابزار واحدساز در زبان فارسی که به عنوان یکی از ابزارهای پیش ­پردازش زبان است، کاربرد فراوانی در تجزیه و تحلیل متون داشته و باید بتواند واحدهای واژگانی را تشخیص دهد. به عبارتی، این ابزار، مرکز کلمات را در متون تشخیص داده و آن را به دنباله­ ای از کلمات به منظور تحلیل­ های بعدی تبدیل می ­کند. تنوع در رسم‎ الخط فارسی و عدم رعایت قوانین جدانویسی و پیوسته نویسی کلمات از یک سو و پیچیدگی های واژگانی زبان فارسی از سویی دیگر فرایندهای مختلف پردازشی زبان از جمله واحدسازی را با چالش های بسیاری روبه رو می کند؛ لذا برای عملکرد بهینه این ابزار، لازم است ابتدا ملاحظات زبان شناسی رایانشی واحدسازی در زبان فارسی مشخص و سپس بر اساس این ملاحظات مجموعه داده­ای برای آموزش و آزمایش آن فراهم شد. در این مقاله سعی شد ضمن تبیین ملاحظات یاد شده، به تهیه پیکره­ای در این خصوص بپردازیم. پیکره تهیه شده شامل 183/21 کلمه و متوسط طول جملات 28/40 است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 127

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 28 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1394
  • دوره: 

    7
  • شماره: 

    1
  • صفحات: 

    73-86
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1150
  • دانلود: 

    251
چکیده: 

پیامدهای فاجعه آمیز حوادث مربوط به حمل مواد خطرناک با توجه به رشد روزافزون حمل و نقل این مواد به منظور تامین نیاز صنایع مختلف، مطالعه در زمینه حمل مواد خطرناک و بکارگیری راهکارهای مناسب برای کاهش تلفات را ضروری میکند. ریسک حمل و نقل مواد خطرناک، یک معیار از میزان احتمال وقوع حوادث ناخواسته و میزان وخیم بودن پیامدهای وقوع آن است. هدف این پژوهش، ارزیابی مسیرهای حمل مواد خطرناک بر اساس ریسک آنها است. برای رسیدن به این هدف، پس از قطعه بندی مسیر مورد مطالعه، ریسک در قطعات مختلف محاسبه می شود. محاسبه ریسک قطعات شامل کمی سازی دو مولفه احتمال وقوع و پیامدهای وقوع در قطعات است. این کمی سازی با استفاده از مقایسات زوجی در قطعات مختلف صورت میگیرد. با استفاده از رویکرد پیشنهادی می توان پیامدهای حمل موادخطرناک را با توجه به نوع مواد مختلف در طول یک مسیر بررسی کرد. قطعه بحرانی مسیر از لحاظ ریسک در حمل ماده مورد نظر نیز می تواند معرفی شود. رویکرد پیشنهادی این پژوهش در محورهای هراز و فیروزکوه به عنوان مطالعه موردی اعمال شد و قطعات بحرانی تعیین گردید. با محاسبه ریسک کلی و واحدسازی شده برای محور هراز و فیروزکوه، سطح خطرپذیری این دو محور برای حمل مواد خطرناک با توجه به نتایج ارزیابی شد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1150

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 251 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1396
  • دوره: 

    8
  • شماره: 

    3
  • صفحات: 

    405-421
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    997
  • دانلود: 

    233
چکیده: 

پیامدهای فاجعه آمیز حوادث مربوط به حمل مواد خطرناک با توجه به رشد روزافزون حمل و نقل این مواد به منظور تامین نیاز صنایع مختلف، مطالعه در زمینه حمل مواد خطرناک و به کارگیری راهکارهای مناسب برای کاهش تلفات را ضروری میکند. ریسک حمل و نقل مواد خطرناک، یک معیار از میزان احتمال وقوع حوادث ناخواسته و میزان وخیم بودن پیامدهای وقوع آن است. هدف این پژوهش، ارزیابی مسیرهای حمل مواد خطرناک بر اساس ریسک آنها است. برای رسیدن به این هدف پس از قطعه بندی مسیر مورد مطالعه، ریسک در قطعات مختلف محاسبه می شود. محاسبه ریسک قطعات شامل کمیسازی دو مولفه احتمال وقوع و پیامدهای وقوع در قطعات است. این کمی سازی با استفاده از مقایسات زوجی در قطعات مختلف صورت می گیرد. با استفاده از رویکرد پیشنهادی می توان پیامدهای حمل مواد خطرناک را با توجه به نوع مواد مختلف در طول یک مسیر بررسی کرد. قطعه بحرانی مسیر از لحاظ ریسک در حمل ماده مورد نظر نیز میتواند معرفی شود. رویکرد پیشنهادی این پژوهش در محورهای هراز و فیروزکوه به عنوان مطالعه موردی اعمال شد و قطعات بحرانی تعیین گردید. با محاسبه ریسک کلی و واحدسازی شده برای محور هراز و فیروزکوه، سطح خطرپذیری این دو محور برای حمل مواد خطرناک با توجه به نتایج ارزیابی شد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 997

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 233 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1404
  • دوره: 

    12
  • شماره: 

    3
  • صفحات: 

    71-90
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    1
  • دانلود: 

    0
چکیده: 

چکیده:هدف این پژوهش شناخت عوامل ساختاری موثر بر جغرافیای فرهنگی ایران وتاثیرات هویت مذهبی دوره صفویه بر این سازماندهی فضایی است.با توجه به چنین امری پژوهش حاضراز نظر ماهیت تبیینی-تحلیلی و مبتنی بر رویکرد تاریخی-مفهومی در چارچوب ژئوکالچر است.در این مقاله انتظام جغرافیای فرهنگی ایران به مثابه برآیند سه مولفه جغرافیا،مذهب و ساختار قدرت سیاسی تحلیل می شود.شاهان ایران به طور مداوم در انتظام بخشی به فرهنگ و تمدن این سرزمین تلاش کرده اند. اما بعد از دوره هایی، دودمان صفویه با تمرکز بر مذهب تشیع در یک مقطع سرنوشت ساز تاریخی توانست ایران را به "ملت-دولت" مستقل، خودمحور، نیرومند و مورد احترام در جهان آن روز تبدیل کند. با روی کار آمدن سلسله صفویه حکومت بر اساس اندیشه واحدسازی ملی از طریق مذهب تشیع انتظام یافت و این روند در دوره های بعدی استمرار و به غنای آن افزوده شده است.بر این اساس می توان اذعان نمود که حکومت ها در بستر جغرافیایی فلات ایران با مولفه های فرهنگی-مذهبی(تشیع) و شیوه های حکمرانی در ادوار مختلف تاریخی در شکل دهی به انسجام هویتی،یکپارچگی سرزمینی و ثبات فرهنگی-سیاسی نقش آفرینی کرده اند.در این چارچوب مذهب تشیع به عنوان یک عنصر ژئوکالچری هم نقش اتسجام بخش داخلی و هم کارکرد تمایزبخش منطقه ای داشته است.بر این اساس ایران می تواند با ترکیب سنت و مدرنیته و با استفاده از ظرفیت های ژئوپلیتیکی-ژئوکالچری خود الگویی پایدار از انتظام فرهنگی در منطقه بحران زده خاورمیانه ارائه دهد.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 1

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
litScript
email sharing button
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
sharethis sharing button