فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها



گروه تخصصی



متن کامل


اطلاعات دوره: 
  • سال: 

    1403
  • دوره: 

    13
  • شماره: 

    4
  • صفحات: 

    38-48
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    27
  • دانلود: 

    0
چکیده: 

پیش بینی پیوند در بافتار گراف های دانش عبارت است از پیش بینی موجودیت ها یا روابط غیرموجود که معمولاً با استفاده از دگرنمایی گراف دانش است. آموزش این مدل ها بر روی گراف های دانش استخراج شده از زبان های کم منبع چالش های منحصربه فردی را ایجاد می کند که در پژوهش های پیشین به آن پرداخته نشده است و در نتیجه هیچ داده ی محکی نیز برای ارزیابی روش های پیش بینی پیوند در چنین گراف های دانشی وجود ندارد. گراف های دانش استخراج شده از زبان های کم منبع به دلیل ویژگی های این زبان ها، اغلب توپولوژی منحصربه فردی دارند. برای مثال، بسیاری از گراف های دانش از دایره المعارف هایی مانند ویکی پدیا استخراج شده اند و ویکی پدیای مربوط به زبان های کم منبع معمولا برای موجودیت های بسیاری توضیحات نامبسوط ارائه کرده باشد. این مسأله باعث می شود گراف های حاصل از آنها نیز در خصوص بسیاری از گره ها یال های اندکی داشته باشند و این مسأله توپولوژی متفاوتی از گراف های دانش معیار برای آنها ایجاد می کند. فارس بیس (تنها گراف دانش مرتبط با زبان فارسی)، نمونه ای از این گراف هاست. این مقاله نسخه ای از فارس بیس را تحت عنوان «فارس پیش بین»، به عنوان داده ی محکی برای دگرنمایی گراف دانش با زبان های کم منبع معرفی می کند. سپس، نویسندگان ادعا و استدلال می کنند که در گراف های دانش استخراج شده از زبان های کم منبع، مدل های فاصله انتقالی از سایر مدل های دگرنمایی گراف دانش بهتر عمل می کنند. برای آزمودن این فرضیه، مدل های دگرنمایی گراف دانش رایج بر روی آن آزمایش و ارزیابی شده و اثبات شد که مدل های فاصله انتقالی بهترین عملکرد را روی چنین داده ی محکی دارند. این داده ی محک انتظار می رود که زین پس به عنوان یک زیرساخت ارزیابی استاندارد برای پژوهش هایی که به پیش بینی پیوند در گراف های دانش با زبان های کم منبع خواهند پرداخت استفاده شود.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 27

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    2019
  • دوره: 

    5
تعامل: 
  • بازدید: 

    234
  • دانلود: 

    0
چکیده: 

IN RECENT YEARS, SOCIAL MEDIA DATA HAS EXPONENTIALLY INCREASED, WHICH CAN BE ENUMERATED AS ONE OF THE LARGEST DATA REPOSITORIES IN THE WORLD. A LARGE PORTION OF THIS SOCIAL MEDIA DATA IS NATURAL LANGUAGE TEXT. HOWEVER, THE NATURAL LANGUAGE IS HIGHLY AMBIGUOUS, SPECIFICALLY WITH RESPECT TO THE FREQUENT OCCURRENCES OF ENTITIES, WHICH ARE ADDRESSED BY POLYSEMOUS WORDS OR PHRASES. ENTITY LINKING IS THE TASK OF LINKING THE ENTITY MENTIONS IN THE TEXT TO THEIR CORRESPONDING ENTITIES IN A KNOWLEDGE BASE. MOST OF THE ENTITY LINKING SYSTEMS BEGIN WITH SEARCHING FOR CANDIDATE ENTITIES, AND THEN DISAMBIGUATE THEM TO, FINALLY, CHOOSE THE BEST CANDIDATE. UNFORTUNATELY, DUE TO THE LACK OF A KNOWLEDGE GRAPH, THIS TASK HAD NOT BEEN ABLE TO BE COVERED IN THE PERSIAN LANGUAGE. FORTUNATELY, RECENTLY FarsBase HAS BEEN INTRODUCED AS A PERSIAN KNOWLEDGE GRAPH WITH ALMOST HALF A MILLION ENTITIES. CORRESPONDINGLY, IN THIS PAPER, WE PROPOSE AN UNSUPERVISED PERSIAN ENTITY LINKING SYSTEM, USING CONTEXT-DEPENDENT AND CONTEXT-INDEPENDENT FEATURES. FOR THIS PURPOSE, WE ALSO PUBLISH THE FIRST ENTITY LINKING CORPUS ON THE PERSIAN LANGUAGE, COMPOSED OF SOCIAL MEDIA TEXTS ON A NUMBER OF POPULAR PERSIAN CHANNELS, IN THE TELEGRAM SOCIAL NETWORK. THE RESULTS PROVE THE HIGHLY EFFICIENT PERFORMANCE OF THE PROPOSED METHOD, WHICH IS COMPARABLE WITH THE CORRESPONDING STATE OF THE ART IN THE ENGLISH LANGUAGE.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 234

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
اطلاعات دوره: 
  • سال: 

    2020
  • دوره: 

    12
  • شماره: 

    4
  • صفحات: 

    60-69
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    93
  • دانلود: 

    0
چکیده: 

Most of the data on the web is in the form of natural language, but natural language is highly ambiguous, especially when it comes to the frequent occurrence of entities. The goal of entity linking is to find entity mentions and link them to their corresponding entities in an external knowledge base. Recently, FarsBase was introduced as the first Persian knowledge base with nearly 750, 000 entities. This research suggested one of the first end-to-end unsupervised entity linking systems specifically for Persian, using context and graph-based features to rank candidate entities. To evaluate the proposed method, we used the first Persian entity-linking dataset created by crawling social media text from some popular Telegram channels. The ParsEL results show that the F-Score of the input data set is 87. 1% and is comparable to any other entity-linking system that supports Persian.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 93

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    2019
  • دوره: 

    5
تعامل: 
  • بازدید: 

    247
  • دانلود: 

    0
چکیده: 

IN THIS PAPER WE USE DISTANT SUPERVISION FOR THE TASK OF RELATION EXTRACTION FROM A LARGE CORPUS IN THE PERSIAN LANGUAGE. THERE ARE SUPERVISED AND UNSUPERVISED METHODS FOR RELATION EXTRACTION FROM TEXT. IN SUPERVISED RELATION EXTRACTION WE USE HAND LABELED CORPORA. THIS METHOD SUFFERS FROM DOMAIN DEPENDENCIES AND THE DIFFICULTIES OF LABELING THE TEXT. IN UNSUPERVISED METHOD, WE USE LARGE CORPORA WITHOUT HAVING TO LABEL THEM BUT RELATIONS EXTRACTED USING THIS METHOD CANNOT BE USED TO POPULATE KNOWLEDGE BASES. DISTANT SUPERVISION TAKES ADVANTAGE OF LARGE CORPORA WITHOUT SUFFERING FROM DOMAIN DEPENDENCIES AND CAN POPULATE KNOWLEDGE BASES. FOR OUR EXPERIMENT WE USE FarsBase, A KNOWLEDGE BASE CONTAINING MILLIONS OF RELATION INSTANCES, AND ALIGN ENTITIES IN 630000 PERSIAN WIKIPEDIA ARTICLES TO THESE RELATION INSTANCES AND CREATE A DISTANTLY SUPERVISED DATASET. WE THEN EXTRACT NEW RELATION INSTANCES USING PIECEWISE CONVOLUTIONAL NEURAL NETWORKS AND COMPARE THE RESULTS WITH THE BASELINE MODEL THAT USES MANUALLY EXTRACTED FEATURES.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 247

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button