برای اطلاع از آخرین مقالات علمی و اخبار کرونا(COVID-19) کلیک کنید

مشخصات

عنوان:

بالا بردن تحمل پذیری خطا و قابلیت اطمینان در سیستمهای توزیع شده



گروه تخصصی:  فنی و مهندسی

سازمان مجری:  واحد تربیت مدرس 

گروه پژوهشی: پژوهشی ریاضی و انفورماتیک

پژوهشگران: 
بیات پیمان (مسئول طرح)
چلنگر محرم (همکار طرح)
احمدی علی (همکار طرح)
دهکردی علی (همکار طرح)

تاریخ خاتمه:  اردیبهشت 1388

کارفرما: معاونت پژوهش و فناوری جهاددانشگاهی

خروجی طرح: 

ارائه گزارش نهایی طرح به کارفرما.


نوع: توسعه ای

 
تلفن: 37-88335335-88630480-88011001-021 ????? 4114-3945

نشانی سازمان مجری: تهران، بزرگراه جلال آل احمد، پل نصر، دانشگاه تربیت مدرس، صندوق پستی: 343- 14115
 

چکیده:

انحصار متقابل یکی از مهمترین بحث های مربوط به سنکرون سازی در سیستم های توزیع شده می باشد. در این طرح، الگوریتم جدیدی به منظور بهینه سازی تحمل پذیری خطا در الگوریتم توزیع شده برای حل پاره ای از مشکلات انحصار متقابل یا ناسازگاری زوجی در سیستم های توزیع شده، ارائه شده است. در این روش با از کار افتادن یکی از پردازه های سیستم، که در حالت عادی موجب از کار افتادگی کل سیستم می شود سیستم توزیع شده می تواند اطلاعات از دست رفته را بازیابی نموده و به روند عادی خود باز گرداند. بدین ترتیب تحمل پذیری مقابل خطا در سیستم بالا می رود، به طوری که نقطه ضعف اساسی الگوریتم توزیع شده یعنی نقطه شکست منفرد بودن نسبت به هر یک از پردازه ها، پوشش داده می شود. بنابراین، الگوریتم توزیع شده به یک الگوریتم با قابلیت اطمینان بیشتر، توسعه یافته است. تنها نکته ای که در مقایسه الگوریتم پیشنهادی با الگوریتم مبنا دیده می شود، صرف مقدار کمی زمان در هنگام خراب شدن پردازه ذکر شده می باشد که با توجه به مزیت به دست آمده مبتنی بر عدم از کار افتادن کل سیستم در مواقع از کار افتادن پردازه ای که خواسـتار دسترسی به منبع است، قابل صرف نظر می باشد و چنانکه خواهیم دید، این موضوع دارای کاربردهای فراوانی در زمینه های مختلف علوم است. از طرف دیگر، سیستم عامل لینوکس به عنوان یک سیستم عامل منعطف و متن باز می تواند به عنوان بستری برای این عملیات قرار گرفته و زیر ساخت لازم را پدید آورد.
در این طرح پژوهشی چگونگی بررسی این راهکار با هدف بالا بردن تحمل پذیری خطا و متعاقب آن بهینه سازی قابلیت اطمینان در سیستم های توزیع شده مورد بررسی قرار گرفته است
.



کلیدواژگان: سیستم توزیع شده، روند سریع و موازی، سیستم عامل لینوکس، کدهای منبع

 
 
Title:

Optimization of Fault-Tolerant and Reliability in Distributed Systems



Abstract:

Distributed systems, are a new aspect of computer science and computer system engineering. Today, speed up is very important problem on the solving the problems and distributed systems causes to implementing a parallel and rapid processing. To have a distributed system, it needs to implement a network with distributed system definitions. For example an open source operating system to creating a transparent and reliable and fault-tolerant and so on. In this research, we use Linux operating system as an open source infrastructure and change its modules (source codes), to reach to the reliability and fault tolerance as our goals.



Keyword(s): Distributed systems, Parallel and rapid processing, Linux operating system, source codes