برای اطلاع از آخرین مقالات علمی و اخبار کرونا(COVID-19) کلیک کنید

مشخصات مقاله

عنوان نشریه: 
 
اطلاعات شماره: 
پاييز 1389 , دوره  10 , شماره  3 ; از صفحه 55 تا صفحه 70 .
 
عنوان مقاله: 

مدل سازي غيرخطي قطع پوانکاره سيگنال گفتار در ترکيب با تحليل حوزه فرکانس به منظور افزايش صحت عملکرد سيستمهاي بازشناسي گفتار

 
نویسندگان: 
 
آدرس:  
* دانشکده مهندسی پزشکی، دانشگاه آزاد اسلامی قزوین
 
چکیده: 

در اين مقاله روشي جديد براي افزايش صحت سيستمهاي بازشناسي گفتار، با استفاده از ترکيب بردارهاي ويژگي به دست آمده از مدل سازي غيرخطي فضاي فاز بازسازي شده سيگنال گفتار با ويژگيهاي معمول به دست آمده از تحليل حوزه فرکانس ارايه مي شود. بر اساس نظريه پذيرفته شده کنوني، در صورت انتخاب تعداد بعد کافي براي بازسازي فضاي فاز سيگنال، اين فضا به صورت کامل ديناميک سيستم توليد کننده آن را نشان مي دهد و بنابراين مي تواند شامل اطلاعات مفيدي باشد که در تحليل فرکانسي معمول - مانند استخراج ضرايب کپسترال مل -MFCC در دسترس نيست. همچنين از آنجا که سيستمهاي پيچيده اي مانند سيستم توليد گفتار، رفتارهايي نوساني و تناوبي نشان مي دهند، قطع پوانکاره مي تواند به عنوان ابزاري موثر در تحليل اين رفتارها به کار رود. در اين مقاله نوعي مدل سازي غيرخطي با استفاده از مدل مخلوط گوسي (GMM) بر روي نقاط قطع پوانکاره سيگنال گفتار انجام مي شود. بردار ويژگي نهايي از يک مرحله انتخاب ويژگي بر روي پارامترهاي مدل مخلوط گوسي و بردار ويژگي هاي فرکانسي معمول MFCC حاصل مي شود. از يک سيستم بازشناسي مبتني بر مدل مخفي مارکوف(HMM)  و پايگاه داده تيميت به منظور ارزيابي سيستم ارايه شده استفاده شده است. نتايج آزمايشها بهبودي در حدود 5.7 درصد در صحت بازشناسي گفتار واج گسسته را نسبت به حالت استفاده از ويژگيهاي معمول MFCC نشان مي دهد. اين روش جديد مي تواند به عنوان روشي موثر و جايگزين در روشهاي استخراج ويژگي به ويژه براي سيستمهاي با ماهيت غيرخطي شديد استفاده شود.

 
کلید واژه: 

 
موضوعات مرتبط: 
 
ارجاعات: 
  • ندارد
 
 
مقالات نشریه ای مرتبط: 
 
مقالات همایشی مرتبط: 
 

  چکیده انگلیسی بازدید یکساله 250
 
 
آخرین های بلاگ
ورود به بلاگ مرکز اطلاعات علمی