سمینار برق بررسی مدل های هایبرید در بازشناسی گفتار اتوماتیک
سمینار برق بررسی مدل های هایبرید در بازشناسی گفتار اتوماتیک
فرمت فایل : pdf
حجم : 748
صفحات : 82
گروه : سمینار برق |
توضیحات محصول :
سمینار برق بررسی مدل های هایبرید در بازشناسی گفتار اتوماتیک
لطفا از این پروژه در راستای تکمیل تحقیقات خود و در صورت کپی برداری با ذکر منبع استفاده نمایید.
چکیده
علیرغم پیشرفت های صورت گرفته در دهه های اخیر، بازشناسی گفتار خودکار (ASR) کماکان عملیات دشوار و پرچالشی است. به طور خاص سیستم های بازشناسی مبتنی بر مدل های مارکف مخفی (HMM)، تحت شرایط مختلف کارایی خوبی دارند، ولی با موانعی روبرو هستند که قابلیت های آنها را در بازشناسی، در محیط دنیای واقعی محدود می سازد. برای غلبه بر این مشکل شبکه های عصبی مصنوعی (ANNs)، به عنوان یک جایگزین در ASR به کار گرفته شدند، ولی این شبکه ها در مواجهه با سیگنال های گفتار با دنباله زمانی طولانی، موفقیت چندانی نداشته و نتوانستند به تنهایی نظر محققین را جلب نمایند.
از اوایل دهه 90 میلادی برخی از محققین با ترکیب HMM و ANN در یک سیستم آمیختار، حوزه جدیدی را به وجود آوردند. هدف از این ترکیب استفاده از قابلیت های این دو سیستم در جهت افزایش انعطاف پذیری و اجرای صحیح بازشناسی می باشد. طراحی های متعدد و الگوریتم های آموزش گوناگون در این حوزه پیشنهاد شده است. در این نوشتار پس از بررسی مدل مخفی مارکف و کاربرد آن در بازشناسی گفتار و همچنین معرفی شبکه های عصبی، به بررسی سیستم های آمیختار HMM/ANN خواهیم پرداخت.
مقدمه
خروجی یک فرآیند در جهان واقعی به شکل یک سیگنال پیوسته یا گسسته مشاهده می شود. یک مسئله حیاتی در علوم، ساختن مدل هایی برای این سیگنال واقعی است. مدل سازی یک سیگنال مزایای فراوانی به همراه دارد. اولا، مدل، پایه ای برای توصیف نظری سیگنال فراهم می کند که می تواند برای پردازش سیگنال استفاده شود تا خروجی خواص مطلوبی داشته باشد. ثانیا، مدل می تواند اطلاعات بسیار مفیدی درباره منبع سیگنال بدهد، بدون اینکه احتیاجی به خود منبع باشد. نهایتا و از همه مهمتر، مدل ها می توانند در عمل به خوبی کار کنند و امکان تحقق سیستم های عملی مهمی را فراهم آورند.
بسته به نوع سیگنال، راه های مختلفی برای مدل کردن آن وجود دارد. به طور کلی، یک سیگنال می تواند معین یا نامعین (تصادفی یا آماری) باشد. مدل های معین از بعضی خواص شناخته شده سیگنال استفاده می کنند و مقادیر پارامترهای مدل را تخمین می زنند. از طرف دیگر، در مدل های آماری، یک فرآیند تصادفی، سیگنال را توصیف می کند. برای کاربردهایی نظیر تشخیص گفتار یا دستخط که با نویز و عدم قطعیت همراه هستند، مدل های آماری از کارایی بهتری برخوردارند. مدل های مخفی مارکف، که همچنین منابع مارکف یا توابع آماری زنجیره ای مارکف نامیده می شوند، در تئوری مخابرات یکی از پرکاربردترین مدل های آماری هستند.