ترجمه مقاله تخصصي رشته برق با عنوان شبکه هاي عصبي کانولوشني براي تشخيص صدا. اين وبسايت به ترجمه تخصصي مقالات رشته هاي برق و کامپيوتر اختصاص دارد.

سیستم اطلاعات جغرافیایی و شبکه های عصبی


بهبود پایداری سیستم قدرت با استفاده از کنترل کننده یکپارچه پخش توان (UPFC)


یک واحد تکفاز DG (سیستم تولید توزیع شده) دارای قابلیت فیلتر توان اکتیو شنت با اعمال فیلترینگ تطبیقی عصبی


مساله پیش بینی لینک در خصوص شبکه های اجتماعی


پايداري سيستم قدرت (پايان نامه)


بهبود پايداري سيستم قدرت با استفاده از UPFC (پايان نامه)


فرآیند های کنترل ژنراتور و توربین گازی: بررسی از دیدگاه کاربر


روش مبتنی بر اجماع برای حل مساله پخش اقتصادی در شبکه هوشمند


یکپارچه سازی پروژه های مزرعه بادی مقیاس-بالا به انضمام تجزیه و تحلیل قابلیت اطمینان سیستم


کاهش گذر های ناشی از سوئیچنگ خازن پشت به پشت در مدارات توزیع


کشف اطلاعات در شبکه های حسگر بیسیم چند بعدی


VFT: یک روش مجازی سازی و تحمل پذیری خطا برای پردازش ابری


یک کنترلر جریان مبتنی بر تابع لیاپانف برای کنترل جریان توان اکتیو و راکتیو در اینورتر فتوولتائیک متصل به شبکه سه فاز تحت شرایط ولتاژ شبکه تعمیم یافته


معرفی یک استراتژی کنترل جدید با استفاده از تابع لیاپانف برای فیلتر های توان اکتیو شنت تکفاز


معرفی یک مبدل جدید DC-DC پل کامل از نوع ZCS-PWM به همراه مدارات کمکی ساده


معرفی یک روش بهینه سازی مستمر با استفاده از الگوریتم قطرات اب هوشمند


معرفی یک چارچوب همکاری نظیر به نظیر برای تلفیق داده های حاصل از چند سنسور



فارسي

عنوان:  شبکه های عصبی کانولوشنی برای تشخیص صدا
چکيده— اخیرا نشان داده شده است که استفاده از ترکیب دوگانه شبکه عصبی عمیق (DNN) و مدل پنهان مارکف (HMM) ، عملکرد تشخیص صدا را در مقایسه با مدل ترکیبی مرسوم GMM-HMM (مدل مخلوط گاوسی-مدل پنهان مارکف) به صورت قابل ملاحظه ای ارتقاء می بخشد. بهبود عملکرد تا حدودی به قابلیت شبکه DNN جهت مدلسازی ارتباطات پیچیده میان خصیصه های صدا،‌ مرتبط می باشد. در این مقاله نشان می دهیم که با استفاده از شبکه های عصبی کانولوشنی (CNNs) می توان نرخ خطا را تا حد بیشتری کاهش داد. ما ابتدا توصیف مختصری از مبانی شبکه CNN را ارائه نموده و سپس چگونگی استفاده از این شبکه را جهت تشخیص صدا، توضیح می دهیم. در ادامه یک الگوی تسهیم وزنی محدود را پیشنهاد می نماییم که می تواند خصیصه های صدا را به صورت بهتری مدلسازی نماید. ساختار خاص موجود در شبکه های CNNs، به عنوان مثال ویژگی های اتصال موضعی، تسهیم وزن، و ادغام، درجه ای از تغییرناپذیری تا تغییرات کوچک خصیصه های صدا را در امتداد محور فرکانس نشان می دهد که توجه به این موارد در بررسی تغییرات محیط و گوینده مهم می باشد. نتایج تجربی نشان می دهند که در فرآیند های تشخیص صدا شامل تشخیص صوت در پایگاه داده TIMIT (Texas Instruments and Massachusetts Institute of Technology) و تشخیص جستجوی صدای لغات بزرگ، استفاده از شبکه های CNNs در مقایسه با شبکه های DNNs، نرخ خطا را به میزان 6 تا 10 درصد کاهش می دهد.
کلمات کليدي -کانولوشن، شبکه های عصبی کانولوشنی، الگوی تسهیم وزنی محدود، ادغام
توضيح
تماس

English

Title:  Convolutional Neural Networks for Speech Recognition
Abstract:  Recently, the hybrid deep neural network (DNN)- hidden Markov model (HMM) has been shown to significantly improve speech recognition performance over the conventional Gaussian mixture model (GMM)-HMM. The performance improvement is partially attributed to the ability of the DNN to model complex correlations in speech features. In this paper, we show that further error rate reduction can be obtained by using convolutional neural networks (CNNs). We first present a concise description of the basic CNN and explain how it can be used for speech recognition. We further propose a limited-weight-sharing scheme that can better model speech features. The special structure such as local connectivity, weight sharing, and pooling in CNNs exhibits some degree of invariance to small shifts of speech features along the frequency axis, which is important to deal with speaker and environment variations. Experimental results show that CNNs reduce the error rate by 6%-10% compared with DNNs on the TIMIT phone recognition and the voice search large vocabulary speech recognition tasks.
Keywords -Convolution, convolutional neural networks, Limited Weight Sharing (LWS) scheme, pooling
بازگشت به فهرست مقالات