استخراج ویژگی های مقاوم گفتاری زیر باندی با استفاده از شبکه های

شبکه عصبی در هم پیچش

شبکه های عصبی در هم پیچش (CNN) به عنوان گروهی از شبکه های عصبی عمیق است. که در سالهای اخیر کاربرد فراوانی در مدلسازی آکوستیک و همچنین استخراج ویژگی و مدل سازی توأم در بازشناسی گفتار یافته اند. در مقاله حاضر، پیشنهاد میشود تا از CNN برای استخراج ویژگی مقاوم به نویز استفاده شود. درحالیکه ورودی CNN طیف سیگنال گفتار نویزی و خروجی هدف آن خروجی های متناظر تمیز از بانک فیلتر مل است. به این ترتیب CNN ویژگی های مقاوم به نویز را از طیف سیگنال گفتار استخراج می نماید.

نقطه ضعف CNN در این روش آن است که تنها یک وضوح فرکانسی ثابت را به کار می گیرد. از این جهت، در این مقاله استفاده از چند (CNN) با اندازه های فیلتر درهم پیچش متفاوت، جهت مدل سازی تفاوت وضوح فرکانسی برای استخراج ویژگی از طیف سیگنال گفتار پیشنهاد می شود. روش پیشنهادی را شبکه عصبی درهم پیچش چند دقتی (MRCNN) نامگذاری کرده ایم. آزمایشها روی دادگان Aurora2 نشان میدهند که:

 CN نسبت به شبکه باور عمیق در استخراج ویژگی مقاوم به نویز میانگین دقت بازشناسی را 20 درصد بهبود می دهد. همچنین نتایج نشان میدهند که:

 MRCNN میانگین دقت بازشناسی را نسبت به (CNN) استاندارد (تک دقتی) 1 درصد بهبود می دهد

 

 

 

© کپی رایت - هوشمندی کسب و کار، انبار داده، دریاچه داده، پلتفرم داده، تحلیل کلان داده، رهیافت های داده محور، علم داده، هوش مصنوعی | Power by kte.ir