آزمایشگاه تحقیقاتی پردازش سیگنالهای گفتار

 

دانشکده مهندسی برق و کامپیوتر

گروه مهندسی برق-مخابرات

آزمایشگاه تحقیقاتی پردازش سیگنالهای گفتار

سرپرست آزمایشگاه: دکتر مسعود گراوانچی­زاده

 

رسالت:

گروه تحقیقاتی پردازش سیگنالهای گفتار در سال 1385 به سرپرستی آقای دکتر مسعود گراوانچی زاده تاسیس شد. از جمله اهداف تشکیل این گروه، ارائه روشهای جدید به منظور حل چالشهای پیشرو در کاربردهای مختلف پردازش سیگنال گفتار می­باشد. از جمله این چالشها می­توان به مسئله بازشناسی سیگنالهای گفتار، طبقه­بندی الگوها، تصدیق هویت گوینده، نهان­نگاری سیگنال گفتار، بهبودی کیفیت گفتار، حذف پژواک از سیگنال گفتار، مکان­یابی آرایه­ای منابع صوتی و جداسازی منابع سیگنال گفتار توسط روشهای متعارف اشاره کرد.

 

دانشجویان فعال در آزمایشگاه:

1)     مهندس علی فلاح (دانشجوی مقطع دکتری)

2)     مهندس میثم بشیر­پور (دانشجوی مقطع دکتری)

 

لیست پروژه‌های تحقیقاتی در حال اجرا و یا خاتمه یافته:

1)     پیاده­سازی سیستم جعبه­ابزار مارکوف پنهان

2)     طبقه­بندی الگوها توسط مدل­های مارکوف پنهان

3)     طبقه­بندی الگوها توسط شبکه­های عصبی

4)     آنالیز مولفه­های اصلی

5)     ارائه و پیاده­سازی الگوریتم بهینه­ای برای کاهش نویز از سیگنال گفتار توسط فیلتر وینر

6)      بهبود کیفیت صوت با استفاده از روش تفریق طیفی بر اساس مینیمم های آماری

7)     جداسازی سیگنال مرکب صحبت توسط الگوریتم ICA

8)     حذف کور پژواک از سیگنال صحبت توسط روش HERB

9)     حذف نویز از سیگنال گفتار توسط آستانه گذاری ضرایب موجک بر اساس واکداربودن یا بی واک بودن صوت

10) جداسازی سیگنال صحبت بر پایه ICA برای بهبود کیفیت گفتار

11) مکان‌یابی منابع صوتی با استفاده از روش‌های مستقیم پارامتری در حوزه فرکانس

12) بهبود کیفیت گفتار با استفاده از الگوریتم­های بهینه­سازی اتفاقی

13) بررسی عملکرد فیلترهای وفقی ترکیبی برای بهبود کیفیت سیگنال گفتار

14) تصدیق هویت گوینده با استفاده از مدل مخلوط گوسی

15) بهینه سازی نهان نگاری سیگنال گفتار مبتنی بر ترکیب ویژگی­های گفتاری

16) بهبود کیفیت گفتار بر پایه روش‌های زیرفضائی با استفاده از تکنیک‌های حذف نویز ادراکی

 

نمونه‌هایی از مقالات کنفرانسها و ژورنا‌ل‌های چاپ شده مستخرج از پروژهای تحقیقاتی انجام گرفته در آزمایشگاه:

[1]            Masoud Geravanchizadeh, Masoumeh Hesam, “PSO-based Infomax Algorithm for Frequency-Domain Blind Source Separation,” ICEE 2011, Tehran, 2011.

[2]            Masoud Geravanchizadeh, Sina Ghalami Osgouei, “Dual-channel Speech Enhancement Using Normalized Fractional Least-Mean-Squares Algorithm,” ICEE2011, Tehran, 2011.

[3]            Masoud Geravanchizadeh, Alireza Abadianfard, “Male/Female Speech Classification Based on Cepstral Modulation Ratio Parameterization by Laguerre Polynomials,” ICEE2012, Tehran, 2012.

[4]            Sina Ghalami Osgouei, Masoud Geravanchizadeh, “Speech Enhancement Using Kernel Recursive Least-Squares Method,” ICEE2012, Tehran, 2012.

[5]            Masoud Geravanchizadeh, Sina Ghalami Osgouei, “A New Shuffled Sub-swarm Particle Swarm Optimization Algorithm for Speech Enhancement,” the Journal of IJCET, 2012.

[6]            Masoud Geravanchizadeh, Tohid Yousefi Rezaii, “Transform Domain Based Multi-Channel Noise Cancellation Based on SAD Structure and LMMN Agorithm,” the Journal of Applied Sciences, 2008.

[7]            Masoud Geravanchizadeh, Masoumeh Hesam, “Convolutive ICA for Audio Signals,” in Independent Component Analysis for Audio and Biosignal Applications, Edited by Ganesh R. Naik, Published by InTech, 2012.