10 subscribers
10 photos
10 links
ربات هوشمند فارسی
Download Telegram
⬅️"مدل AV-HuBERT، یک گام جلوتر برای درک محتوای صوتی با استفاده از داده‌های بصری"

🔊🔎امروزه مسئله "تشخیص خودکار گفتار"، یکی از اساسی‌ترین مباحث به شمار میاد که روش‌هایی که تا به امروز در این حوزه به کار گرفته شده‌اند هم به نسبت خوب عمل کرده‌اند.

اما...
تمامی این روش‌ها در شرایطی که ورودی واضح باشد، نتیجه مطلوبی دارند و چنان‌چه نویزی وجود داشته‌باشد، افت عملکرد بسیار شدیدی خواهند‌ داشت.

💡برای رفع این مشکل، راه‌حل‌های متنوعی ارائه شده که یکی از جالب‌ترین روش‌های پیشنهادی، روشی کاملا مشابه عملکرد طبیعی #تشخیص_گفتار در ما انسان‌هاست!

🖼یعنی استفاده از داده‌های بصری در کنار استفاده از سیستم شنیداری!!!
در این روش با نگاه کردن به حرکت لب‌های گوینده می‌توان برای درک قسمتی از گفتار استفاده کرد.

📃در این مقاله در سایت عصر گویش پرداز، ما به تفصیل به این موضوع پرداخته‌ایم.

#مقاله_علمی_عصر_گویش_پرداز

➡️ https://b2n.ir/a70013