Forwarded from عصر گویش | هوش مصنوعی
⬅️"مدل AV-HuBERT، یک گام جلوتر برای درک محتوای صوتی با استفاده از دادههای بصری"
🔊🔎امروزه مسئله "تشخیص خودکار گفتار"، یکی از اساسیترین مباحث به شمار میاد که روشهایی که تا به امروز در این حوزه به کار گرفته شدهاند هم به نسبت خوب عمل کردهاند.
‼اما...
تمامی این روشها در شرایطی که ورودی واضح باشد، نتیجه مطلوبی دارند و چنانچه نویزی وجود داشتهباشد، افت عملکرد بسیار شدیدی خواهند داشت.
💡برای رفع این مشکل، راهحلهای متنوعی ارائه شده که یکی از جالبترین روشهای پیشنهادی، روشی کاملا مشابه عملکرد طبیعی #تشخیص_گفتار در ما انسانهاست!
🖼یعنی استفاده از دادههای بصری در کنار استفاده از سیستم شنیداری!!!
در این روش با نگاه کردن به حرکت لبهای گوینده میتوان برای درک قسمتی از گفتار استفاده کرد.
📃در این مقاله در سایت عصر گویش پرداز، ما به تفصیل به این موضوع پرداختهایم.
#مقاله_علمی_عصر_گویش_پرداز
✅➡️ https://b2n.ir/a70013
🔊🔎امروزه مسئله "تشخیص خودکار گفتار"، یکی از اساسیترین مباحث به شمار میاد که روشهایی که تا به امروز در این حوزه به کار گرفته شدهاند هم به نسبت خوب عمل کردهاند.
‼اما...
تمامی این روشها در شرایطی که ورودی واضح باشد، نتیجه مطلوبی دارند و چنانچه نویزی وجود داشتهباشد، افت عملکرد بسیار شدیدی خواهند داشت.
💡برای رفع این مشکل، راهحلهای متنوعی ارائه شده که یکی از جالبترین روشهای پیشنهادی، روشی کاملا مشابه عملکرد طبیعی #تشخیص_گفتار در ما انسانهاست!
🖼یعنی استفاده از دادههای بصری در کنار استفاده از سیستم شنیداری!!!
در این روش با نگاه کردن به حرکت لبهای گوینده میتوان برای درک قسمتی از گفتار استفاده کرد.
📃در این مقاله در سایت عصر گویش پرداز، ما به تفصیل به این موضوع پرداختهایم.
#مقاله_علمی_عصر_گویش_پرداز
✅➡️ https://b2n.ir/a70013