10 subscribers
10 photos
10 links
ربات هوشمند فارسی
Download Telegram
Channel created
🔸 رومند ( دستیار هوشمند فارسی )
🔗 www.romand.ir

🆔 @romand_official
🔸 رومند ( دستیار هوشمند فارسی )
🔗 www.romand.ir

🆔 @romand_official
🔸 رومند ( دستیار هوشمند فارسی )

💬 تجربه شیرین پشتیبانی خودکار توسط ربات
📣 با استفاده از هوش مصنوعی رومند

🔗 www.romand.ir

🆔 @romand_official
راهکار کاهش هزینه کسب و کارها...

پشتیبانی دادن و جلب رضایت مشتری یکی از اهداف اصلی استارتاپ‌ها و انواع کسب و کارها است و مطمئنا این کار هزینه زیادی را متحمل صاحبان مشاغل خواهد کرد. اما راه‌کارهای بسیار ارزان قیمتی وجود دارد که می‌تواند بطور کلی جایگزین نیروی انسانی شده و هزینه‌‌‌ها را تا نود و پنج درصد کاهش دهد!
🤖 برای مثال تصور کنید یک ربات هوشمند که به تکنولوژی هوش مصنوعی مجهز است بصورت نوشتاری و حتی گفتاری با مشتریان شما در ارتباط بوده و پاسخگوی مشکلات و نیازمندی‌های آن‌ها باشد...!
🔸 تجربه‌ای شیرین با یک دستیار هوشمند فارسی به نام رومند!
🔗 www.romand.ir
🆔️ @romand_official
The account of the user that owns this channel has been inactive for the last 5 months. If it remains inactive in the next 27 days, that account will self-destruct and this channel will no longer have an owner.
📢ربات‌ها در آینده‌، مفاهیم و اطلاعات موجود در جهان رو بیشتر شبیه به شیوه انسان‌ها، یعنی از طریق ادراک، تفسیر خواهند‌کرد!

💡محققان MIT یک تکنیک ماشین لرنینگ ایجاد کردند که می‌آموزد داده‌‌ها را به گونه‌ای نمایش دهد که مفاهیمی را که بین روش‌های بصری و صوتی به اشتراک گذاشته می‌شوند، نشان دهد.

الکساندر لیو، پژوهشگر،در این رابطه می‌گوید چالش اصلی اینست که چگونه یک ماشین می‌تواند آن روش و فرمت‌های مختلف داده را با هم هماهنگ کند؟ به عنوان انسان، این برای ما آسان است. ما یک ماشین را می‌بینیم و سپس صدای ماشینی را می‌شنویم که از کنار آن می‌گذرد و می‌دانیم که این‌ها یکسان هستند اما برای یادگیری ماشین، این کار چندان ساده نیست.

❇️ تیم او تکنیک هوش مصنوعی را توسعه دادند که یاد می‌گیرد داده‌‌ها و اطلاعات را به‌گونه‌ای تفسیر کند و نمایش دهد که مدل یادگیری ماشین آن‌ها، بتواند تشخیص دهد که یک عمل خاص چه زمانی در ویدیو انجام می‌شود و آن را برچسب‌گذاری کند.

📌 برای خواندن کامل این مقاله، به وب‌سایت رومند مراجعه کنید
➡️Article: www.romand.ir/blog/هوش-مصنوعی-در-مسیر-تفسیر-داده-و-اطلاعات

➡️Instagram: www.instagram.com/romand.ir
⬅️"مدل AV-HuBERT، یک گام جلوتر برای درک محتوای صوتی با استفاده از داده‌های بصری"

🔊🔎امروزه مسئله "تشخیص خودکار گفتار"، یکی از اساسی‌ترین مباحث به شمار میاد که روش‌هایی که تا به امروز در این حوزه به کار گرفته شده‌اند هم به نسبت خوب عمل کرده‌اند.

اما...
تمامی این روش‌ها در شرایطی که ورودی واضح باشد، نتیجه مطلوبی دارند و چنان‌چه نویزی وجود داشته‌باشد، افت عملکرد بسیار شدیدی خواهند‌ داشت.

💡برای رفع این مشکل، راه‌حل‌های متنوعی ارائه شده که یکی از جالب‌ترین روش‌های پیشنهادی، روشی کاملا مشابه عملکرد طبیعی #تشخیص_گفتار در ما انسان‌هاست!

🖼یعنی استفاده از داده‌های بصری در کنار استفاده از سیستم شنیداری!!!
در این روش با نگاه کردن به حرکت لب‌های گوینده می‌توان برای درک قسمتی از گفتار استفاده کرد.

📃در این مقاله در سایت عصر گویش پرداز، ما به تفصیل به این موضوع پرداخته‌ایم.

#مقاله_علمی_عصر_گویش_پرداز

➡️ https://b2n.ir/a70013
⬅️"تشخيص گفتار خودكار برای كنترل ترافيك هوايی"

🛩🛬كنترلرهای ترافیك هوایی نقش مهمی در جداسازی هواپیماها در حریم هوایی و سطح فرودگاه دارند و مقدار قابل توجهی از مكالمات بین كنترلرها و خلبانان از طریق كانال‌های رادیویی است.

📝پس بازشناسی خودكار این مكالمات، باعث:
"بهبود امنیت سیستم"
"پیشرفت عملكردهای عملیاتی" 
"نظارت بر انطباق اطلاعات"
می‌شود.

‼️اما سیستم‌های بازشناسی گفتار خودكاری كه تا به امروز پیشنهاد شده اند دقت لازم برای استفاده‌های عملی رو دارا نبوده اند.

⁉️چرا؟
كانال‌های رادیویی نویز دار 
سرعت تكلم بالا 
لهجه‌های متنوع

📑🛫در روندی که ما در این مقاله می‌خوانیم، مدل تشخیص گفتار خودكاری را توسعه می‌دهیم كه: مكالمات خلبان با برج مراقبت را به صورت متن بازشناسی می‌كند. مدل پیشنهاد شده براساس ساختار سر به سر تشخیص گفتار به همراه یك شبكه عصبی عمیق است.


📃در این مقاله در سایت عصر گویش پرداز، ما به تفصیل به این موضوع پرداخته‌ایم.

#مقاله_علمی_عصر_گویش_پرداز
⬇️⬇️⬇️⬇️⬇️⬇️⬇️⬇️⬇️
https://b2n.ir/u35309
⬅️"روشی كارآمد برای جداسازی منابع صوتی با استفاده از تركيب شبكه عصبی كانولوشنال و بازگشتی"

🔉جداسازی منابع صوتی (مانند زمانی كه چند شخص همزمان صحبت می كنند) یكی از مباحثی است كه پژوهش‌های زیادی در زمینه آن انجام شده است.

🗂روش‌های متعددی برای این كار وجود دارد.

📍💡یكی از بهترین روش‌هایی كه تاكنون ارائه شده است، استفاده از شبكه عصبی عمیق است. LSTM یك نوع شبكه عصبی بازگشتی است كه برای سیگنال‌های طولانی به‌كار می‌رود. در این روش به دلیل ارتباط كامل میان لایه ها، آموزش شبكه كند است و اندازه مدل بزرگ خواهد شد.

📍💡یك روش دیگر استفاده از شبكه عصبی كانولوشنال است. این روش برای سیگنال‌های طولانی منجر به عمق بیشتر شده و فرآیند آموزش را سخت تر می كند.

📃در مقاله مطالعه شده دنبال روشی جدید هستیم كه با تركیب این دو شبكه عصبی بتوانیم مدل كارآمدتری بسازیم. ابتدا ساختار هر یك از شبكه ها را بررسی كرده، سپس درباره انواع شیوه اتصالات آن‌ها بحث می‌كنیم و بهترین روش را برای ساختار جدید ارائه می‌كنیم. سپس این شبكه را برای جداسازی صدای خواننده در موسیقی به‌كار می‌بریم.

#مقاله_علمی_عصر_گویش_پرداز
⬇️⬇️⬇️
https://b2n.ir/u58091
⬅️ "پیکره متنی فارسی ناب"

💻امروزه، پردازش زبان طبیعی به عنوان یکی از مهمترین حوزه های یادگیری ماشین و یادگیری عمیق مورد توجه قرار گرفته است. مدلهای پایه در این حوزه همان مدلهای زبانی هستند که به حجم زیادی از داده متنی نیاز دارند

📚 پیکره‌ متنی بزرگ از مهمترین نیازهای آموزش مدلهای شبکه عصبی عمیق است.ضرورت این مسئله به خصوص برای زبان‌های با منابع کمتر مثل فارسی،بیشتر احساس میشود

👥🎓ما،برای این مسئله راه‌حل پیکره ناب را معرفی کرده‌ایم

💡ناب مجموعه پاک‌سازی شده،به صورت کاملا متن باز و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است

📑ناب شامل حدود130گیگابایت دیتا متنی (250میلیون پاراگراف و 15میلیارد کلمه)است

🔸 ما پیکره ناب را بر روی مخزن دیتاست Huggingface قرار داده‌ایم،پس شما میتوانید با استفاده از تمام یا بخشی از ناب،برای آموزش مدل خود استفاده کنید🔻
huggingface.co/datasets/SLPL/naab

🔸همچنین نسخه خام پیکره ناب به همراه ابزار پاک‌سازی متن در اختیار عموم قرار گرفته🔻
huggingface.co/datasets/SLPL/naab-raw

مقاله به زبان انگلیسی
arxiv.org/abs/۲۲۰۸.۱۳۴۸۶
مقاله به زبان فارسی
b2n.ir/q46261