Tensorflow(@CVision)
12.5K subscribers
1.08K photos
181 videos
67 files
2.06K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
qualitative example of RRHF model
Graph Convolutional Networks:
Unleashing the power of Deep Learning for Graph data

🗓زمان برگزاری (به صورت آنلاین): شنبه 28 بهمن ماه 1402
ساعت 17:30 الی 19

📍آدرس اتاق مجازی: https://vc.sharif.edu/ch/cognitive


@irandeeplearning | @cvision
Physics-Encoded Graph Neural Networks for Deformation Prediction under Contact

https://mahdi-slh.github.io/DeformContact.html

#GNN #GCN #Graph
تغییر نام هوش مصنوعی گوگل از «بارد» به
«جمینی»


هوش مصنوعی مکالمه‌ای بزرگ (LLM) گوگل که پیش‌تر با نام «بارد» شناخته می‌شد، از این پس با نام «جمینی» به فعالیت خود ادامه خواهد داد.
نام «جمینی» به معنی «دو قلو» است و به دو مدل زبانی قدرتمند LaMDA و PaLM اشاره دارد که این هوش مصنوعی بر پایه آنها ساخته شده است.
انتظار می‌رود با این تغییر نام، شاهد ارتقای توانایی‌های این هوش مصنوعی در زمینه‌های مختلفی مانند تولید متن‌های خلاقانه و جذاب، پاسخ به سوالات به صورت دقیق و آموزنده، ترجمه زبان‌ها به صورت روان و طبیعی و... باشیم.

همچنین در روز های آینده باید منتظر فعال شدن قابلیت خلق و تولید تصاویر با کمک مدل ImageFX این شرکت باشیم!
This media is not supported in your browser
VIEW IN TELEGRAM
ارتقای ویدئو ها به سطحی جدید با هوش مصنوعی

شبکه FMA-NET، یک شبکه عصبی عمیق مبتنی بر مکانیزم توجه است، که دنیای پردازش ویدئو را متحول می‌کند. این ابزار قدرتمند با سرعتی باورنکردنی و کیفیتی بی‌نظیر، ویدئوهای شما را ارتقا می‌دهد و به سطحی جدید از وضوح و شفافیت می‌برد.

شبکه FMA-NET چه مزایایی دارد؟

سرعت خیره‌کننده: FMA-NET با اتکا به هوش مصنوعی، ویدئوهای شما را در چشم به هم زدنی ارتقا می‌دهد و از این نظر، ابزاری بی‌نظیر محسوب می‌شود.

کیفیت بی‌مثال: FMA-NET با دقت و ظرافت بی‌نظیری، جزئیات تصاویر را مانند ادیتوری ماهر بازیابی می‌کند و
وضوحی کریستالی به آنها می‌بخشد.

رفع تاری: FMA-NET با قدرت جادویی خود، تاری ناشی از لرزش دوربین، حرکت، و کمبود نور را به طور کامل از بین می‌برد و ویدئوهایی شفاف و واضح به شما تحویل می‌دهد.

لینک گیت پروژه
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
نسخه ۱ از TF-GNN (شبکه‌های عصبی گرافی در تنسورفلو) منتشر شد.

https://blog.tensorflow.org/2024/02/graph-neural-networks-in-tensorflow.html
آیا واقعا مدل‌های هوش مصنوعی با گذشت زمان بدتر میشن؟

جمیز زو میگه مدل‌هایی مثل چت‌جی‌پی‌تی در طول زمان به مراتب بدتر میشن و عمدتا این به دلیل تعامل با انسان‌هاست.

https://youtu.be/bslcuhWVZ48?si=eXGwa-9vRwiZLJU0

مقاله:
https://arxiv.org/pdf/2307.09009.pdf
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
هوش مصنوعی گوگل (Bard) رسما به Gemini (نامی که برای خانواده‌ی مدل‌های مالتی‌مودال گوگل استفاده می‌شد) تغییرنام داد.

به‌علاوه، جدیدترین و قدرت‌مند‌ترین مدل این خانواده (Ultra 1.0) نیز از طریق محصول Gemini Advanced با هزینه‌ی ماهیانه ۲۰ دلار (۲ ماه نخست رایگان) در دسترس قرار گرفت.

همچنین، یک اپ اندرویدی نیز برای دسترسی ساده‌تر به Gemini منتشر شده‌ست.

سایت جدید:
https://gemini.google.com/

اپ اندرویدی:
https://play.google.com/store/apps/details?id=com.google.android.apps.bard

ویدئوی معرفی:
https://youtu.be/b5Fh7TaTkEU?si=JEgqtIcffBABczsp

بلاگ‌پست معرفی:
https://blog.google/products/gemini/bard-gemini-advanced-app/

تکنیکال ریپورت مدل‌های Gemini:
https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
Forwarded from School of AI
شرکت Nvidia یک نرم‌افزار چت‌بات قابل نصب برروی Windows 11، موسوم به NVIDIA Chat with RTX ارائه کرده که از محتوای فایل‌های داخل رایانه، برای RAG استفاده می‌کند. به عبارت دیگر پاسخ پرسش‌های شما را با بررسی فایل‌هایی که به‌ش معرفی می‌کنید می‌دهد.
این چت‌بات برای اجرا نیاز به واحد گرافیکی GeForce RTX دارد.

https://youtu.be/gdsRJZT3IJw
Forwarded from School of AI
دیشب ساعت ۹ تصویر Yann LeCun دانشمند برجسته‌ی هوش مصنوعی بر روی برج خلیفه‌ی دوبی نقش بست.

لازم‌به‌ذکر است که ایشان در حال حاضر برای شرکت در نشست دولت جهانی (World Government Summit) در امارات متحده‌ی عربی حضور دارند.
Forwarded from School of AI
شرکت Ultralytics مدل بنیادین YOLO-World که یک OVD یا Open-Vocabulary Detector است، را معرفی کرد.

این مدل، مبتنی بر YOLOv8 است و نیاز به کلاس‌های از پیش تعریف شده برای تشخیص ندارد، بلکه می‌تواند به‌صورت Zero-shot این کلاس‌ها را درقالب یک پرامپت متنی، هنگام inference دریافت کرده و در تصویر پیدا کند. مثلا در ورودی به آن می‌گویید: “حیوان جونده‌ی کوچک به رنگ سفید که نامش موش است را پیدا کن”

این مدل در مقایسه با مدل بنیادین فیس‌بوک (SAM) بسیار ساده‌تر است و بنابراین می‌توان به راحتی از آن برای اپلیکیشن‌های real-time استفاده کرد.

استفاده از این مدل به‌سادگی استفاده از Ultralytics YOLOv8 است.

https://docs.ultralytics.com/models/yolo-world/
کدهای تخفیفی برای شرکت کننده های دوره مقدماتی و سایر دوره ها در نظر گرفته شده است که نحوه استفاده فردا در کانال قرار داده خواهد شد