Tensorflow(@CVision)

Hinton is so wrong about this and so far behind the times that he doesn’t realize that @ylecun moved over to my side of this argument.

Tech bros don’t seem to realize that, either 🤷‍♂️

Given vast datasets, LLMs approximate well, but their understanding…

4.3K viewsV, 17:22

qualitative example of RRHF model

3.8K viewsAli B, 00:13

Tensorflow(@CVision)

Graph Convolutional Networks:
Unleashing the power of Deep Learning for Graph data

🗓زمان برگزاری (به صورت آنلاین): شنبه 28 بهمن ماه 1402
⏱ساعت 17:30 الی 19

📍آدرس اتاق مجازی: https://vc.sharif.edu/ch/cognitive

@irandeeplearning | @cvision

4.9K viewsAlireza Akhavan, 13:31

Tensorflow(@CVision)

Physics-Encoded Graph Neural Networks for Deformation Prediction under Contact

https://mahdi-slh.github.io/DeformContact.html

#GNN #GCN #Graph

4.3K viewsAlireza Akhavan, 17:05

Tracking Any Point (TAP)
https://github.com/google-deepmind/tapnet

🖥Colab Demo:
Standard TAPIR | Online TAPIR | Rainbow Visualization

4.0K viewsAlireza Akhavan, edited 17:22

Tensorflow(@CVision)

تغییر نام هوش مصنوعی گوگل از «بارد» به
«جمینی»

هوش مصنوعی مکالمه‌ای بزرگ (LLM) گوگل که پیش‌تر با نام «بارد» شناخته می‌شد، از این پس با نام «جمینی» به فعالیت خود ادامه خواهد داد.
نام «جمینی» به معنی «دو قلو» است و به دو مدل زبانی قدرتمند LaMDA و PaLM اشاره دارد که این هوش مصنوعی بر پایه آنها ساخته شده است.
انتظار می‌رود با این تغییر نام، شاهد ارتقای توانایی‌های این هوش مصنوعی در زمینه‌های مختلفی مانند تولید متن‌های خلاقانه و جذاب، پاسخ به سوالات به صورت دقیق و آموزنده، ترجمه زبان‌ها به صورت روان و طبیعی و... باشیم.

همچنین در روز های آینده باید منتظر فعال شدن قابلیت خلق و تولید تصاویر با کمک مدل ImageFX این شرکت باشیم!

4.0K views`Șίɴλ`, edited 14:53

Tensorflow(@CVision)

0:39

This media is not supported in your browser

VIEW IN TELEGRAM

ارتقای ویدئو ها به سطحی جدید با هوش مصنوعی

شبکه FMA-NET، یک شبکه عصبی عمیق مبتنی بر مکانیزم توجه است، که دنیای پردازش ویدئو را متحول می‌کند. این ابزار قدرتمند با سرعتی باورنکردنی و کیفیتی بی‌نظیر، ویدئوهای شما را ارتقا می‌دهد و به سطحی جدید از وضوح و شفافیت می‌برد.

شبکه FMA-NET چه مزایایی دارد؟

⚙ سرعت خیره‌کننده: FMA-NET با اتکا به هوش مصنوعی، ویدئوهای شما را در چشم به هم زدنی ارتقا می‌دهد و از این نظر، ابزاری بی‌نظیر محسوب می‌شود.

⚙ کیفیت بی‌مثال: FMA-NET با دقت و ظرافت بی‌نظیری، جزئیات تصاویر را مانند ادیتوری ماهر بازیابی می‌کند و
وضوحی کریستالی به آنها می‌بخشد.

⚙ رفع تاری: FMA-NET با قدرت جادویی خود، تاری ناشی از لرزش دوربین، حرکت، و کمبود نور را به طور کامل از بین می‌برد و ویدئوهایی شفاف و واضح به شما تحویل می‌دهد.

لینک گیت پروژه

4.9K views`Șίɴλ`, edited 15:25

Tensorflow(@CVision)

Forwarded from School of AI

This media is not supported in your browser

VIEW IN TELEGRAM

نسخه ۱ از TF-GNN (شبکه‌های عصبی گرافی در تنسورفلو) منتشر شد.

https://blog.tensorflow.org/2024/02/graph-neural-networks-in-tensorflow.html

3.9K viewsAlireza Akhavan, 15:38

Tensorflow(@CVision)

آیا واقعا مدل‌های هوش مصنوعی با گذشت زمان بدتر میشن؟

جمیز زو میگه مدل‌هایی مثل چت‌جی‌پی‌تی در طول زمان به مراتب بدتر میشن و عمدتا این به دلیل تعامل با انسان‌هاست.

https://youtu.be/bslcuhWVZ48?si=eXGwa-9vRwiZLJU0

مقاله:
https://arxiv.org/pdf/2307.09009.pdf

YouTube

James Zou: one of the most prolific and creative A.I. researchers in both life science and medicine

A podcast with James Zou, a Stanford computer scientist who is lighting it up in life science and medical A.I. Recent papers discussed in this podcast include degradation of GPT-4 performance, using large language models for peer review, and taking more than…

5.2K viewsV, 12:26

Tensorflow(@CVision)

Forwarded from School of AI

This media is not supported in your browser

VIEW IN TELEGRAM

هوش مصنوعی گوگل (Bard) رسما به Gemini (نامی که برای خانواده‌ی مدل‌های مالتی‌مودال گوگل استفاده می‌شد) تغییرنام داد.

به‌علاوه، جدیدترین و قدرت‌مند‌ترین مدل این خانواده (Ultra 1.0) نیز از طریق محصول Gemini Advanced با هزینه‌ی ماهیانه ۲۰ دلار (۲ ماه نخست رایگان) در دسترس قرار گرفت.

همچنین، یک اپ اندرویدی نیز برای دسترسی ساده‌تر به Gemini منتشر شده‌ست.

سایت جدید:
https://gemini.google.com/

اپ اندرویدی:
https://play.google.com/store/apps/details?id=com.google.android.apps.bard

ویدئوی معرفی:
https://youtu.be/b5Fh7TaTkEU?si=JEgqtIcffBABczsp

بلاگ‌پست معرفی:
https://blog.google/products/gemini/bard-gemini-advanced-app/

تکنیکال ریپورت مدل‌های Gemini:
https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

5.4K viewsAlireza Akhavan, 10:36

Tensorflow(@CVision)

ضبط و تدوین دوره جدید "جامع دیپ لرنینگ" با سطح مقدماتی و متوسط بعد از چند ماه تلاش تمام شده است. ان شاء الله دوره بعد اصلاح خطاهای تدوینی به زودی تا ۱۵ روز پیش رو روی سایت برای فروش قرار خواهد گرفت این دوره نزدیک ۴۰ ساعت و در ۹ فصل ضبط شده است

شکر خدا کارهای دوره جدید به پایان رسیده و پس از آپلود فایلها روی سایت قرار میگیرد.
لینک دوره و جزئیات بیشتر اطلاع رسانی میگردد

4.5K viewsAlireza Akhavan, edited 21:18

Tensorflow(@CVision)

Forwarded from School of AI

شرکت Nvidia یک نرم‌افزار چت‌بات قابل نصب برروی Windows 11، موسوم به NVIDIA Chat with RTX ارائه کرده که از محتوای فایل‌های داخل رایانه، برای RAG استفاده می‌کند. به عبارت دیگر پاسخ پرسش‌های شما را با بررسی فایل‌هایی که به‌ش معرفی می‌کنید می‌دهد.
این چت‌بات برای اجرا نیاز به واحد گرافیکی GeForce RTX دارد.

https://youtu.be/gdsRJZT3IJw

YouTube

Create A Personalized AI Chatbot with Chat With RTX

Create a personalized chatbot with the Chat with RTX tech demo. Accelerated by TensorRT-LLM and Tensor Cores, you can quickly get tailored info from your files and content. Just connect your data to an LLM on RTX-Powered PCs for local, fast, generative AI.…

4.2K viewsAlireza Akhavan, 16:06

Tensorflow(@CVision)

https://blog.roboflow.com/what-is-yolo-world/

Roboflow Blog

YOLO-World: Real-Time, Zero-Shot Object Detection

YOLO-World is a zero-shot, real-time object detection model.

4.0K viewsAlireza Akhavan, 09:52

Tensorflow(@CVision)

Forwarded from School of AI

دیشب ساعت ۹ تصویر Yann LeCun دانشمند برجسته‌ی هوش مصنوعی بر روی برج خلیفه‌ی دوبی نقش بست.

لازم‌به‌ذکر است که ایشان در حال حاضر برای شرکت در نشست دولت جهانی (World Government Summit) در امارات متحده‌ی عربی حضور دارند.

3.4K viewsAlireza Akhavan, 15:15

Tensorflow(@CVision)

Forwarded from School of AI

شرکت Ultralytics مدل بنیادین YOLO-World که یک OVD یا Open-Vocabulary Detector است، را معرفی کرد.

این مدل، مبتنی بر YOLOv8 است و نیاز به کلاس‌های از پیش تعریف شده برای تشخیص ندارد، بلکه می‌تواند به‌صورت Zero-shot این کلاس‌ها را درقالب یک پرامپت متنی، هنگام inference دریافت کرده و در تصویر پیدا کند. مثلا در ورودی به آن می‌گویید: “حیوان جونده‌ی کوچک به رنگ سفید که نامش موش است را پیدا کن”

این مدل در مقایسه با مدل بنیادین فیس‌بوک (SAM) بسیار ساده‌تر است و بنابراین می‌توان به راحتی از آن برای اپلیکیشن‌های real-time استفاده کرد.

استفاده از این مدل به‌سادگی استفاده از Ultralytics YOLOv8 است.

https://docs.ultralytics.com/models/yolo-world/

3.8K viewsAlireza Akhavan, 15:15

Tensorflow(@CVision)

مدل متن به ویدیو OpenAI معرفی شد!
این مدل که اسمش Sora هست میتونه ویدیو‌هایی به طول یک دقیقه تولید کنه!

http://openai.com/sora

https://x.com/sama/status/1758193609927721350?s=46

https://x.com/model_mechanic/status/1758196079663988823?s=46

https://x.com/gdb/status/1758193811489243408?s=46

https://x.com/mkbhd/status/1758200479224410420?s=46

https://x.com/sama/status/1758218820542763012?s=46

Openai

Sora: Creating video from text

8.4K views(◕‿◕), 21:03

Tensorflow(@CVision)

https://openai.com/research/video-generation-models-as-world-simulators

Openai

Video generation models as world simulators

We explore large-scale training of generative models on video data. Specifically, we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios. We leverage a transformer architecture that operates…

5.0K views(◕‿◕), 03:05