Tensorflow(@CVision)
12.7K subscribers
1.09K photos
188 videos
67 files
2.07K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
#مقاله #سورس #کد

IMDB-WIKI – 500k+ face images with age and gender labels
pic: http://bit.ly/2rZNDJx

دیتاست سن و جنسیت افراد؛ جمع آوری شده از صفحات ویکی پدیا
+
مقاله و مدل در Caffe , و وزنهای آموزش دیده شده شبکه



https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

#Gender_prediction #age #Deep_Learning #dataset #model
#CNN #convolutional_neutral_network
#مقاله #سورس_کد

Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks
pic: http://bit.ly/2srFGOS
(Submitted on 11 Apr 2016)
#MTCNN

در الگوریتمهای قدیمی تشخیص چهره, موقعیت سر, حالات چهره، نور و ... تاثیر گذار بود و الگوریتم های موجود را با مشکل مواجه میکرد.
الگوریتمهایی نظیر Viola and Jones - Haar-cascade که در opencv پیاده سازی شده برای چهر های رو به رو و نزدیک رو به رو خوب کار میکند اما برای چهره هادر موقعیت ای دیگر کارایی ندارد!
تیم تحقیقاتی ماکروسافت با ارائه مقاله ای در سال 2014 با عنوان
Joint Cascade Face Detection and Alignment
با جنگل تصادفی این مشکل را تا حد زیادی برطرف کرد و سرعت هم تا حدود 30 میلی ثانیه برای تصاویر VGA بهبود داد، اما انتخاب ویژگی های دستی پرفورمنس را محدود کرده بود.

اما در این مقاله با کمک یادگیری عمیق دقت تا حد خوبی افزایش یافته و همانن مقاله ماکروسافت علاوه بر تشخیص کار face alignment هم انجام میشود.
در این روش 3 شبکه عصبی کانولوشنالی پشت سر هم و به صورت آبشاری قرار گرفته است
شبکه اول: بسیار سبک برای پیدا کردن تمامی نواحی مشکوک به وجود چهره.
شبکه دوم : این شبکه از از خروجی شبکه اول ورودی میگیرد؛ نواحی اشتباه پیدا شده را حذف میکند.
شبکه سوم: کاری شبیه یه شبکه دوم بر روی نواحی باقی مانده, همچنین پیدا کردن landmark های چهره نظیر چشم ها و بینی و alignment نقاط.



🕐Runtime efficiency:
It takes 16fps on a 2.60GHz CPU and 99fps on GPU (Nvidia Titan Black)

🔗abstract:
https://arxiv.org/abs/1604.02878

🔗Paper:
https://arxiv.org/pdf/1604.02878

🔗Project Page:
https://kpzhang93.github.io/MTCNN_face_detection_alignment/

🔗codes:
⚙️#Matlab / #Caffe implementation :
http://bit.ly/2rvkr9Q
⚙️#Python / #Tensorflow implementation :
http://bit.ly/2t1fB6e

#face #face_detection #face_alignment #MTCNN
#deep_learning #cnn #convolutional_neutral_network
#مقاله منتشر شده توسط گوگل

#MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
(Submitted on 17 Apr 2017)

We present a class of efficient models called MobileNets for #mobile and embedded #vision applications. MobileNets are based on a streamlined architecture that uses depth-wise separable convolutions to build light weight deep neural networks. We introduce two simple global hyper-parameters that efficiently trade off between #latency and #accuracy. These hyper-parameters allow the model builder to choose the right sized model for their application based on the constraints of the problem. We present extensive experiments on resource and accuracy tradeoffs and show strong performance compared to other popular models on ImageNet classification. We then demonstrate the effectiveness of MobileNets across a wide range of applications and use cases including object detection, finegrain classification, face attributes and large scale geo-localization.

🔗 https://arxiv.org/pdf/1704.04861.pdf

#deep_learning #cnn #convolutional_neutral_network
#مقاله

Network Dissection: Quantifying Interpretability of Deep Visual Representations
(Submitted on 19 Apr 2017)
pic: http://bit.ly/2tlfHbv

✔️Our paper investigates three questions:

-What is a disentangled representation, and how can its factors be quantified and detected?
-Do interpretable hidden units reflect a special alignment of feature space, or are interpretations a chimera?
-What conditions in state-of-the-art training lead to representations with greater or lesser entanglement?

🔗abstract:
https://arxiv.org/abs/1704.05796

🔗Paper:
http://netdissect.csail.mit.edu/final-network-dissection.pdf

🔗Project Page (code + data):
http://netdissect.csail.mit.edu/

#deep_learning #CNN
فیلمهای ترم بهار 2017 کورس شبکه‌های عصبی کانولوشنالی و یادگیری عمیق در بینایی ماشین دانشگاه #استنفورد

Lecture Collection | Convolutional Neural Networks for Visual Recognition (Spring 2017)

https://www.youtube.com/playlist?list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv

مرتبط با: https://t.me/cvision/164

#course #toutorial #stanford #cnn #Convolutional #Visual_Recognition
مدل VGG16 آموزش داده شده با 1.8 میلیون تصویر دیتاست places

VGG16-places365 model for scene classification, written in Keras 2.0

https://github.com/GKalliatakis/Keras-VGG16-places365

You have just found the #Keras (2.0) implementation of the pre-trained VGG 16 convolutional-layer #CNN model on Places365-Standard (~1.8 million images from 365 scene categories).

#pre_train #keras #places
#مقاله #سورس_کد

Finding Tiny Faces (CVPR 2017)

pic: https://github.com/cydonia999/Tiny_Faces_in_Tensorflow/raw/master/images/selfie.jpg

🕐Runtime efficiency:
Resnet101-based detector runs at 1.4FPS on
1080p resolution and 3.1FPS on 720p resolution.

🔗abstract:
https://arxiv.org/abs/1612.04402

🔗Paper:
https://arxiv.org/pdf/1612.04402

🔗Project Page:
https://www.cs.cmu.edu/~peiyunh/tiny/

🔗codes:
⚙️#Matlab / #matconvnet implementation :
https://github.com/peiyunh/tiny
⚙️#Python / #Tensorflow implementation :
https://github.com/cydonia999/Tiny_Faces_in_Tensorflow


مرتبط با مقاله mtcnn
https://t.me/cvision/249

#face #face_detection
#deep_learning #cnn #convolutional_neutral_network
#مقاله

این مقاله در حال حاضر بهترین الگوریتم تشخیص چهره در چالش WIDER است.

PyramidBox: A Context-assisted Single Shot Face Detector

https://arxiv.org/abs/1803.07737

#PyramidBox achieves superior performance among the state-of-the-art on the two common face detection benchmarks, #FDDB and #WIDER FACE.

#face #face_detection #deep_learning #cnn #convolutional_neutral_network
#خبر

فیس بوک با میلیاردها تصویر آپلود شده در اینستاگرام یک شبکه کانولوشنالی را آموزش داد!

فیس بوک اخیرا با استفاده از 3.5 میلیارد تصویر اینستاگرام، در 17000 هشتگ مختلف یک شبکه عصبی کانولوشنالی را آموزش داده است.
این شبکه بر روی داده های تست چالش ImageNet به دقت 85.4 دست یافته است، که بهترین مدل قبل از این به دقت 83.1 دست یافته بود!

نکته قابل تامل نویزی بودن هشتگهای اینستاگرام در مقابل مجموعه داده ی بادقت برچسب زده شده ی آموزشی imagenet است.

به عقیده فیس بوک:

"As training data sets get larger, the need for weakly supervised — and, in the longer term, unsupervised — learning will become increasingly vital," said Facebook. "Understanding how to offset the disadvantages of noisier, less curated labels is critical to building and using larger-scale training sets."


https://www.engadget.com/2018/05/02/facebook-trained-image-recognition-ai-instagram-pics/

https://www.wired.com/story/your-instagram-dogs-and-cats-are-training-facebooks-ai/

#classification #image_recognition
#convolutional_neutral_network #cnn
#deep_learning #facebook #imagenet
#سورس_کد
MTCNN C++ implementation with NVIDIA TensorRT Inference accelerator SDK
https://github.com/PKUZHOU/MTCNN_TensorRT

This project can run Pnet and Rnet, the speed is very fast. Just using cmake to build this project

مرتبط با https://t.me/cvision/249

#face #face_detection #face_alignment #MTCNN
#deep_learning #cnn #convolutional_neutral_network
#tensortRT
image_2019-06-08_20-30-35.png
1 MB
#CheatSheet #CNN
برگه تقلب نکات مهم شبکه های کانولوشنالی معروف