Tensorflow(@CVision)
12.3K subscribers
1.08K photos
181 videos
67 files
2.06K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
#دیتاست #face
محققان دانشگاه آکسفورد ورژن 2 دیتاست VGGFace را با 3.31میلیون تصویر از 9131 فرد مختلف ارائه کردند.
این تصاویر با کمک سرچ تصویر گوگل جمع آوری شده و در تغییرات مختلف برای هر فرد نظیر سن، جهت، نو و ... هستند.
این دیتاست شامل افرددا مختلفی نظیر سیاست مداران، ورزشکاران، بازیگران و ... است و به طور تقریبی از هر فرد 362 تصویر مختلف موجود است.

🔗VGGFace2 Dataset:
http://www.robots.ox.ac.uk/~vgg/data/vgg_face2/


🔵Pretrain models:
🔗Caffe model:
http://www.robots.ox.ac.uk/~vgg/data/vgg_face2/vggface2_caffe_model.tar.gz
🔗MatConvNet model:
http://www.robots.ox.ac.uk/~vgg/data/vgg_face2/vggface2_matconvnet_model.tar.gz
#خبر #دیتاست

Public Data Release of Stack Overflow’s 2018 Developer Survey

سایت stack overflow دیتاستش شامل نظرسنجی ها از تکنولوژی ها و اطلاعات شغل مورد علاقه و ... را از بیش از 100.000 کاربر منتشر کرده است. با همکاری امسال stack overflow و kaggle این دیتاست را اکنون میتوانید از هر کدام از این دو سایت دانلود کرده و برای خودتان به تحلیل اطلاعات بپردازید.

https://stackoverflow.blog/2018/05/30/public-data-release-of-stack-overflows-2018-developer-survey/
#دیتاست
جزوه، کورس - مقاله و دیتاست در تورنت!
بیش از 25 ترابایت دیتاست در تورنت!
شامل
- Breast Cancer Cell Segmentation
- Liver Tumor Segmentation
- MRI Lesion Segmentation in Multiple Sclerosis
- Electron Microscopy, Hippocampus
- Digital Surface & Digital Terrain Model
و ...

لینک

http://academictorrents.com/
#مقاله #سورس_کد #دیتاست

بهتر از هر الگوریتم لبه یابی لبه های تصویر را استخراج کنید!

Photo-Sketching: Inferring Contour Drawings from Images (Source code + dataset)
[pic: http://www.cs.cmu.edu/~mengtial/proj/sketch/img/Wild-half.jpg ]
Photo-Sketching: Inferring Contour Drawings from Images. Interesting data-driven approach to generate contour drawing versions of photos that resemble rough human sketches. Can be a nice way to generate data to train vector drawing models like sketch-rnn.

Paper:
https://arxiv.org/abs/1901.00542
Code:
https://github.com/mtli/PhotoSketch
Project Page:
http://www.cs.cmu.edu/~mengtial/proj/sketch/

#gan #edge
#خبر #مجموعه_داده

اولین #دیتاست دیوار ریلیز شد.
این دیتاست شامل حدوداً یک میلیون پست در سایت دیوار است.
Published on 2019/01/30


https://research.cafebazaar.ir/visage/datasets/
ساخت و تولید دیتاست مصنوعی متن فارسی و انگلیسی با لیبل به صورت کاملا اتوماتیک و آسان.
یک تولید کننده دیتاست متن فارسی و انگلیسی با قابلیت انتخاب انواع فونت ها و استایل ها و متون رندوم یا انتخابی از دیکشنری و منبع دیتاست دلخواهتان با تعداد دیتای تولید شده دلخواه
با کمک این ابزار میتوانید دیتاست مورد نیاز برای آموزش شبکه های عمیق پردازش متن را به سرعت و آسان تولید کنید

A synthetic data generator for text recognition with latin, arabic and persian text support

https://github.com/amirmgh1375/TextRecognitionDataGenerator

#آموزش #سورس_کد #دیتاست
#synthetic_data #text_recognition #ctc
#ocr
#dataset_generator
Forwarded from Shenasa-ai.ir
#خبر #آموزش #معرفی_دیتاست
معرفی دیتاست objectron گوگل برای درک سه بعدی اشیاء (تصویر این پست)
3D Object Understanding
https://github.com/google-research-datasets/Objectron/

برخلاف دیتاست های قبلی تشخیص اشیاء که همگی محدوده ی تصاویر دو بعدی را مشخص کرده بودند، این دیتاست که توسط گوگل منتشر شده بر روی فریم های متوالی محدوده های سه بعدی اشیاء را مشخص کرده است.
این مجموعه داده شامل 15000 ویدیو و 4 میلیون تصویر در کلاس‌های زیر است.
bikes, books, bottles, cameras, cereal boxes, chairs, cups, laptops, shoes
آموزش دانلود و استفاده از این مجموعه داده را می‌توانید از اینجا ببینید.

همچنین مدل‌های پایه ای روی این دیتاست توسعه داده شده، مدل قبلی این تیم که به صورت single-shot بود را در اینجا ببینید. اما مدل جدید منتشر شده دو مرحله ای است که در مرحله ی اول فقط محدوده ی دو بعدی شی در آن فریم را محاسبه کرده و سپس مرحله ی دوم که از بریده شده ی مرحله ی قبل تغذیه میگردد، به عنوان خروجی محدوده ی سه بعدی آن فریم را به همراه پیشنهاد محدوده ی فریم بعدی را به ما خواهد داد.
این روش جدید حدود 3 برابر از روش تک مرحله ای قبل سریعتر است و آموزش لیبل گذاری ویدیو برای این کار را از اینجا میتوانید مشاهده کنید.

مطالعه بیشتر:
https://medium.com/swlh/introducing-objectron-the-next-phase-in-3d-object-understanding-8432bf285345



https://github.com/google-research-datasets/objectron

#دیتاست #دیتا #dataset $dta #object_detection #Objectron
———————————
مجموعه دانش بنیان شناسا ( داده پویان آلما)
http://shenasa.ai
http://shenasa-ai.ir
ما را دنبال کنید:

آپارات:
https://www.aparat.com/shenasa.ai
لینکدین:
https://www.linkedin.com/company/shenasa-ai/
اینستاگرام:
https://www.instagram.com/shenasa.ai

کانال تلگرام:
https://t.me/shenasa_ai

اخبار و آموزش های تخصصی هوش مصنوعی در تلگرام: @cvision
دیتاست-اسامی-نام-های-فارسی.csv
86 KB
#مجموعه_داده #دیتاست

اسامی فارسی و درصد استفاده از آنها
#مجموعه_داده #دیتاست #nlp #فارسی
پیکره‌ متنی ناب.

این پیکره مجموعه پاک‌سازی شده و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است. این مجموعه شامل حدود ۱۳۰ گیگابایت دیتا متنی شامل ۲۵۰ میلیون پاراگراف و ۱۵ میلیارد کلمه است.
همچنین نسخه خام ناب به همراه اسکریپت پیش پردازش (استفاده شده برای تمیز‌سازی داده) در اختیار عموم قرار گرفته تا به کمک آن بتوانید نسخه تمیز شده‌ پیکره خود را بسازید.
از این پیکره می‌توان برای fine-tune کردن مدل‌های زبانی - که در اصل برای زبان انگلیسی تهیه شده‌اند - برای زبان فارسی نیز استفاده کرد. از جمله این مدل‌های زبانی می‌توان به BERT, BART, T5 و ... اشاره کرد.

+ https://arxiv.org/abs/2208.13486
+ https://huggingface.co/datasets/SLPL/naab
+ https://huggingface.co/datasets/SLPL/naab-raw

@cvision
Forwarded from Shenasa-ai.ir
This media is not supported in your browser
VIEW IN TELEGRAM
این #دیتاست منتشر شد

Diverse hand gesture recognition dataset

📄Paper: https://link.springer.com/article/10.1007/s11042-023-17268-8

🔗Dataset link | mirror

🎞 Instagram

————————-
مجموعه دانش بنیان شناسا ( داده پویان آلما):
http://shenasa.ai
http://shenasa-ai.ir
@shenasa_ai