Tensorflow(@CVision)
12.7K subscribers
1.09K photos
188 videos
67 files
2.07K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
http://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
#مقاله #سورس_کد
The Universal Sentence Encoder is now in TensorFlow.js! USE gives you embeddings for text. It's a great starting point for doing sentiment analysis, topic classification, measuring textual similarity, etc.

https://github.com/tensorflow/tfjs-models/tree/master/universal-sentence-encoder

#nlp #tensorflow
This media is not supported in your browser
VIEW IN TELEGRAM
این دموی completion آنلاین را با GPT-2 پیاده سازی کردند...
https://transformer.huggingface.co/

مطالب مرتبط:
https://t.me/cvision/1026
https://t.me/cvision/1035

#Transformer #NLP #GPT2
Language, trees, and geometry in neural networks

A visualization technique to understand BERT.
https://twitter.com/burkov/status/1139391818443808769

#bert #NLP
#مقاله #پیاده_سازی
XLNet: Generalized Autoregressive Pretraining for Language Understanding



#XLNet outperforms #BERT on 20 tasks, often by a large margin, and achieves state-of-the-art results on 18 tasks including question answering, natural language inference, sentiment analysis, and document ranking. Code and comparisons here:

سورس کد (تنسرفلو)
https://github.com/zihangdai/xlnet

مقاله
https://arxiv.org/abs/1906.08237v1

#NLP
#مقاله #پیاده_سازی
XLNet: Generalized Autoregressive Pretraining for Language Understanding



#XLNet outperforms #BERT on 20 tasks, often by a large margin, and achieves state-of-the-art results on 18 tasks including question answering, natural language inference, sentiment analysis, and document ranking. Code and comparisons here:

سورس کد (تنسرفلو)
https://github.com/zihangdai/xlnet

مقاله
https://arxiv.org/abs/1906.08237v1

#NLP
طبقه بندی متن با استفاده از Flair

Flair
delivers state-of-the-art performance in solving NLP problems such as named entity recognition (NER), part-of-speech tagging (PoS), sense disambiguation and text classification. It’s an NLP framework built on top of PyTorch.

لینک پست: https://towardsdatascience.com/text-classification-with-state-of-the-art-nlp-library-flair-b541d7add21f
کد: https://github.com/zalandoresearch/flair

#text_classification #nlp #flair
#خبر
ابزاری برای کمک به تکمیل کد در حین برنامه‌نویسی (code autocompletion) مبتنی بر مدل GPT-2 آموزش داده شده روی حدود ۲ میلیون فایل از گیت‌هاب:
https://tabnine.com/blog/deep?utm_campaign=NLP%20News&utm_medium=email&utm_source=Revue%20newsletter


مرتبط با:
https://t.me/cvision/1035
https://t.me/cvision/1026
🙏Thanks to: @Machine_Learnings

#nlp
آخرین ریلیز Hugging Face در حوزه #NLP

به روز ترین معماری های عام منظوره مانند (BERT, GPT-2, RoBERTa, XLM, DistilBert, XLNet...) برای درک زبان طبیعی (NLU) و تولید زبان طبیعی (NLG) برای بیش از 32 مدل از پیش آموزش داده شده و برای بیش از 100 زبان با قابلیت جابه‌جایی بین دو فریم‌ورک TensorFlow 2.0 و PyTorch

Code: https://github.com/huggingface/transformers
کد و وزن های مدل زبانی 1.5 میلیارد پارامتری GPT-2 منتشر شد...

OpenAI announced the final staged release of its 1.5 billion parameter language model GPT-2, along with all associated code and model weights

لینک خبر:
https://twitter.com/OpenAI/status/1191764001434173440
لینک بلاگ پست:
https://medium.com/syncedreview/openai-releases-1-5-billion-parameter-gpt-2-model-c34e97da56c0

#language_model #gpt2 #nlp #openai
This media is not supported in your browser
VIEW IN TELEGRAM
با این مدل آموزش داده شده توسط BERT در مرورگر سوال مفهومی بپرسید!

Exploring helpful uses for BERT in your browser with Tensorflow.js

https://blog.tensorflow.org/2020/03/exploring-helpful-uses-for-bert-in-your-browser-tensorflow-js.html?linkId=84231860

#NLP #tfjs
#مجموعه_داده شامل متن #فارسی

Wiki-40B: Multilingual Language Model Dataset

https://research.google/pubs/pub49029/

#NLP
#مجموعه_داده #nlp
مجموعه دادهٔ بزرگ فارسی محاوره‌ای

- شامل ۱۲۰ میلیون جمله فارسی محاوره‌ای از ۲۷ میلیون توئیت
- به همراه درخت اشتقاق، برچسب‌گذاری دستوری (جزء کلام)، قطبیت احساسات و ترجمه هر جمله در زبان انگلیسی، آلمانی، چکی، ایتالیایی و هندی

سایت این پروژه:
https://iasbs.ac.ir/~ansari/lscp/
همچنین شما می‌توانید از http://hdl.handle.net/11234/1-3195 دانلود کنید.

در گوگل کولب نگاهی به این مجموعه داده و پیش‌پردازش های مقدماتی آن بیندازید:
https://colab.research.google.com/drive/1VoY2BjOdI0thx6bpOK5zAxQiP0ry4V70

🙏Thanks to: Alireza Asadi
@cvision
مقاله و کد مدل زبانی GPT-3 منتشر شد!

GPT-3 is an autoregressive language model and trained with 175 billion parameters, 10x more than any previous non-sparse language model before.

Language Models are Few-Shot Learners: https://arxiv.org/abs/2005.14165

GitHub: https://github.com/openai/gpt-3

GPT-3 achieves strong performance on many NLP datasets, including translation, question-answering, and cloze tasks as well as several tasks that require on-the-fly reasoning or domain adaptation, such as unscrambling words, using a novel word in a sentence, or performing 3-digit arithmetics.

#nlp #gpt3
آمازون (Amazon)‌ خبر داده چندتا از کورس‌های یادگیری ماشین خودش که برای آموزش کارکنان‌شون تهیه شده‌بودن رو برای استفاده عمومی در اختیار گذاشته.

https://www.amazon.science/latest-news/machine-learning-course-free-online-from-amazon-machine-learning-university

این آموزش‌ها که در سه بخش بینایی‌ماشین، پردازش زبان طبیعی و کار با جداول داده هستند رو می‌تونید در صفحه یوتیوب Amazon's Machine Learning University در آدرس زیر مشاهده کنید:

https://www.youtube.com/channel/UC12LqyqTQYbXatYS9AA7Nuw


#coruse #free #NLP #computer_vision #ML
#مجموعه_داده #دیتاست #nlp #فارسی
پیکره‌ متنی ناب.

این پیکره مجموعه پاک‌سازی شده و قابل استفاده مستقیم برای محققان حوزه پردازش زبان طبیعی در فارسی است. این مجموعه شامل حدود ۱۳۰ گیگابایت دیتا متنی شامل ۲۵۰ میلیون پاراگراف و ۱۵ میلیارد کلمه است.
همچنین نسخه خام ناب به همراه اسکریپت پیش پردازش (استفاده شده برای تمیز‌سازی داده) در اختیار عموم قرار گرفته تا به کمک آن بتوانید نسخه تمیز شده‌ پیکره خود را بسازید.
از این پیکره می‌توان برای fine-tune کردن مدل‌های زبانی - که در اصل برای زبان انگلیسی تهیه شده‌اند - برای زبان فارسی نیز استفاده کرد. از جمله این مدل‌های زبانی می‌توان به BERT, BART, T5 و ... اشاره کرد.

+ https://arxiv.org/abs/2208.13486
+ https://huggingface.co/datasets/SLPL/naab
+ https://huggingface.co/datasets/SLPL/naab-raw

@cvision
Stanford University NLP With Deep learning course, Winter 2023 is finally out with notes & hands-on code to practice, do check the link 👇

https://web.stanford.edu/class/cs224n/index.html?utm_source=substack&utm_medium=email#schedule

#منبع #سورس_کد
#nlp #deeplearning #ai
New NLP course by Stanford

Stanford University released yesterday a new course -
Intro & Evolution of Natural Language Understanding
(#XCS224U), taught by Prof. Christopher Potts.
As the name implies, the course focuses on core NLP concepts and theory, natural language processing, and machine learning topics. That includes
Domain adaptation for supervised sentiment Retrieval augmented in-context learning
Advanced behavioral evaluation
Analysis methods #NLP methods

https://www.youtube.com/playlist?list=PLoROMvodv4rOwvldxftJTmoR3kRcWkJBp