پردازش زبان طبیعی و زبان‌شناسی رایانه‌ای

۵ مطلب با کلمه‌ی کلیدی «یادگیری بی‌ناظر» ثبت شده است

کتاب: تحلیل بیزی در پردازش زبان طبیعی

این کتاب را به تازگی انتشارات مرگان و کلی‌پول منتشر کرده است. ۳ سال پیش پیش‌نویس این کتاب به عنوان جزوهٔ یکی از درس‌های ما بود با همین عنوان. با وجود ابهام در بعضی بخش‌ها، این کتاب به نظرم الان جامع‌ترین مرجع برای این موضوع است (اگر به کتاب دسترسی ندارید به بنده ایمیل بفرستید)


 دریافت کتاب


Bayesian Analysis in Natural Language Processing

Shay Cohen (University of Edinburgh)


Natural language processing (NLP) went through a profound transformation in the mid-1980s when it shifted to make heavy use of corpora and data-driven techniques to analyze language. Since then, the use of statistical techniques in NLP has evolved in several ways. One such example of evolution took place in the late 1990s or early 2000s, when full-fledged Bayesian machinery was introduced to NLP. This Bayesian approach to NLP has come to accommodate for various shortcomings in the frequentist approach and to enrich it, especially in the unsupervised setting, where statistical learning is done without target prediction examples.


We cover the methods and algorithms that are needed to fluently read Bayesian learning papers in NLP and to do research in the area. These methods and algorithms are partially borrowed from both machine learning and statistics and are partially developed "in-house" in NLP. We cover inference techniques such as Markov chain Monte Carlo sampling and variational inference, Bayesian estimation, and nonparametric modeling. We also cover fundamental concepts in Bayesian statistics such as prior distributions, conjugacy, and generative modeling. Finally, we cover some of the fundamental modeling techniques in NLP, such as grammar modeling and their use with Bayesian analysis.

۲۶ خرداد ۹۵ ، ۰۰:۴۲ ۰ نظر موافقین ۰ مخالفین ۰
محمدصادق رسولی

ارائه: روش‌های تجزیهٔ بی‌ناظر وابستگی

ارائهٔ امتحان ارائهٔ مقالات دورهٔ دکتری را بارگذاری کرده‌ام. موضوع در مورد روش‌های توسعهٔ تجزیه‌گر وابستگی بدون داشتن پیکره‌های نحوی است.


دریافت


۱۷ فروردين ۹۵ ، ۰۵:۴۷ ۰ نظر موافقین ۰ مخالفین ۰
محمدصادق رسولی

مقاله: مردم هر جای جهان چقدر خوشحال یا ناراحتند

تحلیل احساسات یکی از کاربردهای پردازش زبان طبیعی است. در این مقاله، علاوه بر استفاده از الگوی بیزی بر تحلیل احساسات در مطالب توئیتر، میزان شادی یا ناراحتی مردم دنیا را با استفاده از روش بیزی مورد مقایسه قرار داده است.

Davies, Alexander, and Zoubin Ghahramani. "Language-independent Bayesian sentiment mining of Twitter.",  The 5th SNA-KDD Workshop '11 (SNA-KDD'11), August 2011.



۱۴ فروردين ۹۲ ، ۲۲:۰۰ ۱ نظر موافقین ۰ مخالفین ۰
محمدصادق رسولی

تجزیۀ وابستگی بی‌ناظر سریع

این مقاله در کارگاه تخصصی یادگیری بی‌ناظر و نیمه‌ناظر زبان طبیعی در فرانسه ارائه شده است.


Mohammad Sadegh Rasooli and Heshaam Faili, "Fast Unsupervised Dependency Parsing with Arc-Standard Transitions", in EACL workshop on ROBUS-UNSUP 2012: Joint Workshop on Unsupervised and Semi-Supervised Learning in NLP, Avignon, France, 2012.

۱۳ تیر ۹۱ ، ۱۳:۱۹ ۰ نظر موافقین ۰ مخالفین ۰
محمدصادق رسولی

استنتاج بی‌ناظر ظرفیت فعل در زبان فارسی بر مبنای دستور وابستگی

استنتاج بی‌ناظر ظرفیت فعل در زبان فارسی بر مبنای دستور وابستگی

پایان‌نامه برای دریافت درجۀ کارشناسی ارشد

در رشتۀ مهندسی کامپیوتر گرایش هوش مصنوعی و رباتیک

 

نام دانشجو:

محمدصادق رسولی

 

استاد راهنما:

دکتر بهروز مینایی بیدگلی

 

استاد مشاور:

دکتر هشام فیلی


دریافت متن پایان‌نامه


دریافت ارائۀ پایان‌نامه


چکیده

فعل اصلی‌ترین جزء جمله در زبان است و زبان فارسی از این قاعده مستثنی نیست. مفهوم ظرفیت از نظریۀ دستور وابستگی در زبان‌شناسی نوین اقتباس شده است. ظرفیت فعل نشان‌دهندۀ متمم‌های مورد نیاز فعل برای خوش‌ساخت کردن جمله است. شناخت ساخت ظرفیتی در زبان از سه جهت اهمیت دارد. نخست این که با شناخت ساخت‌های ظرفیتی می‌توان سامانه‌های مبتنی بر دستور واژگانی طراحی کرد. دومین جهت استفاده از ساخت‌های ظرفیتی برای کاربردهای تجزیۀ نحوی و معنایی زبان به صورت هوشمند است. سومین جهت نیز استفاده از آن برای کاربردهای شناختی در زبان‌شناسی نظری است. در این پایان‌نامه پس از مرور ادبیات موضوع پیرامون روش‌های پردازش زبان طبیعی در سطح نحو و روش‌های یادگیری زبان، به بررسی ساختار فعل و ظرفیت فعل در زبان پرداخته شده است. پس از مروری بر مفاهیم فعل، دستور وابستگی، ظرفیت در دستور وابستگی و روش‌های استخراج بی‌ناظر ظرفیت فعل در زبان فارسی، روش‌هایی برای استخراج بی‌ناظر فعل مرکب در زبان فارسی و ظرفیت افعال زبان فارسی پیشنهاد و آزموده شده است. به دلیل نیاز واژگانی زبان، نگارنده به همراه همکارانش اقدام به ایجاد اولین فرهنگ ظرفیت فعل در زبان فارسی و اولین پیکرۀ وابستگی نحوی زبان کرده‌اند تا بتوان به وسیلۀ آن‌ها پردازش زبان فارسی را در سطح نحو بهبود و گسترش داد. در نهایت نیز جمع‌بندی و پیشنهادهایی در مورد ادامۀ کار این پژوهش برای بسط روش‌های پردازشی مبتنی بر دستور وابستگی در زبان فارسی پیشنهاد شده است. در زمینۀ استخراج فعل مرکب با پیشنهاد دو روش تلفیقی، روش‌های سنتی مورد بهبود چشمگیر قرار گرفته‌اند. الگوریتم‌های مختلف در مورد شناخت ظرفیت فعل نیز شناخته شده، مورد آزمون قرار گرفتند که از این میان الگوریتم امیدیابی-بیشینه‌سازی بهترین نتایج را از آن خود کرده است.

 

واژه‌های کلیدی: پردازش زبان طبیعی، دستور وابستگی، نحو، فعل، ظرفیت فعل، فعل مرکب، زبان فارسی، استخراج بی‌ناظر.

۱۳ تیر ۹۱ ، ۱۳:۰۹ ۲ نظر موافقین ۰ مخالفین ۰
محمدصادق رسولی