این جلسات به عنوان دورۀ فشردۀ پردازش زبانی بر اساس برخی از مباحث کتاب «پیشبینی ساختهای زبانی» نوشتۀ نوح اسمیت (2011) آماده و در جلسات فنی مرکز تحقیقات کامپیوتری علوم اسلامی ارائه شده است.
این جلسات به عنوان دورۀ فشردۀ پردازش زبانی بر اساس برخی از مباحث کتاب «پیشبینی ساختهای زبانی» نوشتۀ نوح اسمیت (2011) آماده و در جلسات فنی مرکز تحقیقات کامپیوتری علوم اسلامی ارائه شده است.
Mohammad Sadegh Rasooli and Heshaam Faili, "Fast Unsupervised Dependency Parsing with Arc-Standard Transitions", in EACL workshop on ROBUS-UNSUP 2012: Joint Workshop on Unsupervised and Semi-Supervised Learning in NLP, Avignon, France, 2012.
استنتاج بیناظر ظرفیت فعل در زبان فارسی بر مبنای دستور وابستگی
پایاننامه برای دریافت درجۀ کارشناسی ارشد
در رشتۀ مهندسی کامپیوتر گرایش هوش مصنوعی و رباتیک
نام دانشجو:
محمدصادق رسولی
استاد راهنما:
دکتر بهروز مینایی بیدگلی
استاد مشاور:
دکتر هشام فیلی
چکیده
فعل اصلیترین جزء جمله در زبان است و زبان فارسی از این قاعده مستثنی نیست. مفهوم ظرفیت از نظریۀ دستور وابستگی در زبانشناسی نوین اقتباس شده است. ظرفیت فعل نشاندهندۀ متممهای مورد نیاز فعل برای خوشساخت کردن جمله است. شناخت ساخت ظرفیتی در زبان از سه جهت اهمیت دارد. نخست این که با شناخت ساختهای ظرفیتی میتوان سامانههای مبتنی بر دستور واژگانی طراحی کرد. دومین جهت استفاده از ساختهای ظرفیتی برای کاربردهای تجزیۀ نحوی و معنایی زبان به صورت هوشمند است. سومین جهت نیز استفاده از آن برای کاربردهای شناختی در زبانشناسی نظری است. در این پایاننامه پس از مرور ادبیات موضوع پیرامون روشهای پردازش زبان طبیعی در سطح نحو و روشهای یادگیری زبان، به بررسی ساختار فعل و ظرفیت فعل در زبان پرداخته شده است. پس از مروری بر مفاهیم فعل، دستور وابستگی، ظرفیت در دستور وابستگی و روشهای استخراج بیناظر ظرفیت فعل در زبان فارسی، روشهایی برای استخراج بیناظر فعل مرکب در زبان فارسی و ظرفیت افعال زبان فارسی پیشنهاد و آزموده شده است. به دلیل نیاز واژگانی زبان، نگارنده به همراه همکارانش اقدام به ایجاد اولین فرهنگ ظرفیت فعل در زبان فارسی و اولین پیکرۀ وابستگی نحوی زبان کردهاند تا بتوان به وسیلۀ آنها پردازش زبان فارسی را در سطح نحو بهبود و گسترش داد. در نهایت نیز جمعبندی و پیشنهادهایی در مورد ادامۀ کار این پژوهش برای بسط روشهای پردازشی مبتنی بر دستور وابستگی در زبان فارسی پیشنهاد شده است. در زمینۀ استخراج فعل مرکب با پیشنهاد دو روش تلفیقی، روشهای سنتی مورد بهبود چشمگیر قرار گرفتهاند. الگوریتمهای مختلف در مورد شناخت ظرفیت فعل نیز شناخته شده، مورد آزمون قرار گرفتند که از این میان الگوریتم امیدیابی-بیشینهسازی بهترین نتایج را از آن خود کرده است.
واژههای کلیدی: پردازش زبان طبیعی، دستور وابستگی، نحو، فعل، ظرفیت فعل، فعل مرکب، زبان فارسی، استخراج بیناظر.