این جلسات به عنوان دورۀ فشردۀ پردازش زبانی بر اساس برخی از مباحث کتاب «پیشبینی ساختهای زبانی» نوشتۀ نوح اسمیت (2011) آماده و در جلسات فنی مرکز تحقیقات کامپیوتری علوم اسلامی ارائه شده است.
این جلسات به عنوان دورۀ فشردۀ پردازش زبانی بر اساس برخی از مباحث کتاب «پیشبینی ساختهای زبانی» نوشتۀ نوح اسمیت (2011) آماده و در جلسات فنی مرکز تحقیقات کامپیوتری علوم اسلامی ارائه شده است.
Mohammad Sadegh Rasooli and Heshaam Faili, "Fast Unsupervised Dependency Parsing with Arc-Standard Transitions", in EACL workshop on ROBUS-UNSUP 2012: Joint Workshop on Unsupervised and Semi-Supervised Learning in NLP, Avignon, France, 2012.
استنتاج بیناظر ظرفیت فعل در زبان فارسی بر مبنای دستور وابستگی
پایاننامه برای دریافت درجۀ کارشناسی ارشد
در رشتۀ مهندسی کامپیوتر گرایش هوش مصنوعی و رباتیک
نام دانشجو:
محمدصادق رسولی
استاد راهنما:
دکتر بهروز مینایی بیدگلی
استاد مشاور:
دکتر هشام فیلی
چکیده
فعل اصلیترین جزء جمله در زبان است و زبان فارسی از این قاعده مستثنی نیست. مفهوم ظرفیت از نظریۀ دستور وابستگی در زبانشناسی نوین اقتباس شده است. ظرفیت فعل نشاندهندۀ متممهای مورد نیاز فعل برای خوشساخت کردن جمله است. شناخت ساخت ظرفیتی در زبان از سه جهت اهمیت دارد. نخست این که با شناخت ساختهای ظرفیتی میتوان سامانههای مبتنی بر دستور واژگانی طراحی کرد. دومین جهت استفاده از ساختهای ظرفیتی برای کاربردهای تجزیۀ نحوی و معنایی زبان به صورت هوشمند است. سومین جهت نیز استفاده از آن برای کاربردهای شناختی در زبانشناسی نظری است. در این پایاننامه پس از مرور ادبیات موضوع پیرامون روشهای پردازش زبان طبیعی در سطح نحو و روشهای یادگیری زبان، به بررسی ساختار فعل و ظرفیت فعل در زبان پرداخته شده است. پس از مروری بر مفاهیم فعل، دستور وابستگی، ظرفیت در دستور وابستگی و روشهای استخراج بیناظر ظرفیت فعل در زبان فارسی، روشهایی برای استخراج بیناظر فعل مرکب در زبان فارسی و ظرفیت افعال زبان فارسی پیشنهاد و آزموده شده است. به دلیل نیاز واژگانی زبان، نگارنده به همراه همکارانش اقدام به ایجاد اولین فرهنگ ظرفیت فعل در زبان فارسی و اولین پیکرۀ وابستگی نحوی زبان کردهاند تا بتوان به وسیلۀ آنها پردازش زبان فارسی را در سطح نحو بهبود و گسترش داد. در نهایت نیز جمعبندی و پیشنهادهایی در مورد ادامۀ کار این پژوهش برای بسط روشهای پردازشی مبتنی بر دستور وابستگی در زبان فارسی پیشنهاد شده است. در زمینۀ استخراج فعل مرکب با پیشنهاد دو روش تلفیقی، روشهای سنتی مورد بهبود چشمگیر قرار گرفتهاند. الگوریتمهای مختلف در مورد شناخت ظرفیت فعل نیز شناخته شده، مورد آزمون قرار گرفتند که از این میان الگوریتم امیدیابی-بیشینهسازی بهترین نتایج را از آن خود کرده است.
واژههای کلیدی: پردازش زبان طبیعی، دستور وابستگی، نحو، فعل، ظرفیت فعل، فعل مرکب، زبان فارسی، استخراج بیناظر.
مکان: دانشگاه صنعتی شریف، مرکز زبانها و زبانشناسی، اتاق سمعی و بصری
صفحۀ دریافت برنامۀ متنباز:
https://github.com/rasoolims/PersianVerbAnalyzer
لطفاً پیشنهادها و اشکالات موجود را با تماس اینترنتی در میان بگذارید: rasooli.ms{#a#t}gmail.com
صفحۀ دریافت برنامۀ متنباز:
https://github.com/rasoolims/MSTParserCSharp
لطفاً پیشنهادها و اشکالات موجود را با تماس اینترنتی در میان بگذارید: rasooli.ms{#a#t}gmail.com
گفتوگو با محمدصادق رسولی در خصوص کارکرد پروژه دادگان و پردازش متون زبانی
گروه دادگان زبان فارسی، برای جامعه علمی داخل و خارج
نسترن صادقی
تهران امروز
پیوند خبر:
http://www.tehrooz.com/1390/11/16/TehranEmrooz/824/Page/13/
محمد صادق رسولی در حال حاضر مسئولیت پروژه دادگان وابستگی گروه دادگان زبان فارسی را بر عهده دارد. او کارشناسی نرمافزار و کارشناسی ارشد هوش مصنوعی را از دانشگاه علم و صنعت ایران اخذ کرده است.در خصوص کارکرد پروژه دادگان و پردازش متون زبانی با او به گفتوگو نشستهایم.
هدف از پردازش هوشمند متون زبانی چیست؟
هدف از پردازش زبان را میتوان در چند دیدگاه جستوجو کرد. در یک دیدگاه، شناختگرایان سعی میکنند با روشهای هوشمند رایانهای رفتارهای شناختی انسان را شبیهسازی میکنند و از نتایج به دست آمده تعمیمهایی به دست میآورند. یک دیدگاه سطح پایینتر نیز وجود دارد، دیدگاهی که معتقد است رایانه باید در هر مسئلهای بتواند کار را برای انسان راحت کند. انسان، خود یک متخصص خبره است که با استفاده از هوشمندی نسبی رایانه این خبرگی را میتواند به یک سامانه هوشمند منتقل کند. مثلاً اگر یک روزی برای خرید بلیت قطار به متخصص فروش (یعنی فروشنده باجه ایستگاه) مراجعه میکردید، اکنون یک خبره هوشمند رایانهای تحت وب برایتان طراحی شده است که از طریق آن میتوانید بدون مراجعه حضوری آن کار را سریعتر انجام دهید. در مورد زبان نیز همین مسئله صدق میکند. مثلاً هماکنون نرمافزارهایی مانند «رُزِتا استون» برای چنین کاربردهایی طراحی شدهاند و یا برای آزمونهایی مانند تافل، بخش اعظم ارزیابیها به صورت هوشمند و رایانهای انجام میشود...