سمینار:
معرفی دادگان درختی
زبان فارسی بر اساس HPSG و نحوۀ تهیه آن
سخنران: مسعود
قیومی
دانشجوی دوره دکترای
زبانشناسی رایانشی
دانشگاه
برلین
همانطور که
میدانیم دستور زبان نقش بسیار کلیدی در درک زبان بازی میکند،
بنابراین برای رسیدن به معنی الزاما میبایست از دریچه دستور وارد شد.
تحلیل نحوی در رایانه به دو صورت انجام میگیرد: قاعدهمند یا
آماری. تجزیهگرهای آماری نیاز به حجم قابل توجهی داده
نشانهگذاریشده، مانند دادگان درختی تحلیل جملات، دارد. از آنجا
که بیشتر منابع زبانی مورد اعتماد توسط انسان تهیه میشود، این کار
بسیار دشوار، خستهکننده، و زمانبر است. بر همین اساس ممکن است
چنین منابع زبانی برای همه زبانها وجود نداشته باشد. از آنجا که بخش
عظیمی از زبان قاعدهمند است، میتوان با استفاده از عبارات
قاعدهمند (regular expression)و با کمکگرفتن از روش افزایشی
مبتنی-بر-ذات (bootstrapping) بخش قابل توجهی از روند تهیه این منابع را به
صورت خودکار انجام داد. به این طریق، با استخراج عبارات قاعدهمند از
تعداد اندک و اولیه دادگان میتوان زنجیرهای از کلمات را که با
چنین قواعدی منطبق است تشخیص داده و در نتیجه از تلاش انسان برای
نشانهگذاری این زنجیره کلمات کاست، و در نهایت از همین
زنجیرهها برای استخراج قواعد جدید و نشانهگذاری زنجیره کلمات
جدیدتر استفاده کرد. در این سخنرانی به نحوه تهیه دادگان درختی جملات فارسی
در چارچوب دستور ساخت سازهای هسته-بنیاد (HPSG) و تلاش برای
کاهشدادن تلاش انسان با کمک رویکرد ذکر شده در تهیه این دادگان
پرداخته میشود.
زمان: یکشنبه 11
تیرماه ساعت 10 صبح
مکان: اتاق سمعی
– بصری مرکز زبانها و زبانشناسی
---
کارگاه
آموزشی:
پردازش نحو زبان با
رویکردهای آماری و قاعدهمند
مدرس: مسعود
قیومی
دانشجوی دوره دکترای
زبانشناسی رایانشی
دانشگاه
برلین
زمان: یکشنبه 11
تیرماه ساعت 11 الی 13
مکان: اتاق سمعی
– بصری مرکز زبانها و زبانشناسی