سمینار:
معرفی دادگان درختی زبان فارسی بر اساس HPSG و نحوۀ تهیه آن
 
سخنران: مسعود قیومی
دانشجوی دوره دکترای زبان‌شناسی رایانشی
دانشگاه برلین
 
همان‌طور که می‌دانیم دستور زبان نقش بسیار کلیدی در درک زبان بازی می‌کند، بنابراین برای رسیدن به معنی الزاما می‌بایست از دریچه دستور وارد شد. تحلیل نحوی در رایانه به دو صورت انجام می‌گیرد: قاعده‌مند یا آماری. تجزیه‌گرهای آماری  نیاز به حجم قابل توجهی داده نشانه‌گذاری‌شده، مانند دادگان درختی تحلیل جملات، دارد. از آنجا که بیشتر منابع زبانی مورد اعتماد توسط انسان تهیه می‌شود، این کار بسیار دشوار، خسته‌کننده، و زمان‌بر است. بر همین اساس ممکن است چنین منابع زبانی برای همه زبان‌ها وجود نداشته باشد. از آنجا که بخش عظیمی از زبان قاعده‌مند است، می‌توان با استفاده از عبارات قاعده‌مند (regular expression)و با کمک‌گرفتن از روش افزایشی مبتنی-بر-ذات (bootstrapping) بخش قابل توجهی از روند تهیه این منابع را به صورت خودکار انجام داد. به این طریق، با استخراج عبارات قاعده‌مند از تعداد اندک و اولیه دادگان می‌توان زنجیره‌ای از کلمات را که با چنین قواعدی منطبق است تشخیص داده و در نتیجه از تلاش انسان برای نشانه‌گذاری این زنجیره کلمات کاست، و در نهایت از همین زنجیره‌ها برای استخراج قواعد جدید و نشانه‌گذاری زنجیره کلمات جدیدتر استفاده کرد. در این سخنرانی به نحوه تهیه دادگان درختی جملات فارسی در چارچوب دستور ساخت سازه‌ای هسته-بنیاد (HPSG) و تلاش برای کاهش‌دادن تلاش انسان با کمک رویکرد ذکر شده در تهیه این دادگان پرداخته می‌شود.
 
زمان: یکشنبه 11 تیرماه ساعت 10 صبح
مکان: اتاق سمعی – بصری مرکز زبان‌ها و زبان‌شناسی
 
---
 
کارگاه آموزشی:
پردازش نحو زبان با رویکردهای آماری و قاعده‌مند
 
مدرس: مسعود قیومی
دانشجوی دوره دکترای زبان‌شناسی رایانشی
دانشگاه برلین
 
زمان: یکشنبه 11 تیرماه ساعت 11 الی 13
مکان: اتاق سمعی – بصری مرکز زبان‌ها و زبان‌شناسی