شنبه ۱ اردیبهشت ۱۴۰۳ |۱۰ شوال ۱۴۴۵ | Apr 20, 2024
هوش مصنوعی

حوزه/ با استفاده از هوش مصنوعی می‌توان مشکل را حل و با پردازش زبان طبیعی، اصطلاح‌ها را استخراج و در بانک اطلاعاتی وارد کرد.

خبرگزاری حوزه | «پردازش زبان طبیعی» (Natural Language processing) یکی از شاخه‌های «هوش مصنوعی» است که در سامانه «مدرسه فقاهت» و برای «جستجو در متون حوزوی» به کار گرفته شده است.

      

اصطلاح‌های حوزوی:

در دروس حوزوی، اصطلاح‌هایی وجود دارد که در قالب دو یا چند کلمه، یک «مفهوم فقهی» را بیان می‌کند و باید به طریقی از میان ۶۵ هزار جلسه متن نوشته شده در «مدرسه فقاهت» استخراج می‌شد تا در هنگام نوشتن کلمه‌ای در کادر جستجو، مفاهیم مرکب از دو یا چند کلمه، نمایش داده شود تا محقق بداند که چه مفاهیمی در دروس «مدرسه فقاهت» وجود دارد و مطابق نیاز، «مفهوم مرکب» را انتخاب و جستجو کند.

وقتی محقق کلمه‌ای را در «کادر جستجو» می‌نویسد، اگر «مفاهیم مرکب» در بانک اطلاعاتی وجود داشته باشد، مفهوم‌های مرکب و نزدیک به «کلمه نوشته شده» نشان داده می‌شود و کاربر یک مورد را انتخاب می‌کند.

برای رسیدن به این هدف، می‌توان اصطلاح‌ها را به صورت دستی، استخراج و در بانک اطلاعاتی وارد کرد؛ اما ممکن است اصطلاح وارد شده، در تقریرها وجود نداشته باشد یا به ذهن محقق نرسد و در بانک اطلاعاتی وارد نشود.

   

فهم اصطلاح‌های حوزوی:

با استفاده از هوش مصنوعی می‌توان مشکل را حل و با پردازش زبان طبیعی، اصطلاح‌ها را استخراج و در بانک اطلاعاتی وارد کرد.

صدای بهار با به کارگیری «پردازش زبان طبیعی» (NLP) حدود ۶۵، ۰۰۰ جلسه تقریر را (که به زبان فارسی و عربی است) پردازش و اصطلاحات را استخراج نموده و با قرار دادن در بانک اطلاعاتی، امکان «پیش‌بینی» اصطلاح مرکب از دو یا چند کلمه را فراهم کرده است.

برای این کار لازم است «ویژگی کلماتی»   که در درس‌های مدرسه فقاهت به کار رفته شناسایی شود. مثلا باید تشخیص داد که هر کلمه موجود در تقریرها؛ اسم، فعل، حرف اضافه، حرف ربط یا چیزی دیگری است. تشخیص این موارد با استفاده از «پردازش زبان طبیعی» (NLP) انجام می‌شود.

بعد از این مرحله، با استفاده از قوانین زبان‌شناسی، اصطلاح‌های دو یا چند کلمه‌ای استخراج و در بانک اطلاعاتی وارد شد تا در هنگام جستجو، نزدیکترین پیشنهاد نشان داده و جستجو شود.

    

چند مثال:

مثلا وقتی محقق، کلمه «تقویم» را در کادر جستجو می‌نویسد، پیشنهاد «تقویم ارش» (به معنای قیمت‌گذاری مابه التفاوت جنس معیوب و سالم)، «تقویم عیب» (به معنای قیمت‌گذاری جنس معیوب)، «چگونگی تقویم ارش» و ... نشان داده می‌شود و محقق بر اساس نیاز یکی را انتخاب و درس‌های مرتبط با آن اصطلاح را می‌بیند.

مثلا اگر جمله «آیا در باب تقویم ارش، خبر حسی همراه با تعدد و عدالت، شرط است؟»  را به عنوان مثال در نظر بگیریم با استفاده از NLP می‌فهمیم که «تقویم» و «ارش» اسم هستند و وقتی دو اسم (با در نظر گرفتن سایر شرایط) پشت سر هم بیایند «مضاف و مضاف‌الیه» و در مجموع یک اصطلاح فقهی هستند و اگر محقق کلمه «تقویم» را در کادر جستجو نوشت، عبارت «تقویم ارش» به عنوان پیشنهاد نشان داده ‌شود.

به همین ترتیب با استفاده از NLP می‌فهمیم که «خبر حسی» نیز یک اصطلاح فقهی است و اگر کلمه «خبر» در کادر جستجو نوشته شود عبارت «خبر حسی» نیز پیشنهاد داده می‌شود.

    

مراحل آتی:

بهینه شدن «نتایج استخراج» نیازمند بهینه‌سازی «قوانین استخراج» است که در حال انجام است.

همچنین استخراج مفاهیمی که متشکل از ۳ کلمه یا بیشتر است نیز در حال تکمیل است تا پس از شناخت آن‌ها، در «بانک اطلاعاتی» قرار گیرد و به جستجوی محققین، کمک کند.

مرحله بعدی، استفاده از هوش مصنوعی در «جستجوی ویکی‌فقه» است و امیدواریم تا بهمن ماه اجرایی شود.

استخراج «مفاهیم فقهی» از تقریرهای مدرسه فقاهت، با روش «تحلیل صرفی» (و با اتکاء بر هوش مصنوعی) انجام شده و پروژه‌هایی در دست است که در آن از «تحلیل نحوی» استفاده خواهد شد.
  
جواد جوادی، مدیر مدرسه فقاهت

ارسال نظر

شما در حال پاسخ به نظر «» هستید.
captcha