به گزارش خبرگزاری حوزه، سامانه مشابهیاب سمیم نور از تولیدات تخصصی و علمی مرکز تحقیقات کامپیوتری علوم اسلامی است که طرفداران بسیاری در جامعه علمی کشور دارد.
اخیراً این مرکز طی قرارداد همکاری با دانشگاه آزاد اسلامی زمینه استفاده از خدمات گسترده سامانه مشابه یاب خود را برای تمامی دانشجویان، اساتید و اعضای هیئت علمی مراکز مختلف دانشگاه آزاد به ویژه برای مشابه یابی پایاننامهها، رسالهها و نشریات فراهم آورده است.
در همین راستا دکتر مهدی بهنیافر، مدیر سامانه سمیم نور و دکتر مهدی نیکنام، مشاور رئیس مرکز تحقیقات کامپیوتری علوم اسلامی در گفتگو با خبرنگار خبرگزاری حوزه به تشریح کارویژههای این سامانه پرداختند.
مدیر سامانه سمیم نور:
دانشگاه آزاد اسلامی با دغدغه ارتقاء سطح نوآوری در محصولات علمی خود با سمیم نور همکاری می کند
دکتر مهدی بهنیافر گفت: سامانه سمیم نور اولین سامانه مشابهیاب زبان فارسی است که فعالیت خود را از حدود ۱۰ سال پیش یعنی از مرداد ۱۳۹۳ آغاز کرد.
مدیر سامانه سمیم نور افزود: کارویژه این سامانه، مشابه یابی متون در زبان فارسی بوده و در حال حاضر و بیش از دو سال است که سامانه مشابه یاب عربی سمیم نور نیز راه اندازی شده است. یعنی مشابه یابی متون به دو زبان فارسی و عربی در حال انجام است.
وی تصریح کرد: این سامانه از داده های پشتیبان استفاده می کند و متن های ورودی کاربر شامل مقاله، پایان نامه، کتاب یا هر متن دیگر را با داده های پشتیبان خود می سنجد و به کاربر گزارش می دهد که چه مقدار از این متن از داده های تاکنون منتشر شده اقتباس شده است. داده های پشتیبان سامانه که از آن سخن می گوییم، شامل چهار بخش کتاب های منتشره، مقالات منتشر شده در نشریات علمی، پایان نامه ها و داده های منتشر شده در وب سایتهاست.
مدیر سامانه سمیم نور گفت: در حال حاضر سمیم نور حدود یک میلیون مقاله، حدود ۵۰ هزار جلد کتاب، ۱۵۰ هزار پایان نامه و رساله در مقاطع ارشد و دکتری در حوزه علوم انسانی و اسلامی و چهار و نیم میلیون صفحه وب را به عنوان داده های پشتیبان گردآوری کرده است که این داده ها به طور مداوم در حال افزایش است. این سامانه متن ورودی کاربر را با مجموع این داده ها می سنجد و به او گزارش می کند چه بخش هایی از یک کتاب یا مقاله یا پایان نامه و.... در این متن به کار رفته است.
بهنیافر یادآورشد: سمیم نور 10 سال از فعالیت خود را پشت سر گذاشته بود و با مراکز مختلفی نیز همکاری داشت ولی یکی از همکاری هایی که خوشبختانه در سال گذشته شکل گرفت، همکاری با دانشگاه آزاد اسلامی بود که به خصوص در حوزه پژوهشها و تدلیدات علمی علوم انسانی و علوم اسلامی این دانشگاه شکل گرفت.
وی گفت: محتوای همکاری به زبان ساده به این شکل است که با توجه به دغدغه مدیریت دانشگاه آزاد اسلامی در حوزه تولید علم نوآورانه، غیرتکراری و ناب و نیاز احساس شده برای تحول در وضعیت علمی کشور و نقشی که این دانشگاه در عرصه تحول علمی کشور دارد، تلاش کردند در قالب این همکاری مقالات نشریات و پایان نامه های ارشد و دکتری را قبل از دفاع، ارزیابی و مشابهت یابی کنند و از این طریق بر سلامت پژوهشهای علمی واحدهای مختلف این دانشگاه بیفزایند.
مدیر سامانه سمیم نور یادآورشد: برای پایش این نوآوری، سامانه مشابه یاب به کمک مراکز علمی و بخصوص دانشگاه آزاد اسلامی آمده است. مذاکرات اولیه این همکاری در سال گذشته آغاز شد و عملیات آزمایشی این همکاری از ابتدای آبان ماه با دانشگاه آزاد اسلامی آغاز شد و پس از گذراندن دوره آزمایشی خود، از ابتدای آذرماه به شکل گسترده و فراگیر در قالب یک وب سرویس اختصاصی در اختیار دانشگاه آزاد قرار گرفت و از طریق سامانه پژوهشیار دانشگاه آزاد اسلامی قابل استفاده است و به زودی به دیگر سامانه های تولید و مدیریت محتوای دانشگاه آزاد هم متصل خواهد شد.
۴ سرویس تخصصی به دانشگاه آزاد ارائه می شود
وی با ذکر این مطلب که در حال حاضر چند سرویس مشخص را در پنجره واحدی به دانشگاه آزاد اسلامی ارایه می کنیم بیان کرد: یکی از این سرویس ها، سرویس مشابه یابی است. یعنی متن تولید شده توسط دانشجو که شامل پایان نامه و رساله یا طرح نامه یا پیشنهاده دانشجو است از طریق پنجره تعبیه شده در سامانه پژوهشیار برای مشابه یابی به سمیم نور فرستاده می شود.
در واقع دغدغه مدیران دانشگاه آزاد اسلامی آن است که نه تنها پایان نامه و رساله نوآورانه باشد و میزان اقتباس در پایان نامه و رساله مشخص باشد، بلکه از زمانی که دانشجو طرح نامه یا پیشنهاده (پروپوزال) خود را تصویب می کند، همین پیشنهاده نیز مشابه یابی شود. یعنی مشخص شود که بیان مساله و پیشینه محتوایی که دانشجو در طرح نامه خود ارایه می کند تا چه اندازه ای نوآورانه است و یا در چه حد در نگارش آن از منابع دیگر اقتباس شده است.
وی افزود: سرویس دیگری که به دانشگاه آزاد اسلامی ارایه می شود پیشینه یابی پژوهش یا همان مشابه یابی عنوان پیشنهادهها و پروپوزالهای دانشجویان است. دانشجویی که عنوان مشخصی را برای پایان نامه یا رساله اش انتخاب می کند، سامانه سمیم نور به او می گوید که این عنوان یا عناوین مشابه آن و یا با کلید واژه های مشابه و مرتبط به شکل جزیی یا کلی قبل از این در قالب چه کتاب ها، مقالات و پایان نامه هایی منتشر شده است. البته این پیشینه یابی عنوان، صرفاً لفظی نیست و محتوایی هم هست. همچنین این پیشینه یابی صرفاض بر روی پایان نامه ها و رساله ها انجام نمی شود بلکه علاوه بر آن بر روی مقالات و کتابها و دیگر تولیدات علمی هم انجام می شود و باعث می شود که دانشجو از همان ابتدا و قبل از شروع تدوین رساله یا پایان نامه خود مطلع شود که چه کسانی در این زمینه کار کرده اند.
مدیر سامانه سمیم نور ادامه داد: بر این اساس، گروه آموزشی، استاد راهنما و استاد مشاور و مدیریت آموزش و دیگر دست اندرکاران واحد مربوطه می توانند تصمیم بگیرد که این پیشنهاده (پروپوزال) را بپذیرند یا دانشجو روی آن کار بیشتری بکند و یا به طور کلی آن را رد کنند و به دانشجو اعلام کنند که این مطلب قبلاً کار شده است.
خدمت دیگری که از همان ابتدایی که گفتگوهای ما با دانشگاه آزاد شروع شد مورد تقاضای پژوهش دانشگاه و شخص ریاست محترم دانشگاه آزاد بود و نسبت به آن اهتمام ویژه ای داشتند، سرویس خطایاب املایی است. پیشنهادهها، پایاننامهها و رساله های که تهیه می شود گاهی با خطاهای نگارشی، ویرایشی و املایی مواجه است و طبیعی است که پایش و رفع این خطاها به کمک نیروی انسانی و ویراستار انسانی با مشکلات و دشواری های خاصی مواجه است و هزینه بر است.
بهنیافر یادآورشد: در حال حاضر برای متون ورودی به سمیم نور با کمک نرم افزار پاکنویس که یکی دیگر از تولیدات مرکز نور است، به ازای هر متن ورودی برای مشابه یابی و علاوه بر مشابه یابی، خطایابی املایی و نگارشی هم انجام می شود و دست کم ۶ نوع خطای املایی و نوشتاری و ویرایشی را از طریق این وب سرویس به دانشگاه اعلام می کنیم و حتی امکان اصلاح ماشینی این خطاها نیز وجود دارد که در صورت آمادگی دانشگاه علاوه بر فاز کنونی اعلام خطاها، فاز اصلاح متن را هم می توان فعال کرد. در واقع وقتی متن پایان نامه را دریافت می کنیم، همزمان با مشابه یابی های مختلف به مخاطب اعلام می کنیم که این مقاله فلان تعداد و فلان درصد خطای املایی و نگارشی و سجاوندی دارد. همچنین به کاربر اعلام می کنیم که چه مقدار کلمه بیگانه در متن استفاد شده یا چسبیدگی های نا متوازن یا برخی ریخت های نامتعارف در فارسی که ممکن است غلط املایی نباشد در متن هست که مثلا "می شود" را بدون نیم فاصله به کار برده است. استفاده از نویسه های غیر نرمال و اعداد نادرست و برخی حروف غیر استاندارد که ریخت متن را کاملا بهم می ریزند که این مساله در خوانش متن و داوری متن اختلالاتی ایجاد می کند و به طور کلی زبان را از شکل پیراسته خود خارج می کند هم آشکارسازی می شود.
مدیر سامانه سمیم نور گفت: این دغدغه های دانشگاه آزاد اسلامی رامی توان دغدغه های بسیار نیکویی دانست و خوشبختانه با همکاری با سمیم نور این فعالیت و خدمت دقیق علمی انجام شده است. یعنی در هر متن انواع خطای املایی و نگارشی به کاربر اعلام می شود و بر اساس آن مدیریت دانشگاه می تواند تصمیم بگیرد که متن را به لحاظ ویرایشی بپذیرد یا آن را به واحد مربوط برای ویرایش ارجاع بدهد؛ ضمن اینکه امکان اصلاح این خطاها با استفاده از نرم افزار پاکنویس هم وجود دارد.
وی یادآورشد: سمیم نور در قالب کاربران حقیقی و کاربران حقوقی کاربران بسیار زیادی دارد. تعداد کاربران ما تقریبا حدود ۲۰۰ هزار کاربر فعال حقیقی و حقوقی هستند.
جدای از سرویس سازمان یافته به مراکز علمی و پزوهشی، نشریات علمی و پژوهشی و ترویجی در حوزه علوم انسانی و اسلامی نیز از سمیم نوراستفاده می کنند. برخی دانشگاه ها نیز به شکل جداگانه از این سامانه و حتی خارج از قالب وب سرویس و به عنوان کاربران حقوقی استفاده می کنند. همچنین اساتید دانشگاه ها از استفاده کنندگان حقیقی این سامانه هستند. در مجموع ما دارای دو طیف کاربران حقیقی و حقوقی هستیم.
بهنیافر یادآورشد: یکی از سرویس هایی که به دانشگاه ها، حوزه های علمیه و مراکز آموزشی و پژوهشی ارایه شده آن است که تحت ip اینترنتی خود به شکل آزاد سامانه های نور از جمله سمیم نور را در اختیار اساتید و دانشجویان خود قرارداده اند. یعنی هر استاد و دانشجو می تواند با اعتباری که دانشگاه خریداری کرده است از خدمات مشابه یابی سمیم نور استفاده کند بدون آنکه لازم باشد شخصاً برای دریافت این خدمت هزینه کند.
وی بیان کرد: همچنین فعالان علمی می توانند به شکل انفرادی در سامانه عضو شوند یا می توانند از همان نام کاربری که در نورمگز ونورلایب و یا دیگر سامانه های نور دارند در سامانه سمیم نور هم استفاده نموده و پایان نامه و کتاب و مقاله را مشابه یابی نمایند.
مشاور رئیس مرکز تحقیقات کامپیوتری علوم اسلامی:
مخزن داده های میلیونی سمیم نور پشتیبان قوی دانشجویان و محققان
دکتر مهدی نیکنام نیز در این خصوص گفت: مدل همکاری ما با دانشگاه آزاد به شکل وب سرویس است. در این زمینه دانشگاه کاری با سامانه سمیم و پنجره های اصلی آن ندارد. بر اساس یک سرویس، سامانه های خود دانشگاه آزاد محتوا را از دانشجو یا استاد یا صاحب مقاله دریافت می کنند و برای سمیم نور ارسال می شود و نتیجه نیز به سرعت و از مجرای واحدی دریافت می شود و در سامانه دانشگاه نیز ثبت می شود. یعنی دانشجو نیازی به مراجعه مستقیم به سامانه سمیم ندارد و در پشت صحنه، تعاملات فنی از طریق وب سرویس انجام شده است.
وی بیان کرد: مساله بعدی آنکه در بازه حدوداً ۶ ماهه اخیر، دانشگاه آزاد اسلامی حدود ۶۴ هزار درخواست مشابه یابی ارسال کرده است که این درخواستها حدودً بیش از ۲ میلیون و ۲۰۰ هزار صفحه و مدت زمان پاسخگویی سامانه سمیم به ازای هر متون ورودی نیز حدود ۲۰ دقیقه بوده است هر چند در زمانهایی از شبانه روز که بار تقاضاهای کاربران کم باشد، متناسب با حجم متن ورودی، زمان پاسخگویی سمیم نور حتی به زیر یک دقیقه هم می رسد.
نیکنام اظهار کرد: سندی که از یک تا ۴۰۰ صفحه است از سوی دانشگاه تحویل گرفته می شود و ما نیز در این سامانه ضمن مقایسه با میلیون ها صفحه، جملات و پاراگرافها و بخشهایی که مشابه متن ارسالی است را یافته و ارائه می دهیم.
وی بیان کرد: در طول این ۱۰ یا ۱۱ سال گذشته که از فعالیت سمیم نور می گذرد، حجم محتوای پشتیبان سامانه ما از ۵۰۰ هزار سند اولیه به میلیون ها سند رسیده است و همزمان با سرویس دهی به دانشگاه آزاد که حجم درخواست ها و بار پردازشی گسترده ای دارد از نظر پردازشی زیر ساخت های سخت افزاری را توسعه دادیم تا حجم درخواست دانشگاه را پاسخ دهیم و با اصلاحاتی که روی الگوریتم انجام داده ایم، هم الگوریتم را بهینه کردیم و هم درصدها و نواحی که شناسایی می کنیم دقیق تر شده است. یعنی اگر درخواست ها ده یا بیست برابر هم شود سمیم نور به راحتی پاسخگوی هر درخواستی حتی در زمانهای افزایش بار تقاضای کاربران نیز خواهد بود.
سمیم نور و چالش هوش مصنوعی
مشاور رئیس مرکز نور تصریح کرد: سمیم نور دیتای خود از متن های دقیق و پشتیبان خود ارایه می دهد ولی سامانه های موجود هوش مصنوعی بر اساس سامانه ها و الگوریتمهایی که دارند، گاهی به تولید محتواهایی می پردازند که اصطلاحاً گزافه یا توهمی است و آن شیوه تولیدات برخی از این سامانه ها را اصطلاحاً hallucination می نامند که اصلا ماهیت واقعی و علمی ندارد.
وی گفت: بحث دیگر قابل تصور آن است که روال پژوهش در آینده نزدیک باید تغییر کند و روال تولید متن و مفهوم نوآوری با وجود چت بات های هوش مصنوعی تغییر می کند. یعنی پارادایم تحقیق در آینده تغییر خواهد کرد زیرا بحث مالکیت معنوی و اخلاق در پژوهش و... به میان می آید و مرزهای جدیدی را مشخص می کند. با وجود مدل های زبانی جدید قطعا پژوهش مسیر جدیدی را آغاز خواهد کرد.
نظر شما