مقدّمه
مرکز تحقیقات کامپیوتری علوم اسلامی (نور)، با بیش از سه دهه سابقه در عرصه دیجیتالسازی و نمایهسازی منابع اسلامی، همواره کوشیده است تا با بهرهگیری از جدیدترین فنّاوریهای اطّلاعاتی، ابزارهای پیشرفتهای را در اختیار جامعه علمی قرار دهد. این مرکز با درک ضرورت تحوّل در ابزارهای پژوهشی، پروژه کلان «دستیار جامع علوم اسلامی نور» را بهعنوان نقشه راه توسعه سامانههای هوشمند خود تعریف کرده است. در ادامه این مسیر، نسخه اوّل سامانه «گفتوگو با کتاب» در پایگاه کتابخانه دیجیتال نور (نورلایب) رونمایی شده است. این سامانه، گامی بلند در جهت تحقّق تعاملی عمیق، دقیق و مستند با گنجینه عظیم علوم اسلامی محسوب میشود و میتواند بهعنوان یک الگو برای توسعه سامانههای مشابه در سایر حوزههای علوم انسانی موردتوجّه قرار گیرد.
ضرورت بهرهگیری از هوش مصنوعی در علوم اسلامی
عصر حاضر، عصر اطّلاعات و دادههای بزرگ است. در دهههای اخیر، دیجیتالیشدن منابع مکتوب علمی و دینی با شتابی فزاینده انجام گرفته و حجم عظیمی از متون کهن و معاصر، در دسترس پژوهشگران قرار گرفته است. اگرچه این امر دسترسی به منابع را تسهیل کرده، امّا خود چالش تازهای را با عنوان «انبوه دادگان» (Data Deluge) پدید آورده است. پژوهشگر علوم اسلامی امروز، با انبوهی از اطّلاعات مواجه است که غربالگری دستی آنها برای یافتن پاسخ پرسشهای دقیق و پیچیده، امری زمانبر و گاه ناممکن است. صِرف دسترسی به متون دیجیتال، بدون برخورداری از ابزارهای پیشرفته برای کاوش عمیق، دستهبندی، تحلیل و استخراج دانش نظاممند، پاسخگوی نیازهای تحقیقاتی پیچیده نخواهد بود.
در این میان، فنّاوریهای هوش مصنوعی، بهویژه در شاخههای یادگیری ماشین (Machine Learning)، یادگیری عمیق (Deep Learning) و پردازش زبانهای طبیعی (Natural Language Processing)، راهکاری کارآمد برای گذار از جستوجوی ساده کلیدواژهای به سوی درک مفهومی و تعامل هوشمند با متون ارائه میدهند. سامانههای پرسشوپاسخ مبتنی بر متن (Text-based QA Systems) و مدلهای زبانی بزرگ (Large Language Models)، توانستهاند درک ماشین از زبان انسانی را به سطحی برسانند که امکان گفتوگو با متن و استخراج اطّلاعات دقیق از لابهلای صفحات بیشمار فراهم آید.
سامانههای هوشمند مبتنی بر هوش مصنوعی، میتوانند با غربالگری هوشمندانه میلیونها صفحه متن، مرتبطترین اطّلاعات را در کسری از ثانیه در اختیار کاربر قرار دهند. این فرایند، نهتنها موجب صرفهجویی در زمان میگردد، بلکه با ارائه مستندات دقیق و ارجاعات شفاف، به عمق و غنای تحقیقات علمی میافزاید؛ به بیان دیگر، فنّاوریهای NLP به ماشین این امکان را میدهند که نهفقط کلمات، بلکه روابط معنایی میان آنها، بافتار متن و منظور نویسنده را تا حدّ قابلقبولی درک کرده و پاسخی مبتنی بر فهم متن، نه صرفاً تطابق لفظی، ارائه دهد.
پیشینه سامانههای گفتوگو در مرکز نور
مرکز نور پیشازاین، با هدف بهرهگیری جامعه علمی از ظرفیتهای تعاملی هوش مصنوعی در محصولات تولیدی خود، اقدام به راهاندازی سامانههای تخصّصیتری نموده است:
ـ گفتوگو با احادیث: این سامانه، با تمرکز بر متون حدیثی شیعه، امکان پرسشوپاسخ پیرامون محتوای احادیث را فراهم میآورد. دامنه دادههای آن، شامل مجموعهای از کتب حدیثی اصلی از قرن اوّل تا دوران متأخّر است.
ـ گفتوگو با تفاسیر: این سامانه نیز با هدف پاسخگویی به سؤالات تفسیری قرآن کریم و باتکیهبر متون تفاسیر معتبر فریقین که در منابع پایگاه جامع قرآنی وجود دارند، ارائه شده است.
دامنه دادههای این سامانهها، به دلیل تخصّصیبودن حوزهشان، محدود است و حدّاکثر مشتمل بر یک هزار عنوان کتاب است. همچنین، کیفیت پردازش دادهها در آنها، مبتنی بر مدلهای سادهتر هوش مصنوعی است. ضرورت توسعه حجم دادههای مورد پردازش از یک سو، و عمقبخشیدن به کیفیت پردازش با استفاده از الگوهای پیچیدهتر هوش مصنوعی ازسویدیگر، همراه با بهرهگیری از تجربه حاصل از طراحی و استقبال کاربران از این سامانهها، زمینهساز ایجاد نسل جدیدی با عنوان «گفتوگو با کتاب» گردید.
معرّفی و تحلیل سامانه «گفتوگو با کتاب»
سامانه هوشمند «گفتوگو با کتاب»، نسل جدیدی از موتورهای جستوجوی عمیق و تحلیلگر متون است که بر پایه آخرین دستاوردهای هوش مصنوعی طراحی و پیادهسازی شده است. این سامانه یکپارچه، حاصل تلاش تیمهای پژوهشی، فنّی و دادهپردازی مرکز نور است.
هسته پردازشی و معماری فنّی
هسته اصلی این سامانه، یک موتور هوشمند نسل جدید مبتنی بر تکنیکهای یادگیری عمیق (Deep Learning) و پردازش زبان طبیعی (NLP) است. معماری این موتور را میتوان در چند لایه اصلی تشریح کرد:
* لایه درک و تحلیل پرسش (Query Understanding Layer)
در این لایه، پرسش کاربر که ممکن است به زبان فارسی، عربی، انگلیسی و... و با هر ساختار دستور زبانی باشد، دریافت و مورد تحلیل قرار میگیرد. فرایندهایی مانند: تشخیص موجودیتهای متن همچون: نام کتاب، نویسنده، مذهب و قرن، تحلیل نحوی، ریشهیابی کلمات و رفع ابهام معنایی، در این مرحله انجام میشود. هدف، استخراج «مفهوم» اصلی پرسش و شناسایی قیود احتمالی ذکرشده در آن است؛ مانند محدودیت به یک کتاب خاصّ یا یک نویسنده معیّن.
* لایه بازیابی اطّلاعات (Information Retrieval Layer)
پس از درک پرسش، موتور جستوجو با بهرهگیری از نمایههای پیشرفته و ساختاریافته که بر روی متن کامل دادهها ایجاد شده است، به بازیابی مرتبطترین بخشها (پاراگرافها) از میان میلیونها صفحه میپردازد. این لایه، از الگوریتمهای جستوجوی معنایی (Semantic Search) و تطبیق بُرداری (Vector Similarity) استفاده میکند.
* لایه استدلال و تولید پاسخ (Reasoning & Generation Layer)
در این مرحله، بخشهای بازیابیشده به یک مدل زبانی بزرگ (LLM) اختصاصی که بر روی متون اسلامی تنظیم دقیق شده است، ارسال میگردد. این مدل، با استدلال بر روی متون دریافتی، پاسخ نهایی را به زبانی روان و منسجم تولید میکند. مهمّترین ویژگی این لایه، پایبندی به متن منبع و جلوگیری از تولید محتوای تأییدناپذیر (Hallucination) است. مدل، موظف است پاسخ خود را صرفاً بر اساس متون بازیابیشده و با ذکر ارجاع دقیق به آنها ارائه دهد.
دامنه دادهها (کلاندادگان علوم اسلامی)
مهمّترین ویژگی متمایزکننده سامانه «گفتوگو با کتاب» نسبت به سامانههای پیشین، گستره عظیم و بینظیر دادههای قابلجستوجو و تحلیل است. این سامانه، به محتوای موجود در کتابخانه دیجیتال نور (نورلایب) که در حال حاضر شامل بیش از ۱۰۰ هزار عنوان کتاب است و به طور مستمرّ در حال افزایش است، دسترسی مستقیم و هوشمند دارد. این حجم وسیع از منابع، غالب متون اصلی، معتبر و پُرکاربرد در حوزههای مختلف علوم اسلامی و انسانی اعمّ از: فقه، اصول، تفسیر، حدیث، فلسفه، کلام، تاریخ، سیره، اخلاق و ادبیات را پوشش میدهد. این گستره عظیم، همراه با عمق نمایهسازی، «گفتوگو با کتاب» را از یک ابزار جستوجوی ساده، به یک «همکار پژوهشی هوشمند» برای محقّقان علوم اسلامی تبدیل کرده است.
قابلیتها و ویژگیهای کلیدی سامانه
سامانه «گفتوگو با کتاب»، با ارائه مجموعهای از ویژگیهای کلیدی و کاربردی، تجربهای نوین از پژوهش دیجیتال را برای کاربران خود فراهم میآورد. این ویژگیها در تعامل با یکدیگر، یک مجموعه پژوهشی یکپارچه را شکل میدهند. قابلیتها و ویژگیهای کلیدی سامانه عبارتاند از:
* تحلیل چندمرحلهای و دستهبندی هوشمند نتایج
پرسش کاربر در چندین لایهپردازشی پالایش شده و نتایج، نه بهصورت فهرستی ساده و خطّی، بلکه در قالبی ساختاریافته و منسجم ارائه میگردد. سامانه تلاش میکند وجوه مختلف پرسش را شناسایی کرده و پاسخها را در دستهبندیهای موضوعی مرتبط، مثلاً «اقوال فقها»، «مستندات روایی» و «آرای مفسران»، به همراه جزئیات دقیق نمایش دهد.
* ارائه پاسخهای مستند و منبعمحور
شاید بتوان این ویژگی را مهمّترین قوّت سامانه «گفتوگو با کتاب» در مقایسه با سامانههای عمومی هوش مصنوعی دانست. سامانههای عمومی ممکن است پاسخهایی کاملاً قانعکننده، امّا از نظر علمی بیاساس و بدون ارجاع به منبع معتبر تولید کنند. در مقابل، سامانه «گفتوگو با کتاب» پاسخ خود را همراه با ارجاعات دقیق (نام کتاب، جلد و صفحه) و پیوند مستقیم (لینک) به صفحه منبع اصلی در کتابخانه دیجیتال نور ارائه میدهد. این ویژگی به محقّق امکان میدهد که:
- - صحّت و دقّت اطّلاعات ارائهشده را مستقیماً در متن اصلی کتاب بررسی کند.
- - به مطالعه گستردهتر پیرامون متن منبع بپردازد و به منابع مرتبط دیگر در کتابخانه دیجیتال دست یابد.
- - پژوهش خود را بر اساس اسناد معتبر و قابلاستناد بنا نهد.
* تعامل چندزبانه
با هدف پاسخگویی به نیاز مخاطبان گوناگون در سراسر جهان اسلام و نیز پژوهشگران بینالمللی، رابط کاربری سامانه به سه زبان: فارسی، عربی و انگلیسی طراحی شده است؛ امّا فراتر از چندزبانگی رابط کاربری، افراد میتوانند سؤال خود را به هر زبانی مطرح کنند و پاسخ آن را نیز به هر زبانی که مایل باشند، دریافت نمایند. برای این منظور، کافی است که زبان موردنظر خود برای پاسخ را در متن سؤال مشخّص کنند. این ویژگی، مانع زبانی برای دسترسی به منابع غنی اسلامی را تا حدّ زیادی برطرف مینماید.
* جستوجوی پیشرفته (محدودسازی جستوجو)
این امکان برای کاربر فراهم است که دامنه جستوجوی هوشمند خود را با ذکر قیودی در متن سؤال، بهصورت دقیق و هدفمند محدود سازد؛ برای مثال، جستوجو تنها در کتابهای یک نویسنده خاصّ، یک قرن مشخّص یا یک مذهب معین. موتور هوشمند با تشخیص این قیود، جستوجو را تنها در دامنه مشخّصشده انجام داده و دقّت نتایج را به شدّت افزایش میدهد.
* گفتوگوی هدفمند و متمرکز بر یک کتاب خاصّ
از جمله قابلیتهای بسیار کاربردی برای پژوهشگرانی که بر روی یک متن خاصّ تحقیق میکنند، امکان تمرکز گفتوگو بر روی یک کتاب معین است. پژوهشگر میتواند سؤالات خود را تنها در محدوده متن یک کتاب مشخّص مطرح کند و پاسخهای مستند و دقیق را صرفاً از همان کتاب دریافت نماید. این ویژگی، برای انجام تحقیقات عمیق بر روی یک اثر، نگارش شرح یا تعلیقه بر کتاب و یا استخراج نظاممند دیدگاههای یک نویسنده، بسیار مفید است.
* تعامل پویا و حفظ تاریخچه گفتوگو
سامانه قادر است تاریخچه پرسشوپاسخهای مطرحشده را بهصورت کامل حفظ کند. این امکان به کاربر اجازه میدهد که در قالب یک گفتوگوی برخطّ و بدون نیاز به تکرار پیشنیازها و مفروضات پرسشهای قبلی، سؤالات تکمیلی، نقضی یا توضیحی خود را در زنجیرهای از پرسشهای متوالی مطرح کند. این ویژگی، تعامل با سامانه را به یک گفتوگوی علمی واقعی نزدیکتر میسازد.
* مکانیزم بازخوردگیری برای بهبود مستمرّ
در پایان هر پاسخ، کاربر میتواند با اختصاص امتیاز مثبت یا منفی، کیفیت و دقّت پاسخ ارائهشده را ارزیابی کند. از این دادههای بازخوردی، برای تنظیم و بهینهسازی پارامترهای موتور هوشمند، غنیسازی مجموعهدادههای آموزشی و در نهایت، افزایش دقّت، سرعت و کیفیت پاسخهای آتی استفاده میگردد. این، یک چرخه بهبود مستمرّ را شکل میدهد که در آن، سامانه با استفاده از تعامل با کاربران، روزبهروز هوشمندتر میشود.
چشمانداز توسعه
با توجّه به اینکه نسخه فعلی، نخستین انتشار از سامانه «گفتوگو با کتاب» است، ارتقاء و گسترش قابلیتهای آن در دستور کار مرکز نور قرار دارد. مهمّترین محورهای چشمانداز این سامانه، عبارتاند از:
* ارتقاء تعامل با یک کتاب خاصّ
بهبود رابط کاربری برای گفتوگوی متمرکز بر یک کتاب و طراحی صفحه مربوط به آن در داخل خود کتاب، از برنامههای آتی برای توسعه این بخش است.
* گفتوگو با منابع منتخب
افزودن امکان انتخاب هوشمندانه و پویای چند کتاب، مثل مجموعه آثار یک نویسنده، کتب یک مکتب فکری خاصّ و یا کتابهای موجود در قفسه شخصی کاربر، و نیز محدودکردن گفتوگو به این مجموعه منتخب، از دیگر برنامههای توسعه این سامانه است. این ویژگی، در پژوهشهای تطبیقی و مقایسهای، کاربرد بسیاری خواهد داشت.
نتیجه
سامانه هوشمند «گفتوگو با کتاب» را میتوان نقطه عطفی در فرایند دیجیتالسازی تعاملی و هوشمند علوم اسلامی به شمار آورد. این سامانه که حاصل تلفیق دانش دیرپای اسلامی با فنّاوری پیشرفته هوش مصنوعی است، باتکیهبر کلاندادگان بینظیر کتابخانه دیجیتال نور، توانسته است پلی استوار و کارآمد میان پژوهشگران و متون اصلی و مرجع ایجاد کند. ویژگیهای منحصربهفرد و تحسینبرانگیزی چون: ارائه پاسخ کاملاً مستند با قابلیت ارجاع مستقیم به منبع، تحلیل عمیق مفهومی فراتر از جستوجوی کلیدواژهای، پشتیبانی از تعامل چندزبانه و نیز امکان گفتوگوی هدفمند با یک کتاب خاصّ، این ابزار را به همراهی قدرتمند و یک «همکار پژوهشی هوشمند» برای محقّقان علوم اسلامی تبدیل کرده است. انتظار میرود که این سامانه با قابلیتهای موجود، همراه با تحقّق چشماندازهای توسعه ترسیمشده، به یکی از پُرکاربردترین زیرساختهای پژوهشی در حوزه علوم اسلامی و انسانی مبدل گردد.