نقش معاجم موضوعی در بازیابی اطلاعات

پنج شنبه, 30 شهریور 1396 ساعت 12:43
    نویسنده: حمیدرضا شیرملکی* این آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید

اشاره

در برنامه های نرم افزاری مرتبط با علوم عقلی و به ويژه منابع فلسفی، جستجوی لفظی، يکی از شيوه های کارآمد برای بازيابی اطلاعات است که در اين شيوه، شناسايی اطلاعات، صرفاً از طريق جست و جوی الفاظ صورت می گيرد. علاوه بر اين، جست و جوی مفهومی و کمک از معاجم موضوعی نيز می تواند بسيار راهگشا باشد. در معاجم موضوعی با استخراج موضوع و نمایه و کلیدواژه از متون، محقق به دقيق ترين پاسخ ها رهنمون می شود. در این نوشته، سعی بر آن است تا حدی فرآیند عملیاتی، روش فرآوری و کارايی معاجم موضوعی برای پژوهشگران تبيين گردد.

کلیدواژگان: معجم موضوعی، جست و جوی مفهومی، موضوع برداری، نمایه بر متن.

پژوهش بهتر در زمان کمتر

تهیه و تولید معاجم موضوعی، از جمله فعالیت های برجسته در مرکز تحقیقات کامپیوتری علوم اسلامی است. در تولید محصولاتی از این دست، هدف اصلی، فراهم کردن بستری پیش روی محققان است تا پژوهشی بهتر را در زمانی بسیار کم به انجام رسانند. در این راستا، عمده فعالیت سال های اخیر پژوهشگران گروه علوم عقلی (واحد فلسفه) این مرکز، معطوف به انجام پژوهش هایی از این طیف است؛ مانند: معجم موضوعی آثار فلسفی ملاصدرا (ره)، معجم موضوعی حکمت اشراق و معجم موضوعی منطق.

انواع پژوهش در محصولات رایانه ای

از شایع ترین روش های پژوهش در محصولات رایانه ای، جست وجوی لفظی است؛ یعنی پژوهشگر با توجه به منابعی که به صورت دیجیتال در قالب یک نرم افزار در اختیار او قرار می گیرد، امکان جستجوی هم زمان در تمام منابع موجود در نرم افزار را خواهد داشت. بنابراین، در این روش، هرچه موتور جست و جوی شما قوی تر باشد و از فناوری های پیچیده متن کاوانه هوشمندتری برخوردار باشد، می تواند شما را به محتوای مورد نظر نزدیک و نزدیک تر کند؛ مانند اینکه نرم افزار بتواند تمام مشتقات و مرتبطات کلمه یا واژه مورد نظر کاربر را به صورت هوشمند جست و جو نماید؛ امّا در بسیاری از موارد، به خصوص در علوم عقلی و فلسفی، روش جست وجوی لفظی با تمام توانایی های متن کاوانه ای که می تواند داشته باشد، قادر نخواهد بود پژوهشگر را به مطلوبش برساند؛ مثلاً محققی که به دنبال مطالبی درباره «تشکیک وجود» در کتاب ها و منابع فلسفی است، چنانچه از طريق جست و جوی لفظی اقدام کند، به سطوری از منابع رهنمون می شود که لفظ «تشکیک وجود» در آنها هست؛ امّا سطور مذکور مطلبی پیرامون این موضوع ندارند و گاهی نیز متونی را که مرتبط با موضوع است، ولی در ظاهر شامل الفاظ مزبور نیست، از چشم محقق دور نگاه می دارد. اهل فن واقف اند که در علوم فلسفی، از این دست امور به وفور در منابع فلسفی یافت می شود. این مهم، مقتضی آن بود تا علاوه بر ارائه امکان جستجوی لفظی کارآمد و قوی، امکان جست و جوی «مفهومی» نیز برای کاربران و پژوهشگران فراهم آيد و به تبع آن، فهم مطالب پیچیده و ملال آور نیز آسان تر شود. در این راستا، در مرکز تحقيقات کامپيوتری علوم اسلامی نرم افزارهایی تهیه شد که افزون بر امکان جست و جوی لفظی، جست وجوی مفهومی را نیز به خوبی انجام دهد؛ همچون نرم افزارهای درختی و معاجم موضوعی که این مهم را به خوبی انجام می دهند.

عملکردهای اصلی معاجم موضوعی

موضوع برداری، ساخت نمایه و ایجاد کلیدواژه، سه عملکرد اصلی در معاجم موضوعی است.

1. موضوع برداری از متن

در این مرحله، ابتداء متن کتاب توسط محققان خوانده و درک می شود. پس از اين، موضوع يا موضوعاتی به هر قسمت از متن اختصاص داده می شود. موضوع که معمولاً یک عبارت یک سطری است، چکیده و خلاصه متنی است که به ندرت از چند سطر افزون تر است و به طور معمول، با حذف عبارات اضافی و گاهی مغلق متن و یا با اضافه کردن عباراتی جایگزین و به دور از پیچیدگی، محقق را از صرف زمانی طولانی برای درک مطلب بی نیاز می نماید. در واقع، زمانی را که چندین محقق به طور جداگانه، برای فهم مطلب صرف می کنند، دست‏اندرکاران معاجم موضوعی، یک بار به جای همه صرف می کنند. در اختصاص موضوع به متن، تلاش بر این است که موضوعات، مختصر و گویاتر از متن کتاب باشند؛ هر چند مشکلات و موانعی هم در اين مسير وجود دارد که کار را سخت نموده و در نتيجه، به ايجاد ابهاماتی هم منجر می شود.

موضوع، لزوماً یک جمله اسمیّه است که اغلب با مصدر صَناعی شروع می شود. هر موضوع، به متن کتاب پیوند دارد. از این رو، محقق می تواند از طریق موضوع به متن اصلی برسد. امکان جست وجوی پیشرفته ای که در نرم افزارها تعبیه شده، دسترسی آسان به موضوعات مورد نظر کاربر و محقق را مقدور ساخته است. هر موضوع، علاوه بر اتصال به متن، به نمایه ها و کلیدواژه های استخراج شده از آن نیز پیوند دارد.

2. نمایه بر موضوع

نرم افزار معجم موضوعی آثار فلسفی ملاصدرادنباله منطقی موضوع برداری، ساخت نمایه است. بعد از استخراج موضوع از متن که چکیده و شکسته ای از آن است، بار دیگر شکسته می شود تا نمایه هایی که از اوّل آبستن آنها بوده، متولد شود. نمایه، مهم ترین راهنما و نشانه برای جستجوی مفهومی در موضوعات و متون است. مهم نيست که لفظ آن در متن یا موضوع باشد یا نباشد؛ زیرا محقق در پی مفهومی است که در عبارت موضوع و متن، پوشیده است.

هر نمایه از دو جزء یا به عبارتی، دو واژه یا اصطلاح تشکیل شده است. منظور از جزء و واژه یا اصطلاح، یک کلمه مفرد نیست؛ بلکه گاهی جزء، ترکیبی دوکلمه ای یا چندکلمه ای است که روی هم، یک جزء از دو جزء نمایه را تشکیل می دهد؛ مثلاً «الصادر الأول عند صدر المتألهین»، یک نمایه دو جزئی است که جزء اوّل آن (الصادر الأوّل)، خود ترکیبی دوکلمه ای است؛ «آیة قل هو الله أحد» نیز یک نمایه دوجزئی است؛ «آیة» و «قل هو الله احد» که جزء دوم آن، خود ترکیبی چهار کلمه ای است. یا مثلاً قواعد فلسفی مانند «قاعدة الشیء ما لم یجب لم یوجد»، در اصطلاح، یک نمایه است؛ زیرا «الشیء ما لم یجب لم یوجد» در فلسفه یک قاعده است و روی هم یک واژه یا اصطلاح به حساب می آید.

بنابراین، نمایه های استخراج شده، ارتباط مستقیمی با بحث اصلی دارند؛ به عبارتی، هر چند یک موضوع از واژگان متعددی تشکیل شده، اما فقط آن واژگانی در پردازش نمایه ها به کار می روند که بیانگر بحثی باشد و متن اصلی کتاب آن را مطرح کرده و در پی ارائه مفهومی از آن است.

هر نمایه به موضوعش اتصال دارد. ازاین رو، کاربر می تواند از طریق نمایه، به موضوع، و از طریق موضوع، به متن کتاب برسد. نیز می تواند به تمام موضوعاتی که آن نمایه از آنها استخراج شده و پیرو آن، به تمام متن هایی که حاوی آن نمایه اند، دست یابد. بدین ترتیب، محققی که قصد دارد مثلاً در مورد «معاد جسمانی» تحقیق کند، با جست وجوی نمایه «المعاد الجسمانی» در قسمت نمایه ها، می تواند تمام متن هایی را که در مورد معاد جسمانی بحث کرده اند، به دست آورد؛ هرچند آن متن ها دارای این الفاظ نباشند.

3. کلیدواژه بر نمایه

در مرحله سوم و پس از ساخت نمایه، عمل ایجاد کلیدواژه انجام می شود. هر نمایه وقتی شکسته شود، دو جزء از آن حاصل می آید که هر کدام، کلیدواژه نام دارد. کلیدواژه ها نیز به نمایه ها متصل هستند تا در نهایت بتوانند محقق را به متن کتاب برسانند؛ مثلاً کلمه «المعاد» به تمام نمایه هایی که یکی از دو جزء آن را تشکیل داده، متصل است؛ همچون «المعاد الجسمانی»، «المعاد الروحانی»، «المعاد فی القرآن»، «المعاد فی الأحادیث»، و «المعاد عند الشیخ الرئیس».

محصول ارزشمند این تدبیر، دستیابی محقق به تمام متن هایی است که در آن از «المعاد» بحث شده است؛ هر چند لفظ آن در متن نیامده باشد. کلیدواژه ها دروازه ای برای رسیدن به نمایه ها هستند. محقق می تواند با ورود به نمایه ها، ترکیب های کلیدواژه مورد نظرش را با واژه های دیگر که به صورت نمایه ثبت شده، ببیند و از میان آنها، نزدیک ترین ترکیب را با مفهوم مورد نظر خود انتخاب نماید و سپس، به مطلب دلخواه خویش در موضوعات و متون دست یابد.

ریشه، مترادف و مرتبط سازی

در کنار اعمال اصلی معاجم موضوعی (موضوع، نمایه و کلیدواژه)، برای فراهم کردن آسان جستجو در خود همین کلیدواژه ها و از طریق آنها کاوش در نمایه ها و موضوعات و در نهایت متن منابع، کارهای دیگری نیز در معاجم موضوعی انجام می گیرد که به آنها اشاره می شود:

اغلب کلیدواژه ها، دارای ریشه ای هستند که از آن مشتق شده اند. به استثنای اسامی عَلَم، ریشه تمام کلیدواژه ها نگاشته شده اند و در پیوند با کلیدواژه می باشند. این کار، جست وجو را برای محقق آسان می کند.

و نیز همچنان که بر تمام اهل فن واضح است، در تمام علوم، گاه کلماتی هستند که همگی بر یک معنا دلالت می کنند؛ کلماتی از اين دست را «مترادف» می گویند. در معاجم موضوعی، از میان این چند مترادف، یکی به عنوان کلیدواژه اصلی در نظر گرفته شده و واژگان دیگر که مترادف آن اند، آویخته به این واژه اصلی هستند؛ به گونه ای که اگر محقق هرکدام از واژگان مترادف را جست و جو کند، به واژه اصلی رهنمون می شود.

نرم افزار معجم موضوعی حکمت اشراقفایده اصلی مترادف سازی، تقلیل کثیر است؛ به جای اینکه از چندین کلیدواژه که همگی مفید یک معنا هستند، استفاده شود، یکی به عنوان اصلی قلمداد می شود و در تمام مواضع، همان به جای همه به کار می رود؛ مثلاً «شیخ الإشراق»، «السهروردی» و «شهاب الدین السهروردی» مترادف اند؛ به این معنا که اشاره به یک نفر است و هر سه، در متون فلسفی به کار رفته اند؛ اما از بین این سه، مثلاً «شیخ الاشراق» به عنوان واژه اصلی تلقی شده تا همه جا از همین یک شکل استفاده شود؛ حتی در قبال آن موضوع ها و متن هایی که این تعبیر در آنها به کار نرفته و بلکه مثلاً «السهروردی» به کار رفته است. با این توضیح، به دلیل پیوندی که مترادف ها با واژه اصلی دارند، به حال محقق فرقی نمی کند کدام را جستجو کند؛ زیرا در هر حال، به یک نتیجه می رسد.

هر کلیدواژه ممکن است ارتباط مستقیمی با چندین کلیدواژه دیگر داشته باشد؛ آن واژگان دیگر، «مرتبط» نام گذاری شده اند. یک کلیدواژه احتمال دارد به طرق مختلف مرتبطاتی داشته باشد؛ مثلاً اگر کلمه «الشفاء» را به عنوان یک کلیدواژه در نظر بگیریم، کلماتی همچون: «الشیخ الرئیس»، «الإشارات و التنبیهات» و «الکتب»، برخی از مرتبطات آن خواهد بود که محقق با دیدن واژه «الشفاء» و مرتبطات آن، در می یابد منظور از «الشفاء» یک کتاب است که به کتابی مانند «الاشارات و التنبیهات» و فیلسوفی مانند «الشیخ الرئیس» ارتباط دارد و نیز می فهمد که منظور، کتاب شفای جناب بوعلی است.

پس، در اینجا سعی بر آن است کلماتی به عنوان مرتبط یک کلیدواژه نگاشته شوند که اوّلاً ارتباط مستقیمی با آن کلیدواژه داشته باشند و ثانیاً خود آن مرتبطات در دیتای کلیدواژه ها آمده باشند. در مثال فوق، تمام آنچه به عنوان مرتبطات «الشفاء» نگاشته شده اند، خود نیز به عنوان کلیدواژه به نگارش در آمده اند. در اینجا نیز هر کلیدواژه ای به مرتبطاتش پیوند دارد تا کاربر بتواند هنگام جست و جوی یک کلیدواژه، مرتبطات آن را نیز مشاهد کند.

البته برای مرتبط سازی، فواید دیگری نیز وجود دارد که به دو مورد از آن اشاره می کنیم:

  1. ابهام زدایی: وقتی برای کلیدواژه «التطبیق»، کلیدواژه هایی همچون: «السلمی»، «المسامتی» و «الموازاة» به عنوان مرتبط در نظر گرفته شود، کاربر خود به خود در می یابد که مراد از کلمه «التطبیق»، برهانی است که برای اثبات تناهی ابعاد به کار می رود؛ زیرا می داند این واژه ها که به عنوان مرتبط ذکر شده اند، در این زمینه اصطلاح شده اند.
  2. آشنایی با آثار بزرگان، شاگردان و معاصران آنها: کلیدواژه هایی که اسم اشخاص باشند، مرتبطاتشان معمولاً آثار آن شخص، شاگردان وی و برخی از هم‏روزگاران وی می باشد. طبیعی است که این امر، آشنایی هر چه بیشتر کاربر با آن شخصیت را فراهم می کند.

سخن پایانی

آنچه گفته شد، مروری اجمالی بود بر روند تهيه معاجم موضوعی و نقش آن در شکل گیری و تکميل پژوهش های محققان عرصه علوم عقلی. در پايان، لازم است به اين نکته اشاره شود که ارزش علمی معاجم موضوعی، بسیار بالاتر از محصولاتی از قبیل کتابخانه های دیجیتال است؛ اما وقت و هزینه فراوانی که در این مسیر صرف می شود، مانع از آن است که بتوان همه منابع یا حداقل منابع لازم را به این روش تحلیل کرد. بر اين اساس، همان طور که مشاهده می شود، در برنامه های معاجم موضوعی، منابع کمتری ارائه، تحليل و غنی سازی شده اند.

ضعف در اطلاع رسانی و آسان نبودن استفاده از معاجم موضوعی به دلیل پیچیدگی های رابط کاربری آنها نيز زمينه استقبال کم کاربران از اين برنامه ها را فراهم آورده است. اميد است که با فراهم آوردن زمينه آموزش کاربران، به ويژه کاربران هدف، محققان و علاقه مندان، استفاده بيشتر و مطلوب تری از اين محصولات ببرند.

پی نوشت:

اطلاعات تکميلي

  • تاریخ انتشار نسخه چاپی: سه شنبه, 28 شهریور 1396
  • صفحه در فصلنامه: صفحه 39
  • شماره فصلنامه: فصلنامه شماره 59
بازدید 320 بار
شما اينجا هستيد:خانه