مروری بر کاربرد نظام‌های خبره و هوشمند در بازیابی اطلاعات

چکیده: با وجود مطالعات نظری نسبتا زیادی که در زمینه استفاده از نظام‌های خبره و هوشمند در بازیابی اطلاعات صورت گرفته، اما به طور نسبی نظام‌های بازیابی اندکی را می‌توان مشاهده کرد که در آنها از قابلیت‌های نظام‌های خبره و هوش مصنوعی استفاده شده باشد. به تعبیر دیگر، در اغلب این‌گونه نظام‌ها، استفاده از الگوهای سنتی بازیابی اطلاعات نظیر منطق بولی قابل مشاهده است.. بررسی متون مرتبط نشان می‌دهد که اغلب پیشرفت‌ها در این زمینه مرتبط با مفاهیم پردازش هوشمند متن، واسط‌های هوشمند و عامل‌های هوشمند بوده است. این مقاله سعی دارد به طور نظری میان اهداف مورد انتظار از نظام‌های خبره و هوشمند و فرایند بازیابی اطلاعات ارتباط برقرار کند. در نهایت، با رویکردی کاربرمدار این موضوع مورد تاکید قرار می‌گیرد که ماهیت برخی فرایندها در بازیابی اطلاعات مرتبط با نیاز اطلاعاتی واقعی کاربر به گونه‌ای پیچیده است که به دشواری می‌توان نظام‌های خبره و هوش مصنوعی را به طور کامل جایگزین آن کرد.

مقدمه

مقالات و متون متعددی در مورد مفهوم و کاربردهای نظام‌های خبره و هوش مصنوعی نوشته شده است. با این حال، جست‌جو در ویرایش پیوسته (2004) پایگاه چکیده مقالات کتابداری و اطلاع‌رسانی (لیزا)‌ نشان داد که به طور نسبی مقالات اندکی در خصوص کاربردهای عینی نظام‌ها‌ی خبره و هوشمند در بازیابی اطلاعات نوشته شده است. هدف مقاله حاضر، پاسخگویی به این سؤال است که آیا نظام‌های خبره و هوش مصنوعی (هوشمند) را می‌توان در نظام‌های بازیابی اطلاعات مورد استفاده قرار داد و اگر چنین است کاربرد عینی آنها در این‌گونه نظام‌ها چگونه است. مروری بر تحقیقات انجام شده در حوزه کتابداری و اطلاع رسانی در این زمینه نشان می‌دهد که ابهام‌هایی در خصوص کاربردهای عینی فن‌آوری‌های خبره و هوش مصنوعی در بازیابی اطلاعات مشاهده می‌شود. چه بسا، یکی از دلایل این امر انتشار متون و مقالاتی است که بیشتر بر جنبه‌های نظری تاکید داشته‌اند. این موضوع توسط لنکستر و وارنر در کتاب" کاربرد فناوریهای هوشمند در خدمات کتابداری و اطلاع‌رسانی" برجسته شده است (لنکستر و وارنر، 2001، ص1). در واقع، این ابهام وجود دارد که آیا نظام‌های مورد بحث در این‌گونه متون و مقالات، به طور عینی به مرحله بهره برداری رسیده‌اند و در پایگاه‌های اطلاعاتی حاوی انواع مختلفی از اطلاعات، برروی دیسک فشرده یا شبکه‌های پیوسته، مورد استفاده قرارگرفته‌اند، یا اینکه تنها ساختار و عملکردهای آنها به طور نظری مورد بحث قرارگرفته است، یا در بهترین شکل، در قالب پیش نمون ارائه شده‌اند. از طریق جدول 1 می‌توان دیدگاهی کلان نسبت به مقالات مرتبط منتشر شده در مجلات حوزه کتابداری و اطلاع‌رسانی که در پایگاه لیزا نمایه شده‌اند بدست آورد.

جدول 1. مقاله‌های مرتبط نمایه شده در پایگاه پیوسته چکیده مقالات کتابداری و اطلاع رسانی (لیزا : 2004)

کلیدواژه (های) مورد جست‌جو
فیلد مورد جست‌جو
تعداد مقالات

1
(Expert System* OR AI OR Intelligen*) AND Retrieval
توصیفگر
255

2
(Expert System* OR AI OR Intelligen*) AND Retrieval
عنوان مقالات
28

3
(Expert System* OR AI OR Intelligen*) AND Retrieval AND Application*
عنوان مقالات
3

4
(Expert System* OR AI OR Intelligen*) AND Retrieval AND Application*
توصیفگر
1

دو رویکرد را می‌توان در خصوص کاربرد نظام‌های خبره و هوشمند در متون مختلف مشاهده کرد. تعدادی از مؤلفان عقیده دارند که کامپیوتر می‌تواند به طور مجازی تقریبا هر کاری را که انسان انجام می‌دهد، شبیه‌سازی کند. نمونه بارز این ادعا را می‌توان در طراحی برنامه‌هایی که قادرند در سطح بسیار بالایی شطرنج بازی کنند، مشاهده کرد. برخی دیگر از مولفان، این ادعا را تا حدود زیادی اغراق آمیز می‌دانند و مدعی هستند که کامپیوتر هرگز نمی‌تواند اعمالی را انجام دهد که واقعا هوشمندانه باشند. حال این سؤال مطرح است فارغ از بحث‌های جنجالی میان این دو طرز تفکر، در حال حاضر نظام‌های خبره و هوشمند چه کاربردهای عینی را توانسته‌اند در بازیابی اطلاعات ایفا کنند و آیا ماهیت بازیابی اطلاعات به گونه‌ای است که بتوان از نظام‌های خبره و هوشمند برای بهبود عملکرد آن، یعنی همان بازیابی "بیشترین اطلاعات مرتبط با نیاز اطلاعاتی کاربر"، در یک پایگاه اطلاعاتی بهره جست. در اینکه کامپیوتر می‌تواند برخی امور (نظیر ذخیره و بازیابی حجم بسیار زیادی از اطلاعات یا انجام تجزیه و تحلیل‌های آماری پیچیده)، را بهتر از انسان انجام دهد شکی نیست، اما باید به این پرسش نیز پاسخ داده شود که در مواردی که نیاز به تصمیم‌گیری مبتنی بر تجزیه و تحلیل نیاز اطلاعاتی کاربر و مطابقت آن با محتوای یک مدرک (انواع مختلفی از اطلاعات شامل متن، صوت و تصویر) موجود در یک نظام بازیابی اطلاعات است، آیا نظام‌های خبره و هوشمند می‌توانند بهبود اساسی را در فرایند تشخیص این‌گونه مدارک با نیاز اطلاعاتی کاربران نهایی ایفا نمایند. تشخیص ربط خود از طریق کاربر یا متخصصان موضوعی با پیچیدگی‌های فراوانی روبه‌رو است. به طور مثال، نیازها‌ی اطلاعاتی و رویکردهای موضوعی افراد در رویاوریی با یک مدرک ممکن است متفاوت باشد. همچنین، حتی نیازی واحد از سوی یک فرد نیز ممکن است در زمان‌های مختلف تغییر پیدا کند.

سؤالاتی از این قبیل در حوزه بازیابی اطلاعات از دیدگاه هرمنوتیک که بیشتر بر جنبه‌های ذهن‌گرایانه و تفاسیر مختلف از یک موضوع تاکید دارد، مورد بحث قرار گرفته است (نشاط، 1382). بنا براین، این سؤال بنیادی مطرح است که آیا نظام‌های خبره و هوشمند را می‌توان در مقوله‌ای ذهن‌گرایانه، یعنی تطابق زبان جست‌جو با نمادهای معرف محتوای مدارک از یک سو و نیاز اطلاعاتی استفاده‌کنندگان از سوی دیگر به‌کار برد. به عبارت دیگر، هر سه عنصر اصلی در بازیابی اطلاعات یعنی زبان جست‌جو، توصیفگرهای معرف محتوای مدارک در یک پایگاه اطلاعاتی، و نیاز اطلاعاتی بیان شده استفاده کننده تحت تأثیر دیدگاه هرمنوتیک هستند.

البته، رویکرد دیگری را نیز می‌توان مشاهده کرد که در آن تآکیدی بر نیازهای اطلاعاتی کاربران نمی‌شود. به طور مثال، در طرحهای گرانفیلد یک و دو که تحقیقات بازیابی اطلاعات به صورت تجربی و آزمایشگاهی دنبال شده است، به نیاز اطلاعاتی کاربران توجه نشده است و تنها بهبود کارآیی نظام‌های بازیابی اطلاعات از نقطه نظر تطابق میان زبان جست‌جو و نمادهای معرف محتوای مدارک مورد آزمون قرار گرفته است. چنین رویکردی را می‌توان در متون مرتبط با حوزه کامپیوتر بیشتر مشاهده کرد. برای اینکه بتوان تا حدودی به سؤال مطرح شده در این مقاله پاسخ داد، می‌توان هدف نظام‌های بازیابی اطلاعات را از یک سو و امکانات و قابلیت‌های نظام‌های خبره و هوشمند را از سوی دیگر مورد بحث قرار داد.

نظام خبره و هوشمند چیست؟

الف. نظام هوش مصنوعی (هوشمند)

در اغلب متون، این مفهوم دلالت بر نظامی دارد که قادر است برخی اعمال هوشمندانه انسان را شبیه‌سازی کند. فنلی تعریف شفافی از نظام‌های هوش مصنوعی ارائه داده است: "برنامه‌های کامپیوتری که به منظور شبیه‌‌سازی قدرت استدلال‌گرایی انسان طراحی شده‌اند و می‌توانند از اشتباهات خود درس بگیرند و قادرند به صورت سریع و خبره اعمالی را انجام دهند که انجام آنها نیاز به تخصص انسان دارد" (فنلی، 1992). کاسی در کتاب خود تحت عنوان "ماهیت هوش مصنوعی" این مفهوم را یک حوزه کلان از علم به شمار آورده است که ممکن است در اذهان مردم معانی مختلفی را (نظیر روبات‌های مصنوعی) را تداعی کرده باشد. هوش مصنوعی قرار است وظایفی را انجام دهد که نیاز به هوش انسان دارد (کاسی، 1998). در این وادی، این پرسش مطرح است که آیا بسیاری از وظایفی نظیر محاسبات و تجزیه و تحلیل‌های پیچیده ریاضی که برنامه‌های کامپیوتری قادرند آنها را با سرعت، دقت، و صحت بیشتری نسبت به انسان انجام دهند (نظیر برنامه‌های تجزیه و تحلیل آماری) می‌توان مصادیقی از یک نظام هوشمند به شمار آورد. اگرچه کامپیوتر چنین اعمالی را می‌تواند با دقت و صحت بیشتری نسبت به انسان انجام دهد، اما در نقطه مقابل، کارهای بسیار ساده‌ای نیز وجود دارند که انسان قادر است آنها را به سهولت انجام دهد. به طور مثال، تشخیص چهره افراد برای انسان کاری بسیار معمولی محسوب می‌شود، ولی برای نظام‌های کامپیوتری فرایندی بسیار پیچیده، دشوار و چه بسا نا ممکن محسوب می‌گردد. نظام‌های هوشمند قصد دارند به اموری بپردازند که برای انجام آنها نیاز به سطح بالایی از استدلال‌گرایی و تصمیم گیری است.

فورد چنین تعریفی از یک نظام هوشمند ارائه داده است: "نظام هوشمند نظامی است که حداقل از برخی از قواعد دانش اکتشافی (نه لزوما در سطح خبره) استفاده کند یا بتواند قضاوت‌ها یا تصمیم گیری‌هایی را با وجود نامعلوم بودن یا ناقص بودن شواهد موجود انجام دهد" (فورد، 1991، ص8)

با بررسی متون مرتبط دو هدف اصلی را می‌توان در ایجاد نظام‌های هوش مصنوعی به منظور شبیه‌سازی اعمال هوشمندانه انسان شناسایی کرد:

درک و بررسی بهتر جنبه‌های مختلف هوش انسان و امکان شبیه‌سازی آن توسط ماشین

طراحی برنامه‌های کاربردی هوشمند برای انجام وظایفی که نیاز به هوش انسان دارد
طبق نظرات مک‌کارتی و هیس، مشکلی که حوزه هوش مصنوعی با آن روبه‌رو است، با جنبه‌های معرفت شناسی و اکتشافی مسائل در ارتباط است. برخی اعمالی را که نظام‌های خبره انجام می‌دهند به هیچ وجه نمی‌توان هوشمند دانست. در واقع، نظام‌های هوش مصنوعی باید از درجه بالایی از استدلال‌گرایی و تصمیم‌گیری در شرایط و موقعیت‌های مختلف برخوردار باشند. استفاده از منطق اکتشافی اساس کار نظام‌های هوشمند به شمار می‌آیند، بنا‌براین، حتی برنامه‌هایی که از سطح بسیار بالایی از تحلیل‌های آماری و ریاضی استفاده کنند را نمی‌توان یک نظام هوشمند تلقی کرد.
ب. نظام خبره

فورد نظام خبره را اینگونه تعریف کرده است: "برنامه‌های کامپیوتری همراه با دانش، اطلاعات، و پایگاه‌های اطلاعاتی که در ارتباطی پویا با یکدیگر سعی دارند به حل مسائل و فرایندهای تصمیم گیری در مقیاس نسبی محدودتری نظیر آنچه انسان انجام می‌دهد، بپردازند".

ویژگی‌های خاص نظام خبره طبق نظر فورد (1991، ص8) عبارتند از:

توانایی رویارویی با داده‌هایی که ممکن است در آنها عدم قطعیت یا ناکامل بودن دیده شود (به طور مثال سیستم بتواند پاسخی نظیر "نمی‌دانم" یا "ممکن است" یا "احتمالا" را ارائه دهد).

توانایی دسترسی به نتیجه گیری‌هایی با عدم قطعیت و در جایی که لازم است ارائه چندین رهیافت یا راه حل برای مسئله‌ای مشخص (هنگامی که جواب قطعی در مورد یک مسئله وجود ندارد صورت گیرد).

توانایی توضیح اینکه چرا سؤالی مشخص پرسیده می شود و چگونه سیستم می‌تواند برای آن پاسخ مناسب و مشخصی پیدا کند.
فورد همچنین در کتاب خود به خوبی به تشریح وجوه تمایز نظام خبره با دیگر نظام‌های کامپیوتری الگوریتمی پرداخته است:
"آنچه به طور نسبی در ذخیره و بازیابی اطلاعات موضوع جدیدی تلقی می‌شود، قابلیت ذخیره و بازیابی نه تنها داده‌های عددی و الگوریتمی، بلکه داده‌های نمادین و اکتشافی است. با توسعه نرم افزارها و سخت افزارها، انجام فرایندهای مبتنی بر دانش اکتشافی با سهولت بیشتر و هزینه کمتری قابل انجام است. دانش نمادین (در نقطه مقابل دانش عددی) چیزی است که ما برای تصمیم گیری‌ها و قضاوت‌های خود از آن استفاده می‌کنیم، و این اغلب از طریق دسترسی به نتایجی از شواهد موجود به دست می‌آید.

اسپانگلر و می (2000) در دایره‌المعارف کتابداری و اطلاع‌رسانی این‌گونه به تشریح نظام خبره پرداخته‌اند:

نظام خبره، ابزاری نرم افزاری است که مبتنی بر فن‌آوری هوش مصنوعی توسعه یافته است. در ابتدا، هدف از طراحی نظام‌های خبره، شبیه‌سازی و چه بسا جایگزینی توانایی استدلال گرایی انسان در رویارویی با مسائل مختلف بوده است. اما امروزه، عملکردهای معمولی‌تری از نظام‌های خبره به منظور کمک به انجام برخی امور نظیر تشخیص بیماری‌ها، کنترل فرایندها در چرخه تولید محصولات، تجزیه و تحلیل‌های مالی، تفسیر داده‌ها و مانند آن انتظار می رود.

ارتباط نظری میان نظام‌های خبره و هوشمند و فرایند بازیابی اطلاعات

نکاتی که در تعاریف فوق آمده به اجمال مورد اشاره قرار می‌گیرد و در مورد ارتباط منطقی هر یک از آنها با فرایند بازیابی اطلاعات می‌شود:

الف. شبیه‌سازی قدرت استدلال و تصمیم‌گیری انسان. این پرسش را می‌توان مطرح کرد که در نظام بازیابی اطلاعات چه فرایندی باید توسط ماشین شبیه‌سازی شود که قبلا وابسته به قدرت استدلال‌ انسان بوده است. شاید یکی از مهم‌ترین نقش‌های انسان در مرحله بازیابی اطلاعات، انتخاب کلیدواژه‌های مرتبط با موضوع مورد نظر و ترکیب آنها از طریق عملگرهای مختلف از یک سو و تشخیص میزان ربط مدارک بازیابی شده با موضوع مورد نظر از سوی دیگر باشد. اینکه چنین اعمالی نیاز به استدلال دارد یا خیر خود قابل بحث است. بدون شک، حداقل حوزه اطلاع‌رسانی به دنبال چیزی بیش از تطابق صرف کلیدواژه‌های مورد جست‌جو (نیاز اطلاعاتی بیان شده نه واقعی)‌ و نمادهای موضوعی در مدارک است. با این همه، تحقیقات زیادی به صورت تجربی و آزمایشگاهی تحت عنوان طرحهای گرانفیلد یک و دو صورت گرفته است که در اغلب آنها چنین رویکردی مورد تأکید بوده است. چه بسا، فرایند فوق نیاز زیادی به قدرت استدالا‌ل انسان نداشته باشد و ماشین بتواند از طریق نظام‌های فرعی نظیر اصطلاحنامه‌ها و پرونده‌های واژگان فرایند کاوش را انجام دهد. اگر هدف پاسخگویی به نیاز اطلاعاتی واقعی کاربران باشد، آنگاه قدرت استدلال انسان در تشخیص میزان ربط کلیدواژه‌های جست‌جو از یک سو و مدارک بازیابی شده از سوی دیگر اهمیت پیدا می‌کند. بنا براین، حداقل به طور نظری اگر نظامی به دنبال پاسخگویی به چنین نیازی از طریق از میان برداشتن یا کم رنگ کردن نقش انسان (اغلب متخصصان موضوعی و کاوش) باشد، نظام‌های خبره و هوشمند می‌تواند نقش اساسی ایفا نمایند.

ب. انتقال تخصص و یادگیری از طریق بازخوردها. در اغلب نظام‌های خبر و هوشمند به عنصری اساسی نیاز است و آن انتقال تخصص انسان به شکلی قابل ارائه به یک نظام است. در واقع، تولید قواعد یا ترکیب آن با شبکه‌های معنایی یا قالب‌های مختلف، باید توسط شخصی متخصص به نظام انتقال یابد. یک متخصص ممکن است دانش‌های مورد نیاز را از طریق شیوه‌های مختلف نظیر مصاحبه، مشاهده، یا تجربه به دست آورده و وارد نظام کرده باشد. اما گردآوری دانش در حوزه بازیابی اطلاعات توسط متخصصان به منظور به رمز در آوردن آنها برای کامپیوتر، کاری دشوار است، زیرا بسیاری از دانش‌های بدست آمده در این حوزه متکی بر پیش فرض‌هایی است که ممکن است بسادگی مورد تردید قرار گیرند. به طور مثال، مفهوم ربط و نیاز اطلاعاتی از جمله پیش فرض‌هایی است که چه بسا در بسیاری از تحقیقات انجام شده در حوزه بازیابی اطلاعات به طور واقعی به آنها نگاه نشده است. از این رو، دانش‌های بدست آمده مبتنی بر این‌گونه تحقیقات نیز خود با ابهام‌هایی روبه‌رو است.

پورس (200) در مقاله خود تحت عنوان "بازیابی اطلاعات: الگوهای تجربی و تجزیه و تحلیل‌های آماری" روایی برخی از تحقیقات انجام شده در حوزه بازیابی اطلاعات را مورد انتقاد قرار می‌دهد. به طور مثال، وی اشاره دارد که طبق اصول آماری، تعداد کلیدواژه‌های مورد کاوش، تعداد رکوردهای بازیابی شده، تعداد افرادی که به تشخیص مرتبط بودن یا نبودن مدارک بازیابی شده می‌پردازند، و تعداد قضاوت‌های صورت گرفته در خصوص ربط در تحقیقات بازیابی اطلاعات باید منطبق با قوانین نمونه‌گیری باشد تا بتوان نتایج بدست آمده را، به طور مثال، به کل یک پایگاه اطلاعاتی تعمیم داد؛ حال آنکه نمونه‌گیری از کلیدواژه‌هایی که ممکن است استفاده کنندگان برای کاوش خود انتخاب کنند، تقریبا غیر ممکن است. از این رو، این سؤال مطرح است که دانش به‌دست آمده از حوزه بازیابی اطلاعات مبتنی بر چنین تحقیقاتی تا چه حد قابل انتقال به یک نظام خبره یا هوشمند است. این موضوع با نظر مک‌کارتی و هیس که قبلا به آن اشاره شد ارتباط نزدیک دارد؛ زیرا مشکلی که حوزه هوش مصنوعی با آن روبه‌رو است با جنبه‌های معرفت شناسی و اکتشافی مسائل در ارتباط است.

اگر بپذیریم باشیم که دانش مورد نیاز در حوزه بازیابی اطلاعات برای انتقال به نظام خبره و هوشمند برای تعیین و اجرای وظایف یا قواعد، خود با مشکلات بنیادی روبه‌رو است، این سؤال مطرح است که آیا به شیوه‌های دیگری می‌توان به طراحی و توسعه این‌گونه نظام‌ها پرداخت.

برخی متخصصان طراحی نظام‌های خبره در بازیابی اطلاعات، بر قابلیت یادگیری ماشین تأکید دارند. به طور مثال، در فرایند بازیابی اطلاعات، کامپیوتر قادر خواهد بود از بازخورهای به‌دست آمده از کاربران در خصوص مرتبط بودن یا نبودن اسناد بازیابی شده، برای تصمیم‌گیری‌های بعدی خود استفاده کند. یکی از رایج‌ترین فنون اعمال یادگیری توسط کامپیوتر در نرم افزارهای نظام‌های خبره و هوشمند، تولید خودکار قواعد است. از طریق چنین نرم افزارهایی می‌توان نظامی دانش مدار به طور خودکار تولید کرد. در واقع، این نرم افزارها به صراحت از دستورات "اگر"، "پس" برای ارائه قواعد استفاده نمی‌کنند، بلکه به طور خودکار به تولید قواعد مورد نیاز می‌پردازند. اما در این میان، طراح سیستم باید نمونه‌های مورد نظر اولیه را برای برنامه مشخص کند. به این ترتیب، این نرم افزارها توانایی شناسایی قواعد در داده ها را دارند. معنی ضمنی این نکته آن است که برنامه می‌تواند از اطلاعات مربوط به مثال‌ها و نمونه‌های ارائه شده، قواعد مورد نظر را استخراج کند و دانشی را ارائه دهد که قبلا خالق آن طراح برنامه نیست. در واقع، چنین نظام‌هایی قادرند در موارد خاصی دانش جدیدی را تولید کنند که پیش از آن برای انسان قابل دسترس نبوده است. در بسیاری از موارد، کاربران پس از جست‌جوی اولیه به اصطلاح و پالایش کاوش خود می‌پردازند و به این ترتیب ممکن است به اطلاعات مرتبط و مورد نیاز خود دست یابند. حال اگر نظامی بتواند حداقل به طور نظری از اشتباهات و بازخوردهای کاربران برای اصلاح یا تغییر برخی عملکردها در فرایند بازیابی اطلاعات بیاموزد (به طور مثال، کلیدواژه‌های مرتبط را با املای صحیح وارد کند و آنها را با دیگر کلیدواژه‌های مترداف (اغلب از طریق اصطلاحنامه یا سر عنوان موضوعی، یا بازخوردهای دیگر کاربران ترکیب نماید و یا اینکه بر اساس سطح دانش کاوش کاربر از واسط‌های جست‌جوی مختلفی استفاده نماید و …)، می‌‌توان سطحی از خبرگی را در آن یافت.

ج. انجام اعمالی که نیاز به تخصص انسان دارد. نظام‌های خبره برنامه های کامپیوتری هستند که قادرند وظایف معمولی افرادی را که دارای نوعی مهارت یا تخصص ویژه هستند انجام دهند. هدف از طراحی نظام‌های خبره این است که بتوان برخی مهارت‌های خاص را در دسترس عموم قرار داد. مهارت کاوش در پایگاه‌های اطلاعاتی مختلف با واسط‌ها و فرمان‌های کاوش مختلف، اغلب خاص متخصصان کاوش در کتابخانه‌ها و مراکز اطلاع‌رسانی است. حال اگر نظامی بتواند محیطی تعاملی برای جایگزینی چنین مهارت‌هایی را پدید آورد، می‌توان آن را نظام بازیابی خبره به شمار آورد. به طور مثال، حداقل به طور نظری نظامی که قادر باشد، از طریق مصاحبه مرجع، تا حدودی میان نیاز بیان شده و نیاز واقعی کاربر ارتباط منطقی برقرار کند و خود بهترین راهبرد کاوش را در پیش بگیرد، می‌توان آن را خبره تلقی کرد. البته، این سؤال مطرح است که هنگامی که انجام چنین فرایندهایی با استفاده از انسان (متخصص کاوش) ‌با مشکلات و پیچیدگی‌های زیادی روبه‌رو است، ماشین چگونه خواهد توانست بهبودی در آن ایجاد کند. به عبارت دیگر، در نظام‌های خبره دانش مدار باید از قبل دانش و مهارتی را در نظام گنجاند و از آن خواست در شرایط مختلف و مورد نیاز از آن استفاده کند. تجربه و مهارت کسب شده توسط متخصصان کاوش (نظیر فهرست نویسی و نمایه‌سازی) موضوعی است که به سادگی آن را نمی‌توان از طریق نظام خبره ارائه داد. با این همه، تحقیقات در این عرصه می‌کوشند دارند تا هر چه بیشتر بر اساس نیاز بیان شده کاربر به نیاز واقعی او پی ببرند: مسئله‌ای که قرنها بشر نتوانسته است آن را به طور کامل حل کند.

در مثال زیر، نمونه فرضی یک پایگاه دانش نشان داده شده است تا از طریق آن بتوان کاربران را با استفاده از بر پرسش و پاسخ صورت به پایگاه اطلاعاتی مرتبط با نیاز آنها هدایت کرد:

اگر موضوع مورد جست‌جو یک کاربر "اسلام" باشد

و نوع منابع مرجع مورد جست‌جو مقالات مجلات فارسی باشد

و متن کامل مقالات مورد نیاز باشد

سپس توصیه این است که پرس و جوی کاربر در "پایگاه تمام متن نمایه" صورت گیرد

با این همه، با استفاده از شبکه معنایی، به طور نسبی، ارائه نظامی که بتواند به طور خودکار استفاده کنندگان را در جست‌جوی‌های خرد یا کلان کمک کند آسان است. این فرایند را می‌توان از طریق گنجاندن قواعدی که از یک شبکه معنایی برای ارائه نتیجه‌گیری درباره ارتباط میان اصطلاحات استفاده می‌کند انجام داد. یکی از نظام‌هایی که از ساختار شبکه معنایی در بازیابی اطلاعات استفاده می‌کند MenUSE نام دارد. این برنامه، امکان جست‌جوی پیوسته مؤثری را به کاربران، بدون آنکه نیاز به آموزش یا تجربه زیادی در امر کاوش اطلاعات داشته باشند، ارائه می‌دهد. اساس برنامه MenUSE را سرعنوان موضوعی پزشکی تشکیل داده است (پولیت، 1998). هدف از توسعه این برنامه حذف انجام اعمالی است که نیاز به تخصص انسان – یعنی کاوش توسط متخصصان موضوعی با تجربه- دارد.

د. قضاوت با وجود نامعلوم بودن یا ناقص بودن شواهد موجود. چه بسا، مهم‌ترین قضاوتی که در فرایند کاوش باید صورت گیرد نیاز واقعی استفاده کننده است، در حالی که ابعاد آن نامعلوم و اغلب ممکن است اطلاعات به‌دست آمده درباره آن ناقص باشد. این موضوع مورد تأکید قرار گرفته است که باید میان نیازهای بیان شده از سوی استفاده کنندگان نهایی و نیازهای واقعی آنها تفاوت قائل شد. یکی از مهم‌ترین شیوه‌های پی بردن به نیاز واقعی کاربران، مصاحبه مرجع است. بنا براین، حداقل به صورت نظری اگر نظامی قادر باشد مکانیزمی برای مصاحبه با کاربر قبل از انجام کاوش و نیز پس از مرحله بازیابی مدارک انجام دهد، می‌توان سطحی از خبرگی را در آن مشاهده کرد. اینکه نظامی از طریق پایگاه دانش خود بتواند به هر سؤالی که از سوی کاربر مطرح می‌شود، پاسخ دهد و آن را به صورت منطقی ردگیری کند، اگرچه به صورت نظری از طریق دستورات "اگر"، "پس" میسر است، احتمالا ایجاد چنین پایگاهی هزینه بسیار زیادی در بر خواهد داشت. تجربه متخصصان موضوعی و کتابداران مرجع در طول سالیان متمادی در طرح سؤالات پیش بینی نشده و یا حدس زدن نیاز اطلاعاتی آنها از روی رفتار و حتی ظاهر کاربران چیزی است که به سادگی آن را نمی‌توان در قالب نظامی ماشینی اجرا کرد. به طور مثال، آیا یک نظام خبره در پاسخ به این سؤال مطرح شده از سوی یک دانش آموز و دکترای فیزیک در باب نظریه نسبیت، به طور یکسان برخورد خواهد کرد. توانایی توضیح اینکه چرا سؤالی مشخص پرسیده می‌شود، چه کسی با چه ویژگی‌هایی آن را مطرح می‌کند، نیاز واقعی فرد برای دسترسی به اطلاعات مورد نظر چیست و در نهایت چگونه نظام می‌تواند برای چنین سؤالاتی پاسخ مناسب و مشخصی پیدا کند، تقریبا به طور عملی ناممکن است. این نکته که نظام‌های خبره و هوشمند چگونه خواهند توانست مسائل هرمنوتیکی و ذهنی مرتبط با تشخیص ربط و نیاز واقعی کاربران را در فرایند بازیابی اطلاعات حل کنند، چالش‌های اساسی بر سر راه تحقیقات جاری نظام‌های خبره و هوشمند محسوب می‌گردد.

ه. توانایی دسترسی به نتیجه‌‌گیری با عدم قطعیت: ارائه راه‌حل برای مسائل. توانایی هر نظام در رویارویی با مسائل و ارائه راه‌حل‌هایی با عدم قطعیت از استنتاج‌های به‌دست آمده، یکی از مهم‌ترین ویژگی‌های هر نظام خبره به شمار می‌آید. در زندگی روزمره و نیز تصمیم‌گیرهای تخصصی و علمی، اغلب ممکن است نتیجه‌گیرهای ما در مورد مسائل مختلف دارای قطعیت نباشد و با عبارت‌هایی نظیر شاید، احتمال دارد، چه بسا ، ممکن است و غیره همراه باشد. آیا نظام هوشمند یا خبره می‌تواند از یک سو درجه بالایی از استدالال‌گرایی، تصمیم‌گیری و هوشمندی را درفرایند تطابق پرسش‌های کاربران با نمادهای موضوعی مدارک موجود در یک پایگاه اطلاعاتی و از سوی دیگر با نیاز اطلاعاتی واقعی آنها که احتمال دارد در پرسش‌ها منعکس نباشد (یعنی کلیدواژه‌های مورد جست‌جو) برقرار سازد؟ شاید رتبه‌بندی نتایج کاوش و وزن دادن به کلیدواژه‌ها را بتوان نوعی نتیجه‌گیری با عدم قطعیت به شمار آورد. در واقع، برخی معتقدند که با نمایش میزان ربط احتمالی پرسش‌های کاربر و مدارک بازیابی شده (اغلب از طریق نشان دادن درصد ربط) می‌توان نوعی نتیجه‌گیری با عدم قطعیت را در فرایند بازیابی اطلاعات ابراز کرد. هنگامی که یک مدرک با درجه ربط 10 درصد بازیابی می‌شود، نظام بازیابی، قطعیت کامل درباره ربط کامل آن با نیاز کاربر ارائه نداده است. اما خود تشیخص اینکه چه مدارکی (چه از لحاظ رتبه‌بندی نتایج کاوش و چه از لحاظ درجه ربط به صورت درصد) با نیاز کاربر ربط دارند، مجددا در چرخه‌ای از ابهام قرار دارد که مشابه آن را می‌توان در سنجش ربط در نظام‌های بازیابی اطلاعات مشاهده کرد.

و. استفاده از دانش اکتشافی به‌جای منطق الگوریتمی. در بسیاری از تعاریف ارائه شده از نظام‌های خبره و هوشمند بر این نکته تأکید شده است که آنها از دانش اکتشافی (دانشی که به نظر می‌رسد بر مبنای تجارب عملی، درست عمل می‌کنند) به‌جای منطق الگوریتمی استفاده می‌نمایند. این برنامه‌ها، اعمالی را فراتر از پردازش داده‌های حرفی و رقمی انجام می‌دهند. دانش اکتشافی قواعدی تجربی هستند که اغلب مورد استفاده متخصصان قرار می‌گیرند. این‌گونه قواعد، با قواعد الگوریتمی متفاوتند و مسیرهای کوتاهی را برای یافتن راه حل مسائل مختلف ارائه می‌دهند، و نسبت به قواعد الگوریتمی، به نیرو و زمان کمتری برای پردازش نیاز دارند. قواعد اکتشافی را می‌توان، در شرایطی که قواعد الگوریتمی، ناشناخته یا نامناسب هستند، به کاربرد. نمونه ای فرضی از یک منطق اکتشافی که می‌توان آن را در یک نظام بازیابی اطلاعات مورد استفاده قرار داد، در مثال زیر نشان آمده است:

سند الف درباره پرندگان است

اصطلاح طوطی، در زیر مجموعه اصطلاح کلان پرندگان قرار دارد

بنابر این سند الف درباره طوطی نیز هست

مثال فوق را می‌توان در فرایند بازیابی اطلاعات برای افزایش احتمال دسترسی کاربر به منابع مرتبط دیگر باز نیاز اطلاعاتی او، مورد استفاده قرار داد. به این ترتیب، کاربری که به دنبال اطلاعاتی در مورد "طوطی" است، می‌تواند به مدارک مرتبط کلانتر دیگر که موضوع پرندگان و احتمالا طوطی را نیز در بر دارد، دست یابد.

در اغلب نظام‌های رایانه‌ای غیرخبره، تصمیم‌گیری‌ها بر اساس قواعد ریاضی و الگوریتمی اتخاذ می‌شوند (نظیر برنامه‌های تجزیه و تحلیل آماری و ریاضی). به عبارت دیگر، توانایی استدلال‌گرایی این گونه نظام‌ها تنها در ارتباط با مسئله‌ای از پیش تعریف شده، قابل اجراست. منطق الگوریتمی در نظام بازیابی اطلاعات را می‌توان مشابه تطابق عبارت جست‌جو و نمادهای موجود در یک سند یا تجزیه و تحلیل فراوانی تکرار کلیدواژه‌ها در فیلدهای مختلف دانست که اغلب میزان ربط نیاز بیان شده کاربر با مدارک موجود در یک پایگاه اطلاعاتی بر مبنای آنها سنجیده می‌شود. در نقطه مقابل، منطق اکتشافی قرار است از ظرفیت‌های استدلال‌گرایی مبتنی بر یک پایگاه دانش مدار برای حل مسائلی که قبلا به طور تجربی برای آنها راه حلی به دست آمده استفاده نماید. حال این سؤال مطرح است که الگوی مشابه منطق اکتشافی در چه شرایطی در یک نظام بازیابی اطلاعات قابل اجراست. به تعبیر دیگر، در چه هنگامی می‌توان گامی فراتر از تطابق صرف کلیدواژه‌های جست‌جو با نمادهای گنجانده شده در یک مدرک برداشت (که البته خود این موضوع هیچ‌گاه هدف نهایی حوزه اطلاع‌رسانی نبوده است). شاید بتوان این‌طور استنباط کرد که بازیابی مدارک مرتبط با نیاز اطلاعاتی واقعی کاربران مبتنی بر نیازهای بیان شده چیزی است که تنها از طریق به‌کارگیری منطق اکتشافی در نظام‌های خبره و هوشمند قابل اجر است. همان‌ گونه که گفته شد، منطق اکتشافی چیزی جز قواعدی که به طور تجربی از مهارت‌ها و تجارب کسب شده توسط انسان به‌دست آمده، نیست. بنا براین، حداقل به طور نظری ایجاد پایگاه دانش مدار در یک نظام خبره، تنها با به‌کارگیری دانش تجربی که خود بر مطالعات صورت گرفته درباره کاربران (نظیر رفتار اطلاع‌یابی، تعامل کاربر با واسط جست‌جو، نیاز اطلاعاتی و مانند آن) استوار باشد، دست یافتنی است. از این رو، تا زمانی که نتوان از طریق تحقیقات گوناگون دانش مورد نیاز برای ایجاد چنین محیطی را فراهم ساخت، ایجاد و توسعه یک نظام بازیابی مبتنی بر منطق اکتشافی نیز دور از انتظار خواهد بود.

کاربردهای عینی نظام‌های خبره و هوشمند در بازیابی اطلاعات

لنکستر عقیده دارد که، در طول سال‌های متمادی تحقیقات در حوزه بازیابی اطلاعات توسط عده معدودی از محققان صورت می‌گرفت و تحقیقات آنها آثار بسیار اندکی بر محصولات تجاری داشته است. به طور مثال، محصولات عرضه‌کنندگان خدمات و پایگاههای اطلاعاتی در جهان نظیر دیالوگسال‌ها از رویکردهای منطق بولی در بازیابی اطلاعات برای مقابله عبارات جست‌جو و مدارک در پایگاه‌های خود استفاده می‌کردند. هم اکنون، بسیاری از عرضه کنندگان این محصولات از دستاوردها و نتایج تحقیقات در عرصه بازیابی اطلاعات استفاده نمی‌کنند. سال‌هاست که دریافته‌اند استفاده از منطق بولی برای استفاده کنندگان معمولی مشکلات بسیاری را در فرایند بازیابی اطلاعات به وجود می‌آورد. این در حالی است که درنتایج برخی تحقیقات، استفاده از نظام تطابق عبارت‌های جست‌جو، رتبه بندی نتایج کاوش، وزن دادن به واژگان جست‌جو و مانند آن تأکید شده است (لنکستر و وارنر، 2001، ص 35).

عملکردی که در فرایند بیشتر نظام‌های بازیابی اطلاعات دیده می‌شود، تطابق بخشی از یک متن (اغلب کلمات یا عبارت جست‌جو) با مدارک موجود در یک پایگاه اطلاعاتی است (که خود می‌تواند اطلاعات کتابشناختی، تمام متن یا چندرسانه‌ای را در بر داشته باشند). در طول بیش از چهار دهه گذشته، فنون مختلفی برای بهبود این عملکرد به ظاهر ساده پیشنهاد شده و به‌کار رفته است تا بتوان ابزارهای مؤثرتر و کارآمدتری را برای دسترسی به اطلاعات مرتبط و مورد نیاز استفاده‌کنندگان توسعه داد. نتیجه چنین تحقیقاتی، توسعه نظام‌های بازیابی اطلاعات پیچیده‌ای است که اغلب از تجزیه و تحلیل‌های آماری یا فنون پردازش زبان طبیعی استفاده می‌کنند. اما به هر حال به این‌گونه نظام‌ها نمی‌توان عنوان نظام بازیابی "هوشمند" اطلاق کرد. زیرا همان گونه که اشاره شد در یک نظام خبره و هوشمند مناسب‌تر آن است که به‌جای منطقهای الگوریتمی و ریاضی از منطق‌های سمبولیک و اکتشافی استفاده شود. لنکستر و وارنر عقیده دارند که مطالعات با ارزشی در زمینه نظام‌های بازیابی اطلاعات صورت گرفته است که برخی از آنها منجر به طراحی نظام‌های بازیابی اطلاعات بسیار پیچیده‌ای نیز گردیده است. در بعضی از این مطالعات، به خوبی از شیوه‌های پردازش آماری و نیز زبان طبیعی برای مطابقت دادن عبارت‌های جست‌جو با رکوردهای موجود در پایگاه اطلاعاتی استفاده شده است که نمونه بارز آنها را می‌توان در تحقیقات سالتون و مک گیل (1983)، فریکز و بیزا- یتز (1992)، و کورف‌هیج (1997) مشاهده کرد. با این همه، پردازش‌هایی که در این‌گونه نظام‌ها صورت می‌گیرند، به هیچ وجه هوشمند نیستند. (لنکستر و وارنر، 2001، ص 36).

دانشگاه ماساچوست، با تشکیل مرکزی تحت عنوان بازیابی هوشمند اطلاعات (سیر) به تحقیق و مطالعه در عرصه طراحی نظام‌های بازیابی اطلاعات به صورت هوشمند و خبره پرداخته است. این مرکز در مقالات و کتاب‌های مختلف به عنوان مهم‌ترین مرکز تحقیقاتی در این زمینه مورد اشاره قرار گرفته است. با مراجعه به سایت این مرکز می‌توان اولویت‌های تحقیقاتی زیر را مورد شناسایی قرار دادکه آگاهی از آنها در زمینه بحث حاضر از اهمیت بسزایی برخوردار است (سیر، 2004)‌.

دریافت بازخورد نسبت به چگونگی ربط(Relevance Feedback) : فرایندی که در آن استفاده کننده نهایی اقلام اطلاعاتی مرتبط را در مرحله اول بازیابی اطلاعات مورد شناسایی قرار می‌دهد و سپس نظام خبره به طور خودکار عبارت کاوش جدیدی را مبتنی بر بازخوردهای استفاه کننده، مورد کاوش و بازیابی قرار می‌دهد.

بازیابی اطلاعات چندرسانه‌ای (Multimedia Retrieval): دسترسی به تصاویر، قطعات صوتی ویدئویی در پایگاه‌های اطلاعاتی، بدون در بر داشتن اطلاعات توصیفی نوشتاری درباره آنها.

بازیابی اطلاعات مؤثرتر (More Effective Retrieval) : بهبود جامعیت و مانعیت در بازیابی اطلاعات.

توسعه واژگان جست‌جو (Vocabulary Expansion): توسعه واژگان جست‌جو فراتر از اصطلاحاتی که توسط استفاده کننده نهایی مورد کاوش قرار گرفته است.

بازیابی کارآمد اطلاعات (Efficient Information Retrieval) : توسعه آلگوریتم‌های کاوش به طوری که بتواند به طور همزمان (Real time) و در نظام‌های تعاملی عمل کند.

بازیابی توزیعی (Distributed IR): ارائه فهرست رتبه‌بندی شده از نتایج کاوش مبتنی بر بازیابی اطلاعات از چند پایگاه اطلاعات.(
یکی از نرم افزارهایی که توسط مرکز بازیابی هوشمند اطلاعات طراحی شده و از شیوه‌های مختلفی به منظور بازیابی اطلاعات مرتبط با نیاز اطلاعاتی کاربران استفاده کرده است INQUERY نام دارد. شاید این برنامه را بتوان یکی از مهم‌ترین برنامه‌های توسعه یافته به شمار آورد که از قابلیت‌های نظام‌های هوشمند و خبره به طور عینی و کاربردی در فرایند بازیابی اطلاعات استفاده کرده است. این برنامه مدل‌های زبان طبیعی، منطق بولی، نزدیک‌یابی، بازخوردهای استفاه کننده در خصوص مرتبط بودن یا نا مرتبط بودن اطلاعات بازیابی شده و اصلاح نتایج کاوش را مورد استفاده می‌دهد و رکوردهای بازیابی شده را بر اساس احتمال مرتبط بودن با نیاز اطلاعاتی کاربر رتبه‌بندی می‌کند. این برنامه قادر است به طور خودکار عبارت‌های جست‌جو را بر اساس بازخوردهای کاوشگران، اصطلاح کند تا به این ترتیب بتوان رکوردهای مرتبط دیگر را نیز بازیابی کرد. اسناد طولانی هم بر مبنای محتوای درونی آنها و هم بر اساس مرتبط ترین عبارت بازیابی می‌شوند (این‌کویری، 2004). بررسی ویژگی‌‌ها و قابلیت‌های این برنامه از این لحاظ اهمیت دارد که ظاهرا سعی شده است نتایج بسیاری از تحقیقات نظری این مرکز و سایر تحقیقات در عرصه به‌کارگیری نظام‌های خبره و هوشمند در بازیابی مؤثر و کارآمد اطلاعات، در این نرم افزار به طور کاربردی پیاده سازی شود.
پردازش هوشمند متن

از دهه 1950، استفاده از رایانه برای ذخیره‌سازی متن به صورت الکترونیکی آغاز شد. قابلیت فزاینده ذخیره‌سازی داده‌ها توسط رایانه، باعث شد که در حال حاضر حجم فراوانی از اطلاعات در سراسر جهان در قالب الکترونیکی ذخیره شود. حال این سؤال مطرح است که آیا می‌توان از این حجم وسیع از اطلاعات نوشتاری، که در قالب الکترونیکی ذخیره شده است، برای پاسخگویی به نیازهای اطلاعاتی استفاده کنندگان نهایی بهره جست یا باید پردازش‌هایی بر روی آنها انجام شود. طرح چنین پرسشی سبب شد که یکی از کاربردهای نظام‌های پردازش متن در حوزه کتابداری و اطلاع رسانی جلوه‌گر شود. هدف از طراحی چنین نظام‌هایی فراتر از ارجاع استفاده‌کننده به یک یا چند منبع مستقل است که احتمالا جواب سؤال مورد نظر استفاده‌کنندگان در آنها یافت می‌شود. در واقع، این گونه نظام‌ها قصد دارند تا حد ممکن با پردازش منابع مختلف و یکپارچه کردن بخش‌هایی مرتبط از آنها به نیاز کاربر پاسخی مناسب دهند.

رویکرد‌های جاری در خصوص طراحی نظام‌های پردازش متن را می‌توان به گونه‌ای "هوشمند" تلقی کرد. زیرا رایانه قادر است به تفسیر معانی یک کلمه یا جمله بپردازد و مبتنی بر آن پاسخی مناسب را ارائه دهد. به عبارت دیگر، از طریق تجزیه و تحلیل‌های نحوی می‌توان نقش یک کلمه در جمله (اسم، فعل و مانند آن) و نیز عناصر ساختاری مرتبط با آن را تشخیص داد. در حال حاضر، نظام‌های پردازش هوشمند متن به صورت تجربی یا کاربردی در زمینه‌های زیر مورد توجه قرار گرفته‌اند:

الف. مقوله بندی متن. این شیوه، دلالت بر فرایند طبقه‌بندی اطلاعات نوشتاری در قالب تقسیمات موضوعی از پیش تعریف شده دارد. برای نمونه، نظام CONSTRUE در خبرگزاری رویتر قادر است اخبار و گزارش‌ها را به طور خودکار در قالب 674 تقسیم‌بندی موضوعی، سازماندهی کند (هیز، 1992). طرح در حال اجرای "او سی ال سی" نیز تحت عنوان اسکورپیون در نظر دارد به رده‌بندی خودکار صفحات یا سایت‌های وب با استفاده از طرح رده بندی دهدهی دیویی بپردازد و متن صفحات وب را با رده‌های رده‌بندی دیویی مبتنی بر منطق الگوریتمی تطبیق دهد (تامپسون، شفر، ویزین-گوتز، 1997). چنین طرح‌هایی با هدف طبقه‌بندی هوشمندانه متن و ارائه آن بر اساس نیاز اطلاعاتی کاربران دنبال می‌شوند.

ب. استخراج متن. در این شیوه که گامی فراتر از طبقه‌بندی متن به شمار می‌آید، بخشی (هایی) از یک سند حاوی اطلاعات نوشتاری (به طور مثال، یک پاراگراف) در مورد یک موضوع مشخص مورد شناسایی قرار می‌گیرد و استخراج می‌شود. یکی از کاربردهای عینی این شیوه را می‌توان در مطالعه‌ای در زمینه استخراج اطلاعات کتابشناختی از فهرست مآخذ متن پروانه‌های ثبت اختراعات مشاهده کرد (لاوسون، و دیگران 1996). نظام نمایه‌سازی استنادی خود محور CiteSeer نیز با هدف استخراج اطلاعات استنادی و فهرست مآخذ مقالات در محیط وب و ارائه نوعی پایگاه نمایه استنادی صورت گرفته است. این برنامه، بر اساس قواعد منطق اکتشافی و الگوریتمی، اطلاعات استنادی را از متن مقالات در قالب PDF یا Postscript استخراج و سازماندهی می‌کند.

ج. برقراری پیوند میان متون. در این شیوه، از تجزیه و تحلیل‌های آماری یا نحوی به منظور ایجاد ارتباط مفهومی میان دو بخش از یک متن یا متون مختلف که با یکدیگر مشابهت موضوعی دارند، استفاده می‌شود. از این شیوه می‌توان برای ایجاد پیوندهای فرامتنی به طور خودکار میان اسناد مختلف استفاده کرد. سالتون، باکلی (1992) در مطالعات خود به این موضوع پرداخته‌اند.

د. نظام توسعه متن. این شیوه را می‌توان نمونه توسعه یافته نظام ایجاد پیوند میان متن به شمار آورد. به طوری که از طریق این رویکرد می‌توان ارتباط بخش‌هایی از متن را در متون و اسناد مختلف به صورت ترکیبی نمایش داد. تلاش‌هایی برای ارائه مدلی رایانه‌ای به منظور یکپارچه‌سازی متون مرتبط و هم موضوع از منابع اطلاعاتی نوشتاری مختلف انجام شده است. (چن، 1993).

ه. خلاصه کردن متن. این شیوه مشابه روش‌هایی است که در فرایند چکیده نویسی خودکار به کار می‌رود و هدف از آن انتخاب جملاتی از متن است که بتواند به عنوان خلاصه‌ای گویا و مناسب از محتوای سند، عمل کند. در این شیوه، جملات کلیدی از طریق تجزیه و تحلیل های آماری یا زبانشناختی از متن استخراج می شوند. در حال حاضر، از روش‌های پیشرفته‌تری در خلاصه کردن متن استفاده می‌شود. در شیوه‌های سنتی جملات کلیدی در متن یک سند مورد شناسایی و عینا استخراج می‌شدند. اما هم اینک نظام‌های خودکار خلاصه‌سازی متن قادرند که چند جمله را در هم ادغام کرده و جمله جدیدی را با بار اطلاعاتی مناسبتر بوجود آورند.

و. تولید متن. تولید متن، به برنامه ها و ابزارهایی اطلاق می‌شود که از طریق آن می‌توان به طور خودکار به تولید متون پرداخت. برای مثال، این برنامه‌ها می‌توانند به افراد برای تهیه انواع گزارش‌ها کمک نمایند و قادرند ضمن بررسی املای صحیح کلمات، ساختار نحوی و گرامری جمله را نیز مورد بررسی قرار دهند و در صورت وجود اشتباه نمونه صحیح یک عبارت را پیشنهاد کنند. با این وجود، نمی‌توان به چنین نظام‌هایی لفظ هوشمند اطلاق کرد و آنها اغلب تنها در سطح نظام‌های خبره توسعه یافته‌اند. برنامه واژه پردازXP MS Word در مقیاس کوچکی قادر است برخی از عملکردهای تولید متن را از طریق پیشنهاد املای صحیح کلمات و نیز ساختار گرامری یک جمله یا عبارت به اجرا در آورد.

ز. ترجمه توسط ماشین. یکی از پیشرفته‌ترین کاربردهای نظام‌های پردازش متن که از اوایل دهه 1950 به آن توجه شده، ترجمه توسط ماشین است. با وجود پیشرفت‌های بسیاری که در این حوزه صورت گرفته است، طراحی نوعی نظام ترجمه تمام خودکار که قادر باشد کلیه متون در موضوعات مختلف را بدون نیاز به انسان ترجمه کند، تقریبا نا ممکن است. در حال حاضر، برخی از نظام‌های ترجمه توانسته‌اند با 90 درصد دقت و صحت در امر ترجمه به اجرا درآیند. یکی از قدیمی‌ترین و موفق‌ترین نظام‌های ترجمه متن سیستران نام دارد که نمونه تجاری و ناقص آن بر روی برخی موتورهای کاوش وب نظیر (www.av.com) AltaVista نیز قابل دسترس است و قادر است یک متن (یا صفحات وب) را از انگلیسی به چند زبان دیگر و بالعکس ترجمه کند (سیستران، 2003). طبق بررسی‌های به عمل آمده، هنگامی که متنی حاوی 100 هزار صفحه متن از روسی به انگلیسی توسط این برنامه ترجمه می‌شود، تنها 5 درصد خطا را می‌توان در ترجمه متن اصلی مشاهده کرد که میزان بالایی از دقت در کار ترجمه را نشان می‌دهد (هاچنیز و سومرز، 1992)

6. کاربردهای دیگر در بازیابی اطلاعات

الف. عاملهای هوشمند. عاملهای هوشمند نرم افزارهایی هستند که بدون دخالت انسان قادر به بازیابی داده‌ها به صورت هوشمند از چند منبع یا پایگاه اطلاعاتی هستند. لنکستر و وارنر اصطلاح عامل‌های هوشمند را به عنوان ابزارهایی که قادر به انجام وظایف مختلفی در زمینه بازیابی اطلاعات در اینترنت و دیگر پایگاه‌های اطلاعاتی هستند، تعریف کرده‌اند (لنکستر و وارنر، 2001، ص59). برخی از موتورهای کاوش نیز مدعی‌اند در رتبه‌بندی نتایج کاوش خود از عامل‌های هوشمند استفاده می‌کنند.

ب. واسطهای هوشمند. طراحی واسط‌های هوشمند در نظام اطلاعاتی این امکان را بوجود می‌آورد که به وسیله طیف گسترده‌تری از استفاده کنندگان مورد استفاده قرار گیرد. چنین نظام‌هایی اغلب برای سهولت بازیابی اطلاعات طراحی می‌شوند و قادرند خود را مطابق با مهارت و دانش جست‌جوی استفاده کنندگان تطبیق دهند. به عبارت دیگر، استفاده کنندگان نیاز کمتری به داشتن مهارت و دانش تخصصی در زمینه جست‌جوی پیشرفته و بازیابی اطلاعات مرتبط دارند. امکان برقراری ارتباط با کاربر از طریق واسط جست‌جوی ساده، انعطاف پذیری برای تطبیق با مهارت‌های جست‌جوی اطلاعات کاربران، امکان تغییر واسط جست‌جو بنا بر نیاز کاربران، کمک به کاربر در انتخاب پایگاه اطلاعاتی، و تسهیل فرایند سفارش رکوردهای بازیابی شده از مهم‌ترین ویژگی‌های واسط‌های هوشمند به شمار می‌آیند.

7. نتیجه گیری

اگرچه، تلاش‌های بسیار زیادی در ارتباط با استفاده از کاربردهای نظام‌های خبره و هوش مصنوعی در بازیابی اطلاعات شده است، بررسی بحث‌های مختلف در متون مرتبط نشان می‌دهد که حجم بسیار زیادی از این تحقیقات به مطالعات نظری یا طراحی نظام‌های خبره به صورت تجربی و پیش‌نمون منجر شده است. لنکستر و وارنر، یکی از مهم‌ترین دلایل عدم توسعه نظام‌های خبره و هوش مصنوعی در فعالیت‌های کتابداری و اطلاع‌رسانی را که بازیابی اطلاعات نیز شامل آن می‌شود، پرهزینه بودن طراحی چنین نظام‌هایی و نیز پیچیدگی آنها دانسته‌اند. به نظر آنها تصور اینکه طراحی نرم افزارهای خبره و هوشمند برای انجام برخی فعالیت‌های کتابداری و اطلاع‌رسانی هزینه اندکی در بردارد، بسیاری از مدیران کتابخانه‌‌ها و سایر محققان را گمراه کرده است. برخلاف تصور موجود، برای ایجاد یک پایگاه دانش مرتبط با فعالیت‌های کتابداری و اطلاع‌رسانی باید هزینه و زمان نسبتا زیادی را صرف کرد. به علاوه، روزآمد سازی مستمر این‌گونه نظام‌ها خود بسیار هزینه بر هستند. این دو محقق در کتاب خود بر این نکته تأکید دارند که نظام‌های خبره و هوشمندی که تاکنون در زمینه فعالیت‌های کتابداری توسعه یافته‌اند، در مقایسه با نظام‌های توسعه یافته در سایر حوزه ها "اسباب بازیی" بیش نیستند. به عبارت دیگر، برای طراحی نظام‌های خبره و هوشمند در فعالیت‌های کتابداری باید هزینه و زمان زیادی را صرف کرد و این امکان یا در بسیاری از طرح‌های تحقیقاتی مهیا نبوده است و یا اینکه پس از شروع با مشکلاتی روبه‌ رو شده است (لنکستر و وارنر، 2001، ص107).

نکته بسیار مهم دیگری که چه بسا کاربرد نظام‌های خبره و هوشمند را در بازیابی اطلاعات تحت تأثیر قرار داده است، مربوط به ماهیت این‌گونه نظام‌ها است. تشخیص ربط خود مسئله‌ای است که هنوز بحث‌ها و نقطه نظرات مختلفی درباره آن حتی در نظام‌های سنتی وجود دارد. این موضوع مورد قبول همگان است که کلیه تحقیقات انجام شده و در دست انجام در زمینه طراحی و توسعه نظام‌های بازیابی اطلاعات، با هدف تسهیل و بهبود فرایند دسترسی به مدارک مرتبط منطبق با نیاز اطلاعاتی کاربر است. حتی اگر یک نظام هوشمند یا خبره در بهترین شرایط خود بتواند مدارک مرتبط را بنابر منطق‌های الگوریتمی و اکتشافی یا ترکیبی از هر دوی آنها بازیابی کند، این لزوما به معنای آن نخواهد بود که با نیاز اطلاعاتی کاربر منطبق است. ذهن‌گرایانه بودن مفهوم ربط و نیاز اطلاعاتی باعث شده است که با وجود تحقیقات گسترده در این زمینه هنوز مشکل رفع نیازهای واقعی کاربران به عنوان یکی از مسائل مهم حوزه کتابداری و اطلاع‌رسانی باقی مانده باشد. طرح چنین مسائلی می‌تواند نقش نظام‌های خبره و هوشمند را به عنوان واسطی کارآمد میان نیاز اطلاعاتی کاربر و مدارک مرتبط در یک پایگاه اطلاعاتی با ابهام‌هایی روبه‌رو سازد و بر نقش آنها به عنوان " ابزاری کمکی" برای بازیابی اطلاعات تأکید بیشتری نماید. شاید کاربران و نیازهای اطلاعاتی واقعی آنها تنها عنصر کلیدی در طراحی نظام‌های بازیابی خبره و هوشمند به شمار آیند که باید درباره جنبه‌های مختلف آن مطالعات بیشتری صورت گیرد. شاید به همین دلیل است که "دریافت بازخورد نسبت به چگونگی ربط"، متمرکز شده است.

مآخذ

1. نشاط، نرگس (1382). "هرمنوتیک و بازیابی اطلاعات". اطلاع شناسی، سال اول، شماره 2، زمستان، ص. 33-46.

2. Cawsey, A. (1998). The Essence of Artificial Intelligence.- London: Prentice Hall.

3. Chen, Z. (1993). “Let Documents Talk to Each Other: A Computer Model for Connection of Short Documents. Journal of Documentation, 49, 44-54.

4. CIIR (Center for Intelligent Information Retrieval). (2004). [online]. Availabile at: http://ciir.cs.umass.edu/ (8 Jan. 2004)

5. Fenly, C. (1992). “Technical Services Processes as Models for Assessing Expert System Suitability and Benefits”. In: Artificial Intelligence and Expert Systems: Will they Change the Library?; ed by F.W. Lancaster and L.C. Smith, pp. 50-66. Urbana-Champaign: University of Illinois, Graduate School of Library and Information Science.

6. Ford, N (1991). Expert Sysrtems and Artificial Intelligence: an Information Manager’s Guide. – London: Library Association Publishing.

7. Frakes, W. B. and Baeza-Yates, R (1992). Information retrieval: data structures & algorithms. Englewood Cliffs, NJ, Prentice Hall.

8. Hayes, P.J. (1992). “Intelligent High-Volume Text Processing Using Shallow, Domain-Specific Techniques”. In: Text-Based Intelligent Systems, ed. By P. S. Jacobs, pp. 227-241. Hillsdale, NJ: Lawrence Erlbaum.

9. Hutchins, W. J. and Somers, H. L. (1992). An Introduction to Machine Translation. New York: Academic Press.

10. INQUERY Search Software (2004). [Online]. Availabile at: http://ciir.cs.umass.edu/inquerypage.html (9 Jan. 2004)

11. Korfhage, R. R. (1997). “Information Storage and Retrieval”. New York :Wiley.

12. Lancaster, F.W. and Warner, A. (2001). Intelligent Technologies in Library and Information Service Application. New Jersey: Information Today.

13. Lawson, M. et al. (1996). “Automatic Extraction of Citation from the Text of English-Language Patents- An Example of Template Mining”. Journal of Information Science, 22, 423-436.

14. Pollit, A.S. (1993). MenUSE for Medicine: End User Browsing and Searching of the MEDLINE Database Using the MeSH Thesaurus. RIAO 88: User Oriented Content-Based Text and Image Handing, Vol. 1, Cambridge, MA, 547-573.

15. Pros, N. O. (2000). “Information Retrieval, Experienmental models and Statistical Analysis”. Journal of Documentation, 56(1), 55-70.

16. Salton G. and Buckely, C. (1992). “Automatic Text Structuring Experiments”. In: Text-Based Intelligent Systems, ed. By P. S. Jacobs, PP. 199-210. Hillsdale, NJ: Lawrence Erlbaum.

17. Salton, G. and McGill, M. J. (1983). The Introduction to Modern Information Retrieval. New York: McGraw-Hill.

18. Spangler, W.E. and May, J.H. (2000). “Expert and Knowledge-Based Systems”. Encyclopedia of Library and Information Science. Edited by Allen Kent, Vol. 67.

19. Systran. http://www.systransoft.com. [online]. 8 Sep. 2003.

20. Thompson, R.; Shafer, K. and Vizine-Goetz, D. (2003). "Evaluating Dewey Concepts as a Knowledge Base for Automatic Subject Assignment”. [online]. Available: http://orc.rsch.oclc.org:6109/eval_dc.html. [13 Sep. 2003].


5 دسته‌بندی نشده  هوشمند هوش نظیر نظری میان موضوعی منطق ممکن مقالات مطرح مصنوعی مرتبط مدارک مثال متون مبتنی کنندگان کلیدواژه کتابداری کاوش کاربران کاربر قادر شیوه زیادی رسانی خودکار خبره چنین جست ترین تحقیقات پردازش پایگاه بازیابی الگوریتمی اکتشافی اطلاعاتی اطلاع quot information
قیمت: 100 تومان

برای پیدا کردن مطالب مشابه در این سایت ، از قسمت جستجو استفاده کنید 

کلمه کلیدی را وارد کنید :

مطالب مرتبط

5

30 (2393)

HYPERLINK “http://vahidsaeedi.blogfa.com/post-3.aspx” رفتارشناسی حیوانات اهلی مقدمه: در طول چندین هزار سال انسان شکارچی و مصرف کننده گوشت می‌باشد. انسان Homoerectus در 400 هزار سال قبل شکار و استفاده از آتش را برای پختن گوشت آغاز ادامه مطلب…

5

30 (2354)

7) بحث با توجه به مصرف رو به رشد فراورده های پروتئینی دریائی در جهان و سمیت بالقوه فلزات سنگین در این ماده مصرفی، بررسی این عوامل به عنوان یک شاخص بهداشتی در دستور کار ادامه مطلب…

5

30 (2252)

کارآفرینی کارخانه ماکارونی مقدمه ماکارونی در حال حاضر به عنوان عنصری پر اهمیت در تامین غذای روزانه مردم دنیا از جایگاه ویژه ای برخوردار است . با توجه به این مهم گروهی از پیشگامان آرد ادامه مطلب…

background