منتديات اليسير للمكتبات وتقنية المعلومات » منتديات اليسير العامة » منتدى تقنية المعلومات » مشاكل تقنيات البحث في قواعد البيانات

منتدى تقنية المعلومات هذا المنتدى مخصص للموضوعات الخاصة بتقنية المعلومات التي تتعلق بالمكتبات ومراكز مصادر المعلومات ومراكز مصادر التعلم.

إضافة رد
أدوات الموضوع تقييم الموضوع انواع عرض الموضوع
 
قديم Nov-14-2006, 11:12 AM   المشاركة1
المعلومات

محمد حسن غنيم
مكتبي فعّال

محمد حسن غنيم غير متواجد حالياً
البيانات
 
العضوية: 14959
تاريخ التسجيل: Dec 2005
الدولة: الإمارات
المشاركات: 120
بمعدل : 0.02 يومياً


قلم مشاكل تقنيات البحث في قواعد البيانات

مشاكل تقنيات البحث في قواعد البيانات

إن مفتاح النجاح في الحصول على نتائج بحث جيدة، تكمن في نوعية الاستفسارات، أو الأسئلة، أو العبارات أو الكلمات المفتاحية التي نقوم بإدخالها في محركات البحث. لكن المشكلة الأساسية هنا تكمن في أن الغالبية العظمى من المستخدمين لا يقومون عادة بإدخال الاستفسارات أو الكلمات المفتاحية الصحيحة، والتي تؤدي إلى الحصول على النتائج المطلوبة، وسنستعرض فيما يلي المشاكل الشائعة في عالم البحث عن المعلومات، والطرق التي يحاول بها الباحثون معالجة هذه المشكلات.

عدم طرح الأسئلة الصحيحة
من الحقائق الغريبة التي يؤكدها خبراء المعلومات هي أن المستخدمين نادرا ما يقومون بطرح الأسئلة التي تعبر عما يريدونه فعلا. والسبب الرئيس في ذلك هو الافتقار إلى الفهم الصحيح للموضوع قيد البحث، وبالتالي عدم استخدام الكلمات المفتاحية الصحيحة، والتي تؤدي إلى تكوين استعلامات وأسئلة صحيحة. فالمشكلة الأساسية هنا إذا، هي مساعدة المستخدمين على طرح الأسئلة وتكوين الاستعلامات الصحيحة. ومن مظاهر هذه المشكلة أيضا هي صغر حجم الاستعلامات التي يكونها المستخدم عادة للاستفسار عن موضوع معين. فإذا كان مستخدم ما يريد معلومات عن "السفر" مثلا، فإنه يبدأ بإدخال كلمة عامة في محرك البحث، ومن ثم، واعتمادا على النتائج التي يحصل عليها، يقوم بتضييق نطاق بحثه إلى أن يصل إلى ما يريده. والسبب في أن العديد من مستخدمي إنترنت يستعملون هذا الأسلوب يكمن في أنهم لا يعرفون حقا الحجم المهول للمعلومات الموجودة في قواعد البيانات الخاصة بمحركات البحث، والتي تفوق عادة ما يمكن لأي إنسان التعامل معه.

الموازنة بين الكم والنوع
عند التعامل مع تقنيات البحث فلا بد من الموازنة بين الكم والنوع، أو ما يدعوه الخبراء بالدقة والقدرة على الاسترجاع. وهي علاقة عكسية تماما، فكلما تم تضييق نطاق البحث سعيا عن نتائج أكثر دقة، كلما قل مقدار البيانات الذي يمكن استرجاعه. ولذلك فإن هناك حاجة لوجود محركات بحث تقدم دقة عالية دون التضحية بمقدار النتائج "الدقيقة" التي نسترجعها.

غموض الكلمات
معظم الكلمات تحمل أكثر من معنى، ومعظم محركات البحث المستخدمة اليوم تقوم بمطابقة الكلمات وليس معانيها، ولذلك فإن نتائج عمليات البحث التي نحصل عليها، تحتوي غالبا على الكلمات المفتاحية الصحيحة، ولكنها ذات المعنى الخاطئ. فإذا جربت مثلا أن تبحث عن معنى كلمة "جافا" مثلا، وهي إحدى لغات البرمجة الشائعة الاستخدام، فإنك ستحصل الكثير من النتائج المتعلقة بالجفاف، أو باسم جزيرة إندونيسية تحمل الاسم نفسه، إضافة إلى معلومات عن لغة البرمجة.

الأسماء وأنواعها
وماذا عن البحث في الأسماء، أي البحث عن معلومات عن الأشخاص والأماكن، وما إلى ذلك. خصوصا وأن الكتاب يغيرون عادة الطريقة التي يقومون بها بكتابة الأسماء. وإذا ما تحدثنا مثلا عن أسماء الشركات، فإنها تتغير باستمرار نتيجة عملية الاندماج والضم، مما يجعل عملية البحث صعبة. وقد يقول البعض أنه يمكن التغلب على هذه المشكلة نوعا ما باستخدام برمجيات الفهرسة، ولكن المشكلة هي أن المعلومات في عالمنا تتغير باستمرار مما يجعل الفهرسة اليدوية صعبة. وماذا عن الفهرسة الآلية؟ الإجابة هي أنه لا توجد بعد التقنية التي يمكنها القيام بذلك بدقة، بحيث يمكن التمييز مثلا بين مقال كامل عن شخص معين، ومقال آخر يذكر اسم الشخص بشكل عابر.
المعالجة الطبيعية للغة
يجمع العاملون في مجال محركات البحث بأن الحل لكافة هذه المشاكل يكمن في تصميم محركات البحث، وبرمجيات البحث عموما، بحيث تستفيد من برمجيات المعالجة الطبيعية للغة Natural Language Processingعموما، والمعالجة الطبيعية للمعنى Natural Meaning Processing، والاستفادة من قواعد اللغة. النقطة الأساسية هنا هي أن اللغة عموما مبنية على أساس قواعد ذات أساس شبيه بالمعادلات الرياضية، كما أن عبارات اللغة وكلماتها تكون مبنية حسب هيكلية معينة, فلكل جملة مبتدأ وخبر، أو فعل وفاعل ومفعول به، كما أن الكلمات تأتي عادة من جذور وأصول. وهذه الهيكلية المبنية ضمن اللغة تتناسب وطبيعة عمل برمجيات الحاسوب، والتي تحتاج إلى هيكلية معينة تنفذ على أساسها عملياتها. أما المعالجة الطبيعية للمعنى فهي أكثر صعوبة، فكلمة مثل "راحة" يمكن لها أن تعني عدة أشياء، كالارتياح بعد التعب، أو الراحة الأبدية والتي تعني الموت، أو راحة اليد. ولهذا فإن برمجيات البحث يجب أن تتمكن من فهم الكلمة ضمن سياق النص، ودور الكلمة في هذا السياق. ولكن حتى هذا الأسلوب لا يفلح دوما في فهم المعنى. جرب أن تقرأ ديوانا شعريا جيدا، وستجد أن هنالك الكثير من الكلمات الصعبة، والتي قد يحاول البعض فهمها من السياق، ولكننا عندما نعجز عن ذلك فإننا نتجه إلى القاموس. وهذا أسلوب يمكن لبرمجيات الكمبيوتر اتباعه، أي الاعتماد على قاموس أو فهرس بالكلمات والعبارات الشائعة الاستخدام، والبحث في السياق. وفيما يلي بعض مفاهيم البحث التي تعتمد على المعالجة الطبيعية للغة؛

دراسة الجُمل
تتميز الجُمل بأنها ذات هيكلية محددة وواضحة، مما يساعد في فهم المعنى بشكل سريع. ومن خلال تحديد نوع الجملة، يمكن لبرمجيات البحث أن تقوم بعملها بشكل أكثر دقة. ولعمل ذلك فإن هذه البرمجيات يجب أن تعتمد على كميات كبيرة من المصادر والمراجع اللغوية، كالمكانز، والتي تحتوي على عبارات وجمل ذات علاقات محددة مسبقا. وباستخدام هذه المكانز يمكن لبرمجيات البحث أن تفهم بشكل أفضل طبيعة العلاقة بين الكلمات المختلفة ومواقعها الصحيحة ضمن الجمل. ورغم الفائدة العظيمة للمكانز، فإن مدى فعاليتها يعتمد على تحديثها باستمرار، وإلا فإنها تفقد فاعليتها تدريجيا. وباستخدام المكانز، وتصريف الجمل وإعرابها يمكن الحصول على نظم بحث قوية يمكنها فهم عبارات البحث ومعاني الكلمات ضمن السياق بشكل أفضل.

إزالة الالتباس: اختيار المعنى الصحيح
أوضحنا في النقطة أعلاه كيف يمكن للمكانز ونظم تصريف وإعراب الجمل أن تسهم بشكل أفضل في فهم المعنى من خلال السياق. وهذه التقنية مفيدة إذا كنا نبحث ضمن نص معين، ولكنها ليست مفيدة عند إدخال الاستفسارات والاستعلامات ضمن محركات البحث، حيث تتكون هذه عادة من عدد محدود من الكلمات، وبالتالي فإن حجم النص غير كاف لتحليل معنى الكلمات. والحل لهذه المشكلة واضح إلى درجة الإحراج ويتمثل في سؤال المستخدم عن المعنى الذي يقصده؛ فعندما يُدخل المستخدم كلمة "راحة" مثلا ضمن مربع الاستعلام، فإن محرك البحث يسأله عن المعنى المقصود، أو المعنى المراد البحث عنه، قبل الشروع بعملية البحث. وتوجد اليوم العديد من محركات البحث التي تستخدم قواميس مضمنة تقوم بتقديم قوائم بالمعاني المختلفة التي تمثلها الكلمة الواحدة قبل الشروع في عملية البحث. ومن هذه المحركات هناك LexiGuide من شركة LexiQuest، و Oingo، و Simplifind على موقع Simpli.com.
التصنيف التلقائي
هذا الأسلوب هو الأقدم، حيث يتم تصنيف الوثائق حسب تصنيفات وفروع معينة، ومن ثم البحث بشكل منفصل ضمن كل تصنيف عن المعلومات المطلوبة. فمثلا، عند البحث عن كلمة "نواة" فإن بحثك قد يقودك إلى تصنيف يتعلق بعلوم الزراعة، وأنواع الحبوب، وما إلى ذلك، ولكنه في الوقت نفسه قد يقودك إلى تصنيف يقع ضمن علوم الفيزياء النووية. والحل هنا يكمن في تصنيف الوثائق المتعلقة بأنوية الحبوب والمزروعات في قسم الزراعة مثلا، والوثائق المتعلقة بأنوية الذرات في قسم الفيزياء الذرية. ولكن ماذا لو كانت لدينا وثيقة تتعلق بتأثير التجارب النووية على أنوية الحبوب والمزروعات؟ هل يجب عندها وضع الوثيقة في القسمين، أم ما هو الحل؟ وهنا تنشأ لدينا مشكلة المعنى المزدوج. ومن هنا تأتي أهمية التصنيف التلقائي، حيث يتم استخدام علوم النحو من تصريف وإعراب، واستخدام المكانز والقواميس، بحيث يتمكن النظام من "فهم" المواضيع الرئيسة في وثيقة ما. ويتم ذلك باستخدام أساليب إحصائية تقوم بدراسة تكرار الكلمات ضمن وثيقة ما، ومن ثم تحديد السياق، والذي يساعد في عملية البحث. وكمثال على ذلك لنأخذ كلمة، أو اسم مثل "فهد" أو "ليث" وهي أسماء عربية دارجة. ولنفترض أننا كتبنا موضوعا في مجلتنا عن شخص اسمه "فهد"، ولنفترض أن محرك بحث أراد تصنيف مقالنا هذا. في هذه الحال، وإذا كان محرك البحث يستخدم أسلوب التصنيف التلقائي، فإنه سيقوم من خلال دراسة النص ونوعية الكلمات الموجودة فيه وعلاقاتها وتكرارها، بتحديد أن المقال ينتمي إلى تصنيف علوم الكومبيوتر وإنترنت وليس الحيوانات والوحوش البرية. وتتبع برمجيات التصنيف التلقائي قواعد معينة يحددها المبرمجون، أو يمكن للآلة نفسها أن تتعلم ذاتيا كيف تقوم بتصنيف الكلمات. أو يمكن استخدام الأسلوبين، بحيث يتم تصنيف الوثائق التي تتبع نمطا معينا بشكل تلقائي، في حين يتم تحويل تلك التي يستحيل تصنيفها إلى عامل بشري كي يقوم بذلك.

زيادة دقة الاستعلامات
من يستعمل محركات البحث باستمرار يعلم أنه من المحتوم الحصول على مئات الألوف من النتائج على الأقل عند البحث عن موضوع معين بشكل عام. أما عند تضييق نطاق البحث، فإننا نحصل على مقدار أقل من النتائج الأكثر دقة. ولزيادة دقة الاستعلامات، فإن بعض محركات البحث يقوم بتعديل الاستعلام، وذلك بتقديم معان مرادفة لكلمات البحث إلى المستخدم، لمساعدته على تحديد موضوع بحثه بدقة أكبر. ففي مثل هذه النظم، وإذا كان موضوع استعلامك هو "الرياضة" مثلا، فإن النظام يقدم لك عددا من البدائل التي تساعد في تحديد موضوع البحث مثل "التربية البدنية"، "اللياقة البدنية" أو "اللياقة" وغير ذلك من المرادفات التي تساعد على توجيه العملية بحيث يحصل المستخدم على أكبر كم من النتائج الدقيقة التي تعبّر عن موضوع البحث.

ربط المفاهيم
إذا جربت اليوم أن تبحث عن العبارة "اسطوانات الليزر" (وهي العبارة العامية والقديمة للأقراص المدمجة) فإنك لن تحصل على الكثير من النتائج المفيدة من محركات البحث، حيث أن عبارة "الأقراص المدمجة" هي الكلمة الشائعة والمستخدمة في الغالبية العظمى من المطبوعات. ولهذا فإن العديد من محركات البحث هذه الأيام تستخدم أسلوب الربط بين المفاهيم، بحيث أنك إذا قمت بكتابة العبارة "أقراص الليزر" فإنك ستحصل على معلومات عن "الأقراص المدمجة". ويعتمد هذا الأسلوب على تحديد العلاقة بين الكلمات والعبارات في قاعدة البيانات بشكل مسبق، كما أنه مفيد عند البحث في وثائق متعددة اللغات، فالبحث عن كلمة "أقراص الليزر" يمكن أن يعطي نتائج لوثائق باللغة الإنجليزية عن Compact Disks أو CDs وما إلى ذلك، وهذا أسلوب مفيد جدا في عالم إنترنتي لم تعد فيه اللغة الإنجليزية هي السائدة.
الصورة الحالية
انظر إلى أي موقع للتجارة الإلكترونية، وستجد أنه غير ذا فائدة تُذكر إذا لم يكن محرك البحث المستخدم به قادرا على نقلك إلى صفحة المنتج، أو المنتجات، التي تريدها خلال أسرع وقت ممكن. ولذلك نجد أن بوابات التجارة والأعمال الإلكترونية العالمية مثل Ebay وأمازون تعتبر برمجيات البحث أحد أهم موجوداتها وتسعى باستمرار إلى تحديثها. وقد قامت شركة Ebay قبل سنوات بشراء نظام بحث متقدم من شركة Fast Search & Transfer النرويجية، والتي كانت تنتج تقنية بحث جديدة تقوم بتقديم أحدث المعلومات للباحثين عن نتائج المزادات والأسعار المتداولة. كما أن أمازون ومواقع مثل Marthastewar.com تقوم بالتعامل مع شركة Google و AskJeeves بحيث يتم ربط المستخدمين بالبضائع التي يريدون شرائها من خلال كتابة سؤال اعتيادي ضمن مربع الاستعلام. وتقول الخبيرة مارثا فراي، وهي باحثة في شؤون التجارة الإلكترونية في مجموعة باتريشيا سيبولد، "يمكن القول بأن السبب الرئيس في فشل معظم مواقع التجارة الإلكترونية، يعود إلى اعتمادها لتقنيات بحث ضعيفة." كما اكتشفت مؤسسة ميديا ميتريكس للأبحاث بأن 80% من مستخدمي إنترنت، يتوقفون عن استخدام موقع ما إذا لم تعمل وظيفة البحث المضمنة فيه بالشكل الصحيح. ومن هنا كان السباق بين عدد من الشركات لتطوير تقنيات بحث متقدمة، يمكن للبشر الاعتياديين التعامل معها، والحصول على النتائج التي يريدونها تماما. وسنستعرض فيما يلي عددا من الشركات العالمية التي ابتكرت تقنيات يمكن لها أن تغير وجه إنترنت إلى الأبد.

إنفراسيرتش Infrasearch
تجمع هذه الشركة ما بين تقنيات البحث المتقدمة التي تحدثنا عنها في الصفحات السابقة، وبين تقنيات برمجيات مشاركة الملفات، وهي ما يطلق عليه البعض برمجيات الند إلى الند، أو ما يُعرف بالإنجليزية باسم P2P، (انظر مقالنا في هذا العدد والمتعلق بهذا الموضوع). وقد قامت شركة صن مايكروسيستمز العملاقة مؤخرا بشراء هذه الشركة الشابة بمؤسسيها (المراهقين الثلاث) وطاقم عملها الذي يتكون من 15 مبرمجا. وتعد هذه التقنية، إذا ما كُتب لها النجاح في مختبرات صن فإن تقنية إنفراسيرتش تعد بالسيطرة على عالم البحث عبر إنترنت. وتعمل تقنية إنفراسيرتش بالشكل التالي؛ يقوم المستخدم بتنزيل برنامج صغير الحجم على جهازه، ومشاركة دليل معين، أو عدة أدلة على جهازه، يريد أن يمكّن المستخدمين الآخرين من البحث فيها. وهذا البرنامج شبيه ببرنامج نابستر، ولكن قدراته لا تقتصر على ملفات MP3 فقط، بل تتعداها لتشمل جميع أنواع الملفات، فإذا كنت تبحث عن الحل لمسألة رياضية معينة مثلا، وكان أحد الطلبة قد قام بحل هذه المسألة أو المعادلة، ووضع الحل ضمن ملف على جهازه، فإنه يمكنك عند البحث باستخدام إنفراسيرتش أن تعثر على هذا الملف وحل المعادلة، إذا كان هذا المستخدم قد اختار مشاركته مع الغير عبر الشبكة. ولا تتوقف قدرات إنفراسيرتش هنا، فإذا كنت تريد شراء سيارة معينة، فإن برنامج إنفراسيرتش يأخذك إلى دليل على موقع الشركة، ومن ثم توجيهك إلى القسم الخاص بالسيارة التي تريدها، والحصول على آخر المعلومات عن هذه السيارة، بما في ذلك صورة لأحدث موديل لها قام أحد المستخدمين بالتقاطها ووضعها على جهازه ليشاركها مع الغير. كما يمكن للوكيل مثلا أن يشارك ملفا على جهازه يحتوي على عقد البيع وإجراءات التسجيل وما إلى ذلك. وبما أن برنامج إنفراسيرتش مجاني، فقد كان المخطط الأصلي للشركة هو جعل المؤسسات التجارية، التي تختار استخدام البرنامج في عملياتها، تقوم بدفع مقابل مادي بسيط جدا مقابل كل عملية بحث تقوم أجهزة إنفراسيرتش المزودة بتوجيهها إلى المؤسسة التجارية. وهذا يعني أن عوائد الشركة تعتمد على عدد الأشخاص الذين يقومون بالبحث في شبكتها. وإضافة إلى ذلك، فإن إنفراسيرتش كانت تخطط للتعاون مع محركات البحث الشائعة الاستخدام، وذلك لجعل نتائج بحثها "طازجة" وحديثة بأكبر قدر ممكن، حيث أن نتائج البحث التي نحصل عليها عادة من هذه المحركات تعتمد على مدى نشاط الروبوتات التي تقوم بفهرسة مواقع إنترنت، وهي عادة متأخرة حوالي 24 ساعة عما نُشر على الشبكة. أما باستخدام تقنية إنفراسيرتش فإن النتائج تكون طازجة بالدقيقة والثانية. وكما قلنا أعلاه، فإن إنفراسيرتش الآن ملك لصن مايكروسيتمز، ونرجو أن نرى منتجها عما قريب على إنترنت.
غوغل
بدأ محرك البحث هذا Google.com كمشروع لرسالة دكتوراة حول تقنيات الذكاء الاصطناعي والمعالجة الطبيعية للغة في جامعة ستانفورد في الولايات المتحدة، وتحول اليوم إلى بوابة إنترنت عالمية كبرى تخدم البحث بـ 66 لغة (منها العربية)، تقوم بمعالجة 120 مليون طلب بحث يوميا (حسب إحصائيات مؤسسة ميديا ميتركس للأبحاث)، كما أن الموقع أصبح مؤخرا ضمن أكبر 15 موقعا في الولايات المتحدة. ولا يتوقف الأمر هنا، حيث أن عوائده تصل إلى 50 مليون دولار سنويا، ويتوقع البعض أن يصل حجم هذه العوائد في المستقبل القريب إلى مليار دولار أمريكي حسب مجلة بيزنس ويك الأمريكية . والمستخدم لهذا الموقع يعرف تمام المعرفة مدى دقته في تقديم النتائج المطلوبة، ومن المرة الأولى، كما أنه لا يتطلب خبرة كبرى من المستخدم في صياغة الأسئلة والاستعلامات. ويعتمد هذا الموقع تقنيات إحصائية ورياضية متقدمة تقوم بدراسة الوثائق المفهرسة، وتكرار الكلمات ضمن كل وثيقة، وبالتالي الحكم على موضوعها وعلاقتها بعبارة البحث التي يقوم المستخدم باستعمالها. ومهما كانت الوصفة السحرية التي يستخدمها موقع غوغل فإنه يعتبر الأفضل بين كافة مواقع البحث المستخدمة اليوم.
آسك جيفز AskJeeves
جميعنا استخدمنا بين الفينة والأخرى موقع AskJeeves.com والذي يعتمد قاعدة بينات وتقنيات تمكّن المستخدم من توجيه سؤال البحث "باللغة الإنجليزية" بلغة سهلة، وعامية حتى، لتقوم قاعدة البيانات بالمطابقة بين الكلمات المفتاحية في السؤال، وبين ما هو موجود في قاعدة بياناتها. ورغم ذلك فإن جيفز يعتمد جزئيا على التدخل البشري لتصنيف المعلومات وفهرستها إذا لم تكن موجودة في قاعدة البيانات. فعند حصول حدث إخباري ما مثلا، فإن جيفز لن يتمكن من التعامل مع أي سؤال يتعلق بهذا الحدث إلا إذا قام مدراء قواعد البيانات بتحديث النظام. وقد قامت الشركة المسئولة عن الموقع بطرح نظام مستقل، يمكن للمؤسسات العاملة في مجالات التجارة والأعمال الإلكترونية تضمينه في مواقعها بحيث يمكن لعملائها توجيه أسئلة واستفسارات باللغة الطبيعية، والحصول على أجوبة لها دون أي تدخل بشري.

أوبن كولا OpenCola
نعود هنا إلى شركة أخرى تستخدم تقنيات مشاركة الملفات، والمعالجة الطبيعية للغة، إضافة إلى أسلوب المجتمعات الخبيرة Expert Communities، لخدمة عملية البحث. وتنتج هذه الشركة برنامجا صغيرا مجانيا يقوم المستخدم بتنزيله وتثبيته على جهازه، ومن ثم يمكن له سحب وإسقاط ملف ما (سواء نص، أو موسيقى، أو صورة، أو أي نسق كان) ضمن هذا البرنامج، والذي يقوم بالبحث ضمن أجهزة كمبيوتر أخرى مشاركة في الشبكة، عن ملفات مشابهة. فإذا كنتم مثلي، من هواة جمع اللوحات الإلكترونية للمدرسة الانطباعية أو التكعيبية، وكانت لديكم صورة تمثل إحدى هذه المدارس الفنية، فيمكن وضع هذه الصورة ضمن البرنامج، والذي يبحث بعدها في أجهزة الكومبيوتر المشاركة ضمن الشبكة ليحصل على ملفات مماثلة. وماذا عن فكرة المجتمعات الخبيرة؟ تهدف أوبن كولا إلى تشجيع المشاركين في شبكتها على مشاركة أجهزتهم مع أشخاص يشابهونهم في الاهتمامات، فإذا كان لدي مجلد على جهازي يحتوي على لوحات إلكترونية للمدرسة التكعيبية مثلا، فإنني أقوم بمشاركتها ضمن موقع أوبن كولا وضمن تصنيف خاص بهذه النوعية من اللوحات. كما أن أوبن كولا تستخدم روبوتات موزعة، أو عناصر آلية، تعتمد أسلوب البحث في العناصر البرمجية. ويمكن للمستخدمين تحسين دقة النتائج التي يحصلون عليها بتدريب هذه الروبوتات الباحثة، والتي تتعلم من خلال التجربة.
أوتونومي Autonomy
تعتمد البرمجيات التي تستخدمها هذه الشركة Autonomy.com على تقنية المطابقة ما بين أنساق النص وتكرار العبارات والكلمات، وذلك لتحديد المفاهيم الرئيسية المميِّزة لوثيقة ما، وتشفيرها ضمن هذه الوثيقة، ومن ثم البحث عن وثائق تحتوي على مفاهيم مشابهة في نصوص أخرى. وباستخدام هذا الأسلوب يمكن للباحث أن يقوم بكتابة جمل تصف ما يبحث عنه بلغة سهلة، والبحث على هذا الأساس. كما أن محرك بحث أوتونومي يمكنه أن يتعلّم ما يريده المستخدم، بناء على نوعية المواد التي يقرأها أو يستعرضها هذا المستخدم.

بريموس Primus
تركز برمجيات البحث الخاصة بهذه الشركة على المواد التي تتعامل مع خدمة الزبائن، أو المواد الموجودة ضمن نماذج إلكترونية، وهي على هذا الأساس مكملة لما تقوم به شركة أوتونومي. وتسمح هذه البرمجيات للمستخدمين بأن يقوموا بتوجيه أسئلة إلى قاعدة البيانات باستخدام اللغة الطبيعية. ويقوم النظام بجمع نتائج البحث، وتقديمها للمستخدمين الذين يقومون بطرح أسئلة مشابهة.

المستقبل
يوجد على إنترنت اليوم بلايين الصفحات، وحسب المصادر المتوفرة فإنه قد تم حتى اليوم فهرسة ما يزيد قليلا على البليون صفحة. وتتسابق الشركات التي تقوم بفهرسة هذه الصفحات في إتاحتها لمستخدمي إنترنت، والحفاظ على سرعة الاستجابة التي يحصل عليها المستخدم. وإضافة إلى السرعة فإن على قواعد البيانات هذه أن تثبت وجودها بتقديم أجوبة "طازجة"، ومتناسقة، وذات علاقة بما يبحث عنه المستخدم. كما أن عجلة الابتكار لا تتوقف في مجال البحث، فموقع www.hotlinks.com يتيح للمستخدمين إمكانية حفظ مفضلاتهم Favorites ضمن دليل على إنترنت، وذلك كي تكون هذه المفضلات متاحة للمستخدم أينما كان، ويمكن للمستخدمين أن يختاروا مشاركة مفضلاتهم مع مستخدمي إنترنت الآخرين، وتمكين زوار الموقع من البحث على إنترنت من خلال البحث في مفضلات الآخرين، وبالتالي الحصول على معلومات رأى مستخدمون آخرون أنها مفيدة لدرجة وضع المواقع التي تحتويها ضمن مفضلاتهم. كما أن هناك مواقع للبحث مثل www.expertcentral.com والتي تقدم للباحثين إجابات متخصصة. وإضافة إلى ذلك فهناك العديد من محركات البحث التي تعتمد تقنيات الشبكات العصبية Neural Networks، ومحركات البحث التي يمكن تثبيتها على أجهزة المستخدمين، وفهرسة محتويات أقراصهم الصلبة. ونظرا للأهمية المتواصلة لمحركات البحث، فإن التقنيات الجديدة ستواصل ظهورها، وستواصل التقنية تطورها لتقديم نتائج أفضل للمستخدمين. وبظهور هذه التقنيات فإن بعضها سيفشل وبعضها سينجح، وستصبح التقنيات الناجحة جزءا من محركات البحث المستخدمة اليوم.
تطبيقات مستقبلية
إذا لم تكن تريد إنفاق الملايين في ابتكار تقنيات للذكاء الاصطناعي والمعالجة الطبيعية للغة، فإن الحل الأسهل هو استخدام الميزات التي تقدمها لغة XML لجعل عملية البحث أكثر دقة. فهذه اللغة كما هو معروف تعتمد على توصيف الوثائق والبيانات عند نشرها على الشبكة. فالمادة المتعلقة بالأسعار مثلا يتم توصيفها بعلامات تدل على أنها تمثل السعر، والمادة التي تصف أبعاد بضاعة معينة يتم توصيفها بهذا الشكل. وباستخدام XML يمكن للروبوتات التي تقوم بفهرسة مواقع إنترنت أن تفهم المحتوى الموجود ضمن الصفحات. وبالتالي فعندما تبحث عن تذكرة سفر بسعر معين مثلا، فإن الروبوتات لا تقوم فقط بالعثور على التذكرة بأفضل الأسعار، ولكنها تعثر أيضا على أفضل سعر لغرفة فندق، أو سيارة مستأجرة. ومن التطبيقات الأخرى مثلا هي أنك إذا عرضت سيرتك الذاتية على الروبوت فإنه يقترح عليك أفضل وظيفة تناسب مؤهلاتك. أو إذا عرضت على الروبوت ملفك الصحي فإنه يقترح عليك الفيتامينات التي يجب عليك تناولها، أو النوادي الصحية التي يمكنك الانضمام إليها. وبالطبع فإننا لا نعتقد أن XML هي الحل السحري، ولكنها يمكن أن تؤدي إلى زيادة نجاعة عمليات البحث إذا ما اقترنت بالتقنيات الأخرى المذكورة في موضوعنا هذا.
محمد حسن غنيم
المصدر"الموسوعة الحره"












التوقيع
محمد حسن غنيم
مركز جمعة الماجد للثقافة و التراث. دبي.
  رد مع اقتباس
قديم Nov-14-2006, 12:27 PM   المشاركة2
المعلومات

الاء المهلهل
رئيسة قسم المكتبة
والطباعة والنشر
بمعهد التخطيط
طرابلس

الاء المهلهل غير متواجد حالياً
البيانات
 
العضوية: 12923
تاريخ التسجيل: Oct 2005
الدولة: ليبيــا
المشاركات: 880
بمعدل : 0.13 يومياً


ممتاز شكرا لك معلومات وعرض قيم ........













  رد مع اقتباس
إضافة رد

مواقع النشر (المفضلة)


الذين يشاهدون محتوى الموضوع الآن : 1 ( الأعضاء 0 والزوار 1)
 

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code is متاحة
كود [IMG] متاحة
كود HTML معطلة

الانتقال السريع

المواضيع المتشابهه
الموضوع كاتب الموضوع المنتدى مشاركات آخر مشاركة
مكتبة اليسير ( إقرأ ما تريد .. وضع كتاب جديد !) د.محمود قطر عروض الكتب والإصدارات المتخصصة في مجال المكتبات والمعلومات 66 Apr-05-2014 03:17 PM
ماهي المصادر البشرية التي يمكن أن تساعد المستفيدين في تحديد الوصول إلى مصادر الداخلية جآء الأمل منتدى الإجراءات الفنية والخدمات المكتبية 18 Oct-13-2011 12:29 PM
التعلم بالبحث السايح منتدى الدروس النموذجية 0 Oct-03-2006 12:56 PM
محركات البحث على شبكة الانترنت العنقود المنتدى الــعــام للمكتبات والمعلومات 0 Dec-20-2004 10:58 AM


الساعة الآن 12:32 PM.
Powered by vBulletin® Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. جميع الحقوق محفوظة لـ : منتديات اليسير للمكتبات وتقنية المعلومات
المشاركات والردود تُعبر فقط عن رأي كتّابها
توثيق المعلومة ونسبتها إلى مصدرها أمر ضروري لحفظ حقوق الآخرين