منتديات اليسير للمكتبات وتقنية المعلومات » منتديات اليسير العامة » منتدى تقنية المعلومات » محركات البحث العربيه

منتدى تقنية المعلومات هذا المنتدى مخصص للموضوعات الخاصة بتقنية المعلومات التي تتعلق بالمكتبات ومراكز مصادر المعلومات ومراكز مصادر التعلم.

إضافة رد
قديم Jan-27-2007, 09:08 PM   المشاركة1
المعلومات

ايمى الأهلاوية
مكتبي مثابر

ايمى الأهلاوية غير متواجد حالياً
البيانات
 
العضوية: 23571
تاريخ التسجيل: Dec 2006
الدولة: مصـــر
المشاركات: 27
بمعدل : 0.01 يومياً


استفسار محركات البحث العربيه

السلام عليكم ورحمة الله وبركاته

شكرا لك " آلاء المهلهل" على تشجيعك لى .

أنا كنت بعت قبل كده عن موضوع " كفاءة محركات البحث "

وانى كنت اعمل " دراسه مقارنه بين كفاءة محركات البحث العربيه و الانجليزيه "

فهل الموضوع كويس بجد , ولا مفيش وجه مقارنه بين محركات البحث العربيه و الانجليزيه ؟
وهل" دليل الخيمة للمواقع" : دليل فقط , ولا دليل ومحرك بحث ؟
وهل فى نقاط معينه تنصحونى بها عند اجراء هذه الدراسه ؟
وهل فى دراسات كتيره اتعملت عن الموضوع ده ؟
أرجو الافاده












  رد مع اقتباس
قديم Jan-28-2007, 04:20 AM   المشاركة2
المعلومات

w_kopycki
مكتبي فعّال

w_kopycki غير متواجد حالياً
البيانات
 
العضوية: 18123
تاريخ التسجيل: Jun 2006
الدولة: مصـــر
المشاركات: 158
بمعدل : 0.05 يومياً


افتراضي النصيحة

الأخت ايمي

السلام عليكم. نصيحتي لك هي قبل كل شيء لا بدّ تعمل نفسك في بحث عن المكونات لمحركات البحث، وتعرفي جيد الفرق بين دليل ومحركة البحث. وايضاً تدرسي عما هي الأغراض الانسانية والتجارية موجودة فيها.

هنا مقالة من "ويكيپيديا" عن محركات البحث:

http://en.wikipedia.org/wiki/Search_engine

(عموماً لا أساند بـ "ويكيپيديا" كمرجعة علمية لكن المعلومات في هذه المقالة مفيدة اذا انت جديدة للموضوعة. كان زمان الموقع جيد اسمه Searchenginewatch.com لكن مع الآسف هو الان موقع تجاري يحتاج على الاشتراك.

وفي الموقع الثاني، http://www.searchengineshowdown.com، بالرغم أن بعض معلوماته غير حديثة، ممكن تستفيدي من بعض الاخبار من "البلوغ/ blog" لصاحب الموقع).

ولا تنسي أن المواقع الراغبة في وصول من النتائج الأولى لبحث من أي محركة البحث يجب لهذه المواقع أنها تحط أو تفتح أنفسها في "العين" للمحركات البحث باستخدام عدد استراتيجيات لكي تحصل هذا... ممكن في اختيار كلمات الدالة المنطقية في الميتاداتا للموقع مثلاً. شوفي مثلاً هذا الاعلان من شركة مشغولة من وجهة نظر للمواقع التجارية:

http://tinyurl.com/3dfhp7

بهذا الاعلان، يجب أنّنا لا ننسي ايضاً أن تكون العلاقات ما بين صاحب الموقع ومحركات البحث، وهي "لعبة" بين الاثنين.

المهم: يالله جرّبي الدراسة لك، وأكيد النتيجة الأهمية هي أنك تتعمل معلومات جديدة التي توجد فائدة في نفسك ودراساتك. وبالله التوفيق.

وليم كوبكي
مكتبة جامعة بينسيلوانيا












  رد مع اقتباس
قديم Jan-28-2007, 10:48 PM   المشاركة3
المعلومات

A_K_A_2006
مكتبي فعّال

A_K_A_2006 غير متواجد حالياً
البيانات
 
العضوية: 22066
تاريخ التسجيل: Nov 2006
الدولة: ليبيــا
المشاركات: 179
بمعدل : 0.06 يومياً


ابتسامة

تأييد لرأي أخي / وليم كوبكي
أرى ضرورة معرفة أدوات البحث بالشبكة وأنواعها أولا ثم ، إجراء دراسة مقارنة بين محركات البحث العربية والأجنبية .
وضمن هذا الرأي أقدم لكم ورقة علمية قدمت للأستاذ الدكتور أبوبكر محمود الهوش بأكاديمية الدراسات العليا /طرابلس -ليبيا ، ضمن الحلقات الدراسية بالأكاديمية .

الورقة العلمية :/


جزء من الورقة العلمية التي قدمت للأستاذ دكتور أبوبكر الهوش /

عبدالمطلب خليفة عمارة .البحث في شبكة الانترنت ، " ورقة علمية ، قدمت ضمن الحلقات الدراسية بأكاديمية الدراسات العليا /طرابلس ، ربيع 2004 .

مصطلحات الورقة /
الأدلة الموضوعية SUBJECT DIRECTORIES
بريد إلكتروني E-MAIL
بروتوكول نقل الملفات ( FILE TRANSFER PROTOCOL -FTP
كلمات مفتاحية KEYWORDS
بروتوكول نقل النص الفائق HYPERTEXT TRANSFER PROTOCOL (http)
الوسائط المتعددة MULTI MEDIA
الإنسان الآلي ROBOTS
بحث SEARCH
محركات البحث ENGINES SEARCH
العناكب SPIDERS
محدد مواقع الموارد المتجانسية UNIFORM RESOURSE LOCATOR-URL
الشبكة الدولية الويب أو الشبكة العنكبوتية WORLD WIDE WEB-WWW
الديدان WORMS
خدمات الويس WIDE ARESA INFORMATION SERVICES -WAIS
مؤسسة العلوم الوطنية الأمريكية
NATIONAL SCIENCE FOUNDATION - NSF

مشكلات البحث في الانترنت/
تحتوي الانترنت ، وشبكة الويب على وجه الخصوص ، على الملايين من الصفحات من المعلومات معظمها على شكل نصوص وهي المعلومات تنمو بشكل متسارع فضلاً عن عمليات التحديث المستمرة على مدار اليوم بل الساعة ، الأمر الذي يطرح تحدياً للباحثين عن المعلومات في الشبكة .
ومشكلات البحث في الانترنت ناتجة عن سببين اثنين هما :
1. كثرة المعلومات الموجودة على الشبكة :
فهناك الملايين من صفحات الويب ، مواقع القوفر ، مواقع نقل الملفات ( FTP ) والآلاف من المجموعات الإخبارية ( NEWS-GROUP ) ، والقوائم البريدية(MAILING LISTS ) .
2. عدم وجود هيئة أو منظمة موحدة تشرف على تنظيم هذه المعلومات ، وبالتالي عدم وجود دليل
مركزي لهذه الموارد المتاحة يمكن البحث من خلاله .
إن الوصول إلى المعلومات عبر شبكة عملاقة مثل الإنترنت هو أمر شديد الصعوبة ويستهلك الكثير من الزمن ، ولكن بفضل أدوات خاصة بالبحث عن الملفات والمعلومات تصبح العملية أسهل وأسرع .
ونظراً للخدمات المتعددة لشبكة الانترنت ، والتي منها :
1. خدمات القوفر ( GOPHER SERVERS) .
2. خدمات نقل الملفات ، والتي تستخدم بروتوكول نقل الملفات(FTP )
FILE TRANSFER PROTOCOL
3. خدمات المجموعات الإخبارية ( USENET أو NEWSGROUPS)
4. خدمات الويب في الشبكة العنكبوتية WORLD WIDE WEB ( WWW)
5. خدمات القوائم البريدية
عليه تنقسم أدوات البحث عن المعلومات في شبكة الانترنت إلى قسمين أساسيين هما :
1. أدوات بحث نصية .
2. أدوات بحث رسومية من خلال الويب .

أدوات البحث النصية :
أدوات البحث النصية هي أدوات عن الملفات والمعلومات التي ظهرت قبل شيوع استخدام الويب، وسميت بهذا الاسم لأن واجهة العمل فيها كانت تعتمد على النصوص فقط ، فالصور والألوان والأصوات وغيرها من إمكانات الوسائط المتعددة ( MULTI MEDIA ) لم تكن معروفة حينئذٍ ، ومن أشهر هذه الأدوات ، خدمات القوفر ( GOPHER SERVERS) والتي ظهرت لأول مرة في جامعة مينسوتا الأمريكية ، ولا تزال إلى حد الآن أسهل الطرق للوصول إلى المعلومات عبر شبكة إنترنت .

أدوات البحث الرسومية :
نتيجة لاتجاه التطور في عالم الحاسوب الحديثة المتمثلة في الاعتماد على العناصر الرسومية وإمكانيات الوسائط المتعددة ، فقد ظهرت العشرات من أدوات البحث ، وفي سبيل تحسين مستوى أداء وفاعلية هذه الأدوات قد أضيفت كل أداة العديد من الخصائص المتقدمة.

أنواع أدوات البحث /
1. محركات البحث ( ENGINES SEARCH ) .
2. الأدلة الموضوعية ( SUBJECT DIRECTORIES ) .

تعريف محركات البحث /
" هي عبارة عن أداة تقوم بالبحث عن مصادر المعلومات على الإنترنت ـ المعلومات على المواقع SITES ـ وتخزين عناوينها على مرصد البيانات الخاص بها ، ثم تقوم بإتاحتها للمستفيدين كلٌ حسب المصطلح أو المصطلحات المستخدمة في البحث " 1،ومن ثم تمكّن المستفيد من الوصول إلى مصادر المعلومات المختلفة على الإنترنت ، ويتم تجميع هذه المصادر وتصفحها إما بطريقة آلية عن طريق برامج آلية مخصصة لذلك تسمى (SPIDERS , WORMS , OR ROBOTS ) وإما بطريق يدوية وذلك عن طريق العنصر البشري .
ومحرك البحث يقوم بدور كبير من أجل نشر الوثائق بواسطته ومن خلاله ، فمحركات البحث هي المنفذ الرئيسي ـ إن لم يكن الوحيد ـ الذي من خلاله يمكن الوصول إلى هدف الباحث من الإنترنت .

تعريف الأدلة الموضوعية :
الأدلة الموضوعية هي مواقع متخصصة بالإنترنت تنتقي مواقع ويب أخري وتنظمها تحت رؤوس موضوعات عريضة مثل الفن ، والتربية ، والتسلية ، والعلوم . كما يمكنك التصفح باعتماد موضوعات عريضة إلي أن تجد الموضوع المحدد الذي ترغب فيه ، أو أن تقوم ببحث ضمن الدليل الموضوعي باستخدام كلمات مفتاحية ( Keywords ) .
ونظرا لغياب ترتيب هرمي معياري أو لغة موحدة تؤخذ منها المصطلحات الموضوعية ، فإن الأدلة الموضوعية تختلف فيما بينها اختلافاً كبيراً في مستوي تنظيم الفئات الموضوعية وترتيبها.2

مكونات أدوات البحث /
تتكون كل أداة بحث من قاعدة بيانات فأكثر تحتوي علي تسجيلات وحقول :
- قاعدة البيانات هي مجموعة من وحدات المعلومات تسمي بالتسجيلات .
- التسجيلة هي وحدة معلومات ضمن قاعدة للبيانات تتألف من حقول .
- الحقل هو وحدة معلومات ضمن تسجيلة .

وأدوات البحث تقوم بدور مزدوج لتحقيق هذا الهدف ، وهما :
الدور الأول : تقوم باستقبال الوثائق من مؤلفيها ثم إجراء عملية التكشيف ووضع رؤوس مواضيع لها ثم يتم بعد ذلك تخزينها في قاعدة البيانات الخاصة بمحرك البحث نفسه .
الدور الثاني : لمحرك البحث فيتمثل في عملية إتاحة هذه الوثائق ونشرها أو ما نطلق عليه توزيعها على المستفيدين وذلك عن طريق استدعاء هذه الوثائق وفقاً لاستراتيجية البحث الخاصة بالمستفيد والتي تعبر عن احتياجاته الموضوعية .

طريقة عمل الأدوات
بالرغم من أن المميزات المتعلقة بكيفية أداء كل أداة بحث للعمل تبقي ضمن الأسرار التي تحتفظ بها الشركات لنفسها ، فإن نوع العمل الذي تقوم به أدوات البحث هو واحد ، ويشمل هذا العمل أربعة مجالات :
- تجميع السجلات .
- تكشيف السجلات .
- البحث في الكشاف .
- عرض نتائج البحث .
1. التجميع :
يوجد نوعان من أدوات البحث وهما : الأدلة الموضوعية ( Subject – directories ) ومحركات البحث ( engines Search ) .
ويتم بناء قواعد البيانات للأدلة الموضوعية يدوياً ، إذ يقوم أحد الموظفين الذين يعملون لدي المؤسسة المزودة لقاعدة البيانات بالبحث عن المعلومات المتعلقة بموقع الويب ، ثم يزوره بهدف تقييمه ودراسة مدى جدوى تغطيته من قبل الدليل . وإذا ما تم الحكم بجدوى التغطية ، يتم اتخاذ قرار بخصوص الكيفية التي سيظهر الموقع وفقها ضمن الدليل . وغالباً ما تكون الأدلة الموضوعية شديدة الانتقاء للمواقع التي تقوم بتغطيتها ، وهو ما يجعل من قواعد بياناتها أصغر من تلك التابعة لمحركات البحث 3.
أما بناء قواعد بيانات محركات البحث فإنه يتم عن طريق الحواسيب ، إذ قد لا يتدخل العنصر البشري في هذه العملية إلا بشكل محدود وقد يكون ذلك التدخل غائباً تماماً في بعض الحالات . وتسمى هذا البرامج بالعناكب (spiders) في بعض الأحيان ، وبالديدان ( Worms ) ، والإنسان الآلي ( Robots ) في أحيان أحرى . ومهما كانت التسمية التي تحملها ، فإن هذه الأدوات تقوم بالعمل نفسه ، فهي تجوب الويب بحثاً عن المواقع التي تقوم بجلبها إلي قاعدة بيانات محرك البحث . بيد أن الويب ضخمة جداً وتتغير بسرعة ، مما يجعل من الصعوبة بمكان تجميع كل مواقعها . ويستدعي هذا الأمر من العناكب التي تجوب الويب أن تستخدم بعض المعايير التي تساعدها علي تقرير إلي أي مدى يجب تجميع المعلومات من الموقع الواحد .
وتتراوح أساليب تجميع مواقع الويب بين الأساليب الأفقية التي تقوم بتجميع العديد من الصفحات الدليلية لمواقع الويب بإتباع الروابط التي تقود من موقع إلي أخر ، ولكن بدون أن تتعمق داخل الموقع الواحد ، والأساليب العمودية التي تفضي إلي زيارة عدد أقل من المواقع مع أتباع روابط تتعمق في البحث ضمن الموقع الواحد . وبعبارة أخري فإن الأساليب الأفقية تركز علي الاتساع في تجميع المعلومات في حين نجد الأساليب العمودية تضحي بأتساع المعلومات لفائدة عمقها .
وينطوي كلا الأسلوبين في تجميع المعلومات علي بعض العيوب وعلي بعض المزايا ، ويصعب غالباً تحديد مدى اعتماد أداة البحث علي كل واحد منهما . وفي نهاية التحليل ، فإن القرارات التي تتخذ بخصوص اتساع البحث في مقابل عمقه تستند إلي سعى أدوات البحث للملاءمة بينهما ، وذلك بهدف إضفاء الفاعلية علي الوظيفة التي تضطلع بها في واقع يتسم بتشعيب أوعية المعلومات وبمحدودية طاقة التخزين وسرعة الاسترجاع التي تتميز بها حتى أكثر الأجهزة تطوراً .

2. التكشيف :
وبعد الانتهاء من تجميع صفحات الويب واستحداث تسجيلة ( record ) لها يتم تخزين هذه التسجيلة بقاعدة البيانات وتكشيفها . ويتراوح مستوى التكشيف بين الحد الأدنى الذي يشمل عنوان الوثيقة ومحصل المصادر الموحد ( URL ) ( UNIFORM RESOURSE LOCATOR) (محدد مواقع الموارد المتجانسية ) 4 والمستوى الأرقى الذي يوفر تكشيفاً أكثر تشعباً يغطي كل الكلمات الواردة في كل تسجيلة بقاعدة البيانات . والتكشيف النموذجي يتضمن العناصر التالية :
- العنوان .
- معلومات هامة تشير إليها لغة ترميز النص المترابط وذات العلاقة بوثيقة معينة مثل :

أ – الكلمات البارزة .
ب- الروابط .
- تواتر ( Frequency ) كلمة في أحدى الصفحات .
- الشرح ( annotation ) .
- الإحالات من موضوع إلي أخر ( Cross – reference by topic ) .

وتصبح العلاقة بين التكشيف واسترجاع المعلومات أكثر وضوحاً عندما نفكر في الصعوبات التي سنواجهها في إيجاد كتاب بمحل لبيع الكتب رتبت مواده حسب الموضوعات ثم هجائياً حسب أسماء المؤلفين ، ونحن لا نعرف سوى عنوان الكتاب . وسندرك هذه الصعوبة أيضا عندما نرغب في استرجاع أخر كتاب لمؤلف محبّب إلينا ، وواقع الحال أن محل بيع الكتب قد رتب مواده حسب الموضوعات وحسب العناوين .
ويعتبر تكشيف النصوص الكاملة أشمل أنواع التكشيف . وهو يتطلب حيزاً كبيراً لتخزين المعلومات وقدرة حوسبة هائلة ، وهو ما يتيح مرونة كبيرة في البحث عن المعلومات . فهذا النوع من التكشيف يسمح للمستفيد بأن يبحث عن كلمات واردة في أحد سطور أغنية حتى وإن كان لا يعرف صاحبها .

3. البحث :
تتلقي أدوات البحث الاستفسار الذي تطرحه وتقوم باسترجاع مجموعة من التسجيلات التي تضاهيه . إن ما يهم المستفيد في المقام الأول بخصوص أدوات البحث هي الملامح المتطورة التي تعرضها وكيف تم وضع خيارات البحث التي تتيحها ، أن التفاصيل المتعلقة بتنفيذ بحث في الإنترنت قد تتباين بشكل كبير .
وبناء علي ذلك ستشرع أداة البحث في القيام بعملها وفقاً لإحدى الطرق الثلاث التالية :
1. تبحث في قاعدتها للبيانات عما يتوفر من معلومات حول الكلمة الأولي ( طقس ) ، ثم تبحث في تلك المعلومات عماله علاقة بالكلمة الثانية (سان) ، وتبحث بعد ذلك عما له علاقة بالكلمة الثالثة (فرانسيسكو) ضمن النتائج المتحصل عليها في المرحلة الثانية .
2. تقوم بثلاثة أبحاث متوازنة يخصص كل واحد منها لكلمة واحدة من الكلمات الثلاث ، بغرض تحديد الوثائق التي وردت فيها الكلمات الثلاث ( طقس ، سان ، فرانسيسكو ) .
3. تمزج بين الطريقتين الأولي والثانية في إنجاز البحث .

4. عرض النتائج :
تعرض كل الأدوات نتائج البحث في شكل قوائم . وتتضمن القائمة التسجيلات التي تم استرجاعها من قاعدة البيانات والتي تطابق معايير البحث . وتحوى القائمة روابط إلي المصدر المتوفر بالويب والذي له علاقة بالموضوع . وغالباً ما توفر القائمة أيضاً وصفاً موجزاً للمصدر المذكور . وعرض عموماً النتائج المتوصل إليها في نهاية بحث أنجز بواسطة دليل موضوعي وفق ترتب هجائي . أما النتائج التي يفضي إليها البحث المنفذ باعتماد أحد محركات البحث فغالياً ما ترتب حسب ملاءمتها لموضوع البحث . وتمزج بعض أدوات البحث بين الملاءمة والنظام الهجائي وبعض المعايير الخاصة بها في ترتيب نتائج البحث ضمن القوائم التي تعرضها .

ولفهم نوعيات أدوات البحث يجب فهم نوعين من المقاربات في البحث عن المعلومات في الانترنت هما :
مقاربة الدليل الموضوعي SUBJECT DIRECTORY APPROACH )
التصفح أو البحث في قاعدة بيانات صغيرة تشمل عناوين وشروحاً أعدتها مواقع الويب وقام أفراد بانتقائها وتنظيمها في فئات موضوعية .

مقاربة محرك البحث : ( ENGINES APPROACH SEARCH )
البحث في قاعدة بيانات ضخمة لمواقع الإنترنت تحوي النص الكامل لكل مصدر تغطية قاعدة البيانات ، ولكنها لا تنظم المعلومات في فئات موضوعية 6 .


الأدلة الموضوعية 7 :
الأدلة الموضوعية هي مواقع متخصصة بالإنترنت تنتقي مواقع ويب أخري وتنظمها تحت رؤوس موضوعات عريضة مثل الفن ، والتربية ، والتسلية ، والعلوم . كما يمكنك التصفح باعتماد موضوعات عريضة إلي أن تجد الموضوع المحدد الذي ترغب فيه ، أو أن تقوم ببحث ضمن الدليل الموضوعي باستخدام كلمات مفتاحية (Keywords ) .
ونظرا لغياب ترتيب هرمي معياري أو لغة موحدة تؤخذ منها المصطلحات الموضوعية ، فإن الأدلة الموضوعية تختلف فيما بينها اختلافاً كبيراً في مستوي تنظيم الفئات الموضوعية وترتيبها .

يمكن الهدف من وراء إعداد الأدلة الموضوعية في تنظيم المعلومات مسبقاً في فئات موضوعية حتى يتمكن المستفيد من استخدامها في تصفح المعلومات .
إن البحث داخل قاعدة بيانات أحد الأدلة الموضوعية يشبه البحث عن المعلومات باعتماد فهرس المكتبة فأنت تبحث عن مؤلف الكتاب أو عنوانه أو موضوعه . وعليه ، فأنت لا تتوقع من فهرس المكتبة أن يمكنك من البحث باعتماد النص الكامل للكتاب . كذلك فإن للمكتبات نظامها الخاص الذي يمكنك من التعرف إلي الموضوعات الأخرى ذات العلاقة بموضوع بحتك . وتقوم الأدلة الموضوعية بهذه الوظيفة بتمكين المستفيد من التصفح من خلال رؤوس موضوعات واسعة . وتتيح العديد من المتصفحات للمستفيد إمكانيات استرجاع المعلومات ليس عن طريق التصفح فحسب . وأنما أيضاً بواسطة الكلمات المفتاحية ( Keywords ) .
إن جوانب القوة الكامنة في الأدلة الموضوعية مقارنة بمحركات البحث يتمثل في أن الإنسان هو الذي يقوم بتنظيم مصادر المعلومات في فئات موضوعية . ونجد بعض هذه الأدلة أقل تشدداً فيما يتعلق بصفحات الويب التي يتم إدراجها ضمن محتويات الدليل . إن تنظيم المعلومات بوضعها في فئات موضوعية باعتماد الموضوعات العامة التي يمكن أن تدرج تحتها يساعد علي رفع الغموض الذي قد يبرز نتيجة استخدام مصطلحات محددة واردة في المصدر . وعليه ، فإن صفحة ويب التي تتناول زراعة الشمر ستظهر تحت بستنة
( Gardening ) وليس تحت وصفات الطعام ( Recipes ) بالرغم من أن كلمة شمر ستظهر في صفحات وضعت في كلا الفئتين ( بستنة ووصفات الطعام ) . وبناء علي ذلك فإن المستفيد الذي يستخدم الأدلة الموضوعية يمكنه أن يتوقع أن تكون النتائج متطابقة مع موضوع البحث .

محركات البحث :
علي خلاف الأدلة الموضوعية ، فإن محركات البحث تشكل كشافات شاملة للإنترنت . وبالرغم من أن محركات البحث تهدف إلي تكشيف كل كلمة واردة في كل صفحة من صفحات الويب ، فإن ذلك يمثل مهمة مستحيلة . فحتى أكبر محركات البحث لا تستطيع تكشيف سوى ما يقارب 60 – 80 بالمائة مما يتوفر من معلومات في الإنترنت . وتتأثر عملية تكشيف المعلومات بالإنترنت بقوة الحوسبة المتوفرة ، وبالطبيعة المتغيرة للويب ، وببعض المسائل ذات العلاقة ببنية قاعدة البيانات لمحرك البحث وطريقة تصميم موقع الويب . وتقوم حواسيب تسمى بالإنسان الآلي ( Robots ) وبالعناكب ( Spiders ) وبزواحف الويب ( WebCrawler ) وبالديدان ( Worms ) باستمرار بتجميع صفحات الويب وتكشيفها .
ويقوم المستفيد بصياغة بحثه بطباعة الكلمات المفتاحية في قاعدة بياناته الضخمة . ويتم استرجاع كل الوثائق التي تتضمن تلك المصطلحات وترتيبها في قائمة النتائج أو في ما يعرف بقائمة الإصابات (hit list ) . وغالباً ما يغرق المستفيد في النتائج وذلك لكثرة ما يوجد من معلومات بالإنترنت . ولا تشكل القوائم التي تتضمن الآلاف من النتائج مشكلة بالنسبة إليك مادامت الإجابة علي سؤالك موجودة في أعلي القائمة . وتستخدم محركات البحث خوارزمية الترتيب ( ranking algorithm ) حتى تظهر الإصابات ذات العلاقة بموضوع البحث في أعلي القائمة . وخوارزمية الترتيب هي عبارة عن معادلات رياضية تحدد الترتيب الذي يجب أن تعرض وفقه نتائج البحث . وعليه ، فإن الوثائق ذات العلاقة الأقوى بموضوع البحث تظهر في أعلي القائمة ، وأضعفها علاقة تظهر في أسفل القائمة 8.
ولكل محرك بحث ما يلي :
- نظام للتجميع بغرض ملء قاعدة البيانات بالمعلومات .
- نظام للتكشيف لتنظيم محتويات قاعدة البيانات .
- خوارزمية للبحث تفي بمتطلبات بناء الجملة للبحث في قاعدة البيانات .
- خوارزمية للترتيب لتنظيم قائمة النتائج .
أن وجود اختلاف وإن كان بسيطاً ، في هذه البرامج الأربعة يؤثر علي النتائج المتحصل عليها . وهذا هو السبب الذي يجعل النتائج تختلف اختلافاً كبيراً بين محركات البحث حتى وإن كانت تستخدم مصطلحات البحث نفسها . وهذا سبب كاف ليجعلك تتجنب التعود علي استخدام محرك بحث واحد .
أن السر في نجاح البحث بواسطة أحد المحركات البحث يكمن في حسن اختيار الكلمات المفتاحية التي ستؤدي إلي استرجاع الوثائق الملائمة لموضوع بحثك ثم ترتيب تلك الكلمات وفقاً لقواعد بناء الجملة للإستفاذة من الخصائص المتقدمة التي تتيحها أداة البحث . ويجدر التنويه بأن محركات البحث غالباً ما تتجاهل بعض الكلمات ذات التواتر المرتفع ( Frequency High- ) في صفحات الويب مثل ( of , to , a, the , in and ) كما أن بعض الكلمات الأخرى مثل ( find , tell , how , help )هي من الكلمات العامة المتداولة علي نطاق واسع ، وهو ما يجعل استخدامها كمصطلحات بحث غير مجد . فكلما قل تداول الكلمة أو الجملة ساعد ذلك في الحد من استرجاع وثائق لا علاقة لها بموضوع البحث .
ماذا يحدث عندما تنجز بحثاً:
إن البحث الأساس الذي يغلب على الإنترنت هو طباعة كلمات في صندوق ثم النقر على زر للحصول على نتائج . وتقوم أداة البحث بمضاهاة كل مصطلح من المصطلحات التي تستخدم في عملية البحث مع المصطلحات التي توجد بقاعدة البيانات ثم تعطيك قائمة بصفحات الويب التي تتضمن تلك المصطلحات .
إن المضاهاة تعني في هذه الحالة أن المصطلحات التي استخدمت في البحث عن المعلومات توجد في واحدة أو أكثر من الأماكن التالية :
- مستخلص في الصفحة .
- شرح ليس بالضرورة أن يكون قد أعده كاتب الصفحة .
- ضمن أدوات البحث الكبرى .
- رؤوس موضوعات في صفحة الويب .
- في أي مكان آخر من نص صفحة الويب

فهم الاختلافات بين أدوات البحث 9 :
إن فهم الاختلافات الموجودة في مستوى قيام كل أداة بحث لعملها سيساعد كثيراً علي تحسين فاعلية استرجاع المعلومات التي ترغب فيها من الإنترنت . وتمكن الاختلافات الأساسية بين أدوات البحث في الجوانب التالية :
1. التفاعل أثناء إنجاز البحث .
2. حجم قاعدة البيانات .
3. أساليب إنشاء قاعدة البيانات .
4. عمق التكشيف .
5. تنظيم قائمة نتائج البحث ( الترتيب حسب الملاءمة ) .
6. خصائص البحث المتقدم .
7. تقديم نتائج البحث .

1. التفاعل أثناء البحث :
توفر كل أداة بحث صندوقاً أبيض اللون ومستطيل الشكل ( صندوق البحث ) تطبع فيه مصطلحات البحث وزراً ينقر عليه لتنفيذ البحث . أما بقية عناصر التفاعل فإنها تختلف من أداة بحث إلي أخرى . ويتوجب عليك أن تبدى اهتماماً خاصاً للتأكد من أنه توجد أزرار أو صندوق يتضمن قائمة للاختيار تبين بالتحديد جزء قاعدة البيانات الذي ستبحث فيه أو نوع خصائص البحث المتقدم المتوافرة . وتوفر بعض الأدوات للمستفيد إمكانية اختيار الطريقة التي يرغب أن تعرض وفقها نتائج البحث .

2. حجم قاعد البيانات :
الأدلة الموضوعية : لها قواعد بيانات صغيرة نسيباً تحتوي مواقع مختارة . وتتميز قواعد بيانات الأدلة الموضوعية باحتوائها لعدد قليل من المصادر التي تم تنظيمها حسب فئات موضوعية واختيارها لنوعيتها .
محركات البحث :
تتوافر لديها قواعد بيانات ضخمة تسعي لتكون شاملة . وتهدف محركات البحث إلي تكشيف كل الكلمات الواردة في صفحات الإنترنت بقواعد بياناتها . وتوكل مهمة اختيار مصطلحات البحث بعناية وتقييم نوعية النتائج المتوصل إليها إلي المستفيد . ونظراً للنمو المطرد الذي تشهده الإنترنت والتغيير الدائم الذي يشمل طبيعتها فإنه من الصعوبة بمكان أن يتمكن أي واحد من محركات البحث من تغطية كل محتويات الإنترنت . وفي الوقت الحالي فإن محرك البحث الذي يدعي أن لديه أكبر قاعدة بيانات ، ويقوم بتكشيف حوالي 100 مليون صفحة ويب . ووفقً لهذا الرقم فإن نسبة تغطيته للانترنت تقع ما بين 60 و 80 بالمائة من إجمالي مواقع الإنترنت . ولا توجد في الواقع وسيلة للتأكد من صحة هذه الأرقام .

3. أساليب إنشاء قواعد البيانات :
- الأدلة الموضوعية : يقوم الإنسان باختيار المواقع التي سيتم تخزينها بقاعدة البيانات ولا دخل للبرمجيات (Software ) في ذلك .
- محركات البحث : تبني قواعد البيانات من قبل برمجيات تسمي في الغالب بالعناكب أو الإنسان الآلي (الروبوت ) أو زواحف الويب أو الديدان .

4. عمق التكشيف :
- الأدلة الموضوعية : تكشف هذه الأدلة في بعض الأحيان جوانب محدودة من صفحة الويب مثل العنوان فقط ، وتتعمق في بعض الأحيان الأخرى في عملية التكشيف فتغطي العناوين والمستخلصات والعروض (Reviews ) وغيرها من العناصر الأخرى ذات العلاقة بإحدى صفحات الويب .
- محركات البحث : تكشف محركات البحث كل الكلمات الموجودة بكل صفحات الويب المدرجة بقاعدة بياناتها.
وتتبع بعض محركات البحث طريقة في التكشيف تسمح للمستفيد بتحديد بحثه بحقول معينة . وتعتبر حقول البحث التالية من أكثر الحقول شيوعاً :
1. عنوان صفحة الويب .
2. محصل المصادر الموحد ( URL ) .
3. مجال الإنترنت ( مثلاً حكومي gov أو تجاري com ....الخ ) .
4. الروابط التي يمكن النقر عليها بصفحة الويب .
5. نوع وعاء المعلومات ( صورة ، صوت ، ... الخ ) .
. طلب قوائم النتائج :
- الأدلة الموضوعية : عادة ما تكون النتائج مرتبة هجائياً .
- محركات البحث : تتبع محركات البحث ما يسمي بخوارزمية الترتيب حسب الملاءمة
( Relevancy Ranking Algorithm ) في تحديد طريقة عرض نتائج البحث .

المصادر /
1. مصطفى السيد . دليلك الشامل إلى شبكة إنترنت . ـ ط3 .ـ القاهرة : دار الكتب العلمية ،2000 ،ص 19 .
2. خالد محمد رياض."دور محركات البحث في نشر الوثائق على الإنترنت"، في الموتمر العلمي الثاني لمركز بحوث نظم وخدمات المعلومات بالقاهرة 25/26أكتوبر1999 .
3. تشيرل غولد.البحث الذكي في شبكة الانترنت.ـ ترجمة عبدالمجيد بوعزة .ـالرياض:مكتبة الملك فهد ،2001 ،ص 72.
4. تشيرل غولد. مرجع سبق ذكره ص ص 61-66.
5. جيري هونيكوت . مبادئ الانترنت .ـ ترجمة عمر الأيوبي .ـ بيروت : أكاديمي، 1997 ، ص84 .
6. تشيرل غولد. مرجع سبق ذكره ص ص 71-72.
7. تشيرل غولد. مرجع سبق ذكره ص ص 72-77.
8. تشيرل غولد. مرجع سبق ذكره ص ص 84-85.
9. تشيرل غولد. مرجع سبق ذكره ص ص 111-116.


مع فائق إحترامي وتقديري
للجميع












التوقيع
ادعو إلى سبيل ربك بالحكمة والموعظة الحسنة وجادلهم بالتي هي أحسن
  رد مع اقتباس
قديم Jan-28-2007, 10:51 PM   المشاركة4
المعلومات

A_K_A_2006
مكتبي فعّال

A_K_A_2006 غير متواجد حالياً
البيانات
 
العضوية: 22066
تاريخ التسجيل: Nov 2006
الدولة: ليبيــا
المشاركات: 179
بمعدل : 0.06 يومياً


ابتسامة

تأييد لرأي أخي / وليم كوبكي
أرى ضرورة معرفة أدوات البحث بالشبكة وأنواعها أولا ثم ، إجراء دراسة مقارنة بين محركات البحث العربية والأجنبية .
وضمن هذا الرأي أقدم لكم ورقة علمية قدمت للأستاذ الدكتور أبوبكر محمود الهوش بأكاديمية الدراسات العليا /طرابلس -ليبيا ، ضمن الحلقات الدراسية بالأكاديمية .

الورقة العلمية :/


جزء من الورقة العلمية التي قدمت للأستاذ دكتور أبوبكر الهوش /

عبدالمطلب خليفة عمارة .البحث في شبكة الانترنت ، " ورقة علمية ، قدمت ضمن الحلقات الدراسية بأكاديمية الدراسات العليا /طرابلس ، ربيع 2004 .

مصطلحات الورقة /
الأدلة الموضوعية SUBJECT DIRECTORIES
بريد إلكتروني E-MAIL
بروتوكول نقل الملفات ( FILE TRANSFER PROTOCOL -FTP
كلمات مفتاحية KEYWORDS
بروتوكول نقل النص الفائق HYPERTEXT TRANSFER PROTOCOL (http)
الوسائط المتعددة MULTI MEDIA
الإنسان الآلي ROBOTS
بحث SEARCH
محركات البحث ENGINES SEARCH
العناكب SPIDERS
محدد مواقع الموارد المتجانسية UNIFORM RESOURSE LOCATOR-URL
الشبكة الدولية الويب أو الشبكة العنكبوتية WORLD WIDE WEB-WWW
الديدان WORMS
خدمات الويس WIDE ARESA INFORMATION SERVICES -WAIS
مؤسسة العلوم الوطنية الأمريكية
NATIONAL SCIENCE FOUNDATION - NSF

مشكلات البحث في الانترنت/
تحتوي الانترنت ، وشبكة الويب على وجه الخصوص ، على الملايين من الصفحات من المعلومات معظمها على شكل نصوص وهي المعلومات تنمو بشكل متسارع فضلاً عن عمليات التحديث المستمرة على مدار اليوم بل الساعة ، الأمر الذي يطرح تحدياً للباحثين عن المعلومات في الشبكة .
ومشكلات البحث في الانترنت ناتجة عن سببين اثنين هما :
1. كثرة المعلومات الموجودة على الشبكة :
فهناك الملايين من صفحات الويب ، مواقع القوفر ، مواقع نقل الملفات ( FTP ) والآلاف من المجموعات الإخبارية ( NEWS-GROUP ) ، والقوائم البريدية(MAILING LISTS ) .
2. عدم وجود هيئة أو منظمة موحدة تشرف على تنظيم هذه المعلومات ، وبالتالي عدم وجود دليل
مركزي لهذه الموارد المتاحة يمكن البحث من خلاله .
إن الوصول إلى المعلومات عبر شبكة عملاقة مثل الإنترنت هو أمر شديد الصعوبة ويستهلك الكثير من الزمن ، ولكن بفضل أدوات خاصة بالبحث عن الملفات والمعلومات تصبح العملية أسهل وأسرع .
ونظراً للخدمات المتعددة لشبكة الانترنت ، والتي منها :
1. خدمات القوفر ( GOPHER SERVERS) .
2. خدمات نقل الملفات ، والتي تستخدم بروتوكول نقل الملفات(FTP )
FILE TRANSFER PROTOCOL
3. خدمات المجموعات الإخبارية ( USENET أو NEWSGROUPS)
4. خدمات الويب في الشبكة العنكبوتية WORLD WIDE WEB ( WWW)
5. خدمات القوائم البريدية
عليه تنقسم أدوات البحث عن المعلومات في شبكة الانترنت إلى قسمين أساسيين هما :
1. أدوات بحث نصية .
2. أدوات بحث رسومية من خلال الويب .

أدوات البحث النصية :
أدوات البحث النصية هي أدوات عن الملفات والمعلومات التي ظهرت قبل شيوع استخدام الويب، وسميت بهذا الاسم لأن واجهة العمل فيها كانت تعتمد على النصوص فقط ، فالصور والألوان والأصوات وغيرها من إمكانات الوسائط المتعددة ( MULTI MEDIA ) لم تكن معروفة حينئذٍ ، ومن أشهر هذه الأدوات ، خدمات القوفر ( GOPHER SERVERS) والتي ظهرت لأول مرة في جامعة مينسوتا الأمريكية ، ولا تزال إلى حد الآن أسهل الطرق للوصول إلى المعلومات عبر شبكة إنترنت .

أدوات البحث الرسومية :
نتيجة لاتجاه التطور في عالم الحاسوب الحديثة المتمثلة في الاعتماد على العناصر الرسومية وإمكانيات الوسائط المتعددة ، فقد ظهرت العشرات من أدوات البحث ، وفي سبيل تحسين مستوى أداء وفاعلية هذه الأدوات قد أضيفت كل أداة العديد من الخصائص المتقدمة.

أنواع أدوات البحث /
1. محركات البحث ( ENGINES SEARCH ) .
2. الأدلة الموضوعية ( SUBJECT DIRECTORIES ) .

تعريف محركات البحث /
" هي عبارة عن أداة تقوم بالبحث عن مصادر المعلومات على الإنترنت ـ المعلومات على المواقع SITES ـ وتخزين عناوينها على مرصد البيانات الخاص بها ، ثم تقوم بإتاحتها للمستفيدين كلٌ حسب المصطلح أو المصطلحات المستخدمة في البحث " 1،ومن ثم تمكّن المستفيد من الوصول إلى مصادر المعلومات المختلفة على الإنترنت ، ويتم تجميع هذه المصادر وتصفحها إما بطريقة آلية عن طريق برامج آلية مخصصة لذلك تسمى (SPIDERS , WORMS , OR ROBOTS ) وإما بطريق يدوية وذلك عن طريق العنصر البشري .
ومحرك البحث يقوم بدور كبير من أجل نشر الوثائق بواسطته ومن خلاله ، فمحركات البحث هي المنفذ الرئيسي ـ إن لم يكن الوحيد ـ الذي من خلاله يمكن الوصول إلى هدف الباحث من الإنترنت .

تعريف الأدلة الموضوعية :
الأدلة الموضوعية هي مواقع متخصصة بالإنترنت تنتقي مواقع ويب أخري وتنظمها تحت رؤوس موضوعات عريضة مثل الفن ، والتربية ، والتسلية ، والعلوم . كما يمكنك التصفح باعتماد موضوعات عريضة إلي أن تجد الموضوع المحدد الذي ترغب فيه ، أو أن تقوم ببحث ضمن الدليل الموضوعي باستخدام كلمات مفتاحية ( Keywords ) .
ونظرا لغياب ترتيب هرمي معياري أو لغة موحدة تؤخذ منها المصطلحات الموضوعية ، فإن الأدلة الموضوعية تختلف فيما بينها اختلافاً كبيراً في مستوي تنظيم الفئات الموضوعية وترتيبها.2

مكونات أدوات البحث /
تتكون كل أداة بحث من قاعدة بيانات فأكثر تحتوي علي تسجيلات وحقول :
- قاعدة البيانات هي مجموعة من وحدات المعلومات تسمي بالتسجيلات .
- التسجيلة هي وحدة معلومات ضمن قاعدة للبيانات تتألف من حقول .
- الحقل هو وحدة معلومات ضمن تسجيلة .

وأدوات البحث تقوم بدور مزدوج لتحقيق هذا الهدف ، وهما :
الدور الأول : تقوم باستقبال الوثائق من مؤلفيها ثم إجراء عملية التكشيف ووضع رؤوس مواضيع لها ثم يتم بعد ذلك تخزينها في قاعدة البيانات الخاصة بمحرك البحث نفسه .
الدور الثاني : لمحرك البحث فيتمثل في عملية إتاحة هذه الوثائق ونشرها أو ما نطلق عليه توزيعها على المستفيدين وذلك عن طريق استدعاء هذه الوثائق وفقاً لاستراتيجية البحث الخاصة بالمستفيد والتي تعبر عن احتياجاته الموضوعية .

طريقة عمل الأدوات
بالرغم من أن المميزات المتعلقة بكيفية أداء كل أداة بحث للعمل تبقي ضمن الأسرار التي تحتفظ بها الشركات لنفسها ، فإن نوع العمل الذي تقوم به أدوات البحث هو واحد ، ويشمل هذا العمل أربعة مجالات :
- تجميع السجلات .
- تكشيف السجلات .
- البحث في الكشاف .
- عرض نتائج البحث .
1. التجميع :
يوجد نوعان من أدوات البحث وهما : الأدلة الموضوعية ( Subject – directories ) ومحركات البحث ( engines Search ) .
ويتم بناء قواعد البيانات للأدلة الموضوعية يدوياً ، إذ يقوم أحد الموظفين الذين يعملون لدي المؤسسة المزودة لقاعدة البيانات بالبحث عن المعلومات المتعلقة بموقع الويب ، ثم يزوره بهدف تقييمه ودراسة مدى جدوى تغطيته من قبل الدليل . وإذا ما تم الحكم بجدوى التغطية ، يتم اتخاذ قرار بخصوص الكيفية التي سيظهر الموقع وفقها ضمن الدليل . وغالباً ما تكون الأدلة الموضوعية شديدة الانتقاء للمواقع التي تقوم بتغطيتها ، وهو ما يجعل من قواعد بياناتها أصغر من تلك التابعة لمحركات البحث 3.
أما بناء قواعد بيانات محركات البحث فإنه يتم عن طريق الحواسيب ، إذ قد لا يتدخل العنصر البشري في هذه العملية إلا بشكل محدود وقد يكون ذلك التدخل غائباً تماماً في بعض الحالات . وتسمى هذا البرامج بالعناكب (spiders) في بعض الأحيان ، وبالديدان ( Worms ) ، والإنسان الآلي ( Robots ) في أحيان أحرى . ومهما كانت التسمية التي تحملها ، فإن هذه الأدوات تقوم بالعمل نفسه ، فهي تجوب الويب بحثاً عن المواقع التي تقوم بجلبها إلي قاعدة بيانات محرك البحث . بيد أن الويب ضخمة جداً وتتغير بسرعة ، مما يجعل من الصعوبة بمكان تجميع كل مواقعها . ويستدعي هذا الأمر من العناكب التي تجوب الويب أن تستخدم بعض المعايير التي تساعدها علي تقرير إلي أي مدى يجب تجميع المعلومات من الموقع الواحد .
وتتراوح أساليب تجميع مواقع الويب بين الأساليب الأفقية التي تقوم بتجميع العديد من الصفحات الدليلية لمواقع الويب بإتباع الروابط التي تقود من موقع إلي أخر ، ولكن بدون أن تتعمق داخل الموقع الواحد ، والأساليب العمودية التي تفضي إلي زيارة عدد أقل من المواقع مع أتباع روابط تتعمق في البحث ضمن الموقع الواحد . وبعبارة أخري فإن الأساليب الأفقية تركز علي الاتساع في تجميع المعلومات في حين نجد الأساليب العمودية تضحي بأتساع المعلومات لفائدة عمقها .
وينطوي كلا الأسلوبين في تجميع المعلومات علي بعض العيوب وعلي بعض المزايا ، ويصعب غالباً تحديد مدى اعتماد أداة البحث علي كل واحد منهما . وفي نهاية التحليل ، فإن القرارات التي تتخذ بخصوص اتساع البحث في مقابل عمقه تستند إلي سعى أدوات البحث للملاءمة بينهما ، وذلك بهدف إضفاء الفاعلية علي الوظيفة التي تضطلع بها في واقع يتسم بتشعيب أوعية المعلومات وبمحدودية طاقة التخزين وسرعة الاسترجاع التي تتميز بها حتى أكثر الأجهزة تطوراً .

2. التكشيف :
وبعد الانتهاء من تجميع صفحات الويب واستحداث تسجيلة ( record ) لها يتم تخزين هذه التسجيلة بقاعدة البيانات وتكشيفها . ويتراوح مستوى التكشيف بين الحد الأدنى الذي يشمل عنوان الوثيقة ومحصل المصادر الموحد ( URL ) ( UNIFORM RESOURSE LOCATOR) (محدد مواقع الموارد المتجانسية ) 4 والمستوى الأرقى الذي يوفر تكشيفاً أكثر تشعباً يغطي كل الكلمات الواردة في كل تسجيلة بقاعدة البيانات . والتكشيف النموذجي يتضمن العناصر التالية :
- العنوان .
- معلومات هامة تشير إليها لغة ترميز النص المترابط وذات العلاقة بوثيقة معينة مثل :

أ – الكلمات البارزة .
ب- الروابط .
- تواتر ( Frequency ) كلمة في أحدى الصفحات .
- الشرح ( annotation ) .
- الإحالات من موضوع إلي أخر ( Cross – reference by topic ) .

وتصبح العلاقة بين التكشيف واسترجاع المعلومات أكثر وضوحاً عندما نفكر في الصعوبات التي سنواجهها في إيجاد كتاب بمحل لبيع الكتب رتبت مواده حسب الموضوعات ثم هجائياً حسب أسماء المؤلفين ، ونحن لا نعرف سوى عنوان الكتاب . وسندرك هذه الصعوبة أيضا عندما نرغب في استرجاع أخر كتاب لمؤلف محبّب إلينا ، وواقع الحال أن محل بيع الكتب قد رتب مواده حسب الموضوعات وحسب العناوين .
ويعتبر تكشيف النصوص الكاملة أشمل أنواع التكشيف . وهو يتطلب حيزاً كبيراً لتخزين المعلومات وقدرة حوسبة هائلة ، وهو ما يتيح مرونة كبيرة في البحث عن المعلومات . فهذا النوع من التكشيف يسمح للمستفيد بأن يبحث عن كلمات واردة في أحد سطور أغنية حتى وإن كان لا يعرف صاحبها .

3. البحث :
تتلقي أدوات البحث الاستفسار الذي تطرحه وتقوم باسترجاع مجموعة من التسجيلات التي تضاهيه . إن ما يهم المستفيد في المقام الأول بخصوص أدوات البحث هي الملامح المتطورة التي تعرضها وكيف تم وضع خيارات البحث التي تتيحها ، أن التفاصيل المتعلقة بتنفيذ بحث في الإنترنت قد تتباين بشكل كبير .
وبناء علي ذلك ستشرع أداة البحث في القيام بعملها وفقاً لإحدى الطرق الثلاث التالية :
1. تبحث في قاعدتها للبيانات عما يتوفر من معلومات حول الكلمة الأولي ( طقس ) ، ثم تبحث في تلك المعلومات عماله علاقة بالكلمة الثانية (سان) ، وتبحث بعد ذلك عما له علاقة بالكلمة الثالثة (فرانسيسكو) ضمن النتائج المتحصل عليها في المرحلة الثانية .
2. تقوم بثلاثة أبحاث متوازنة يخصص كل واحد منها لكلمة واحدة من الكلمات الثلاث ، بغرض تحديد الوثائق التي وردت فيها الكلمات الثلاث ( طقس ، سان ، فرانسيسكو ) .
3. تمزج بين الطريقتين الأولي والثانية في إنجاز البحث .

4. عرض النتائج :
تعرض كل الأدوات نتائج البحث في شكل قوائم . وتتضمن القائمة التسجيلات التي تم استرجاعها من قاعدة البيانات والتي تطابق معايير البحث . وتحوى القائمة روابط إلي المصدر المتوفر بالويب والذي له علاقة بالموضوع . وغالباً ما توفر القائمة أيضاً وصفاً موجزاً للمصدر المذكور . وعرض عموماً النتائج المتوصل إليها في نهاية بحث أنجز بواسطة دليل موضوعي وفق ترتب هجائي . أما النتائج التي يفضي إليها البحث المنفذ باعتماد أحد محركات البحث فغالياً ما ترتب حسب ملاءمتها لموضوع البحث . وتمزج بعض أدوات البحث بين الملاءمة والنظام الهجائي وبعض المعايير الخاصة بها في ترتيب نتائج البحث ضمن القوائم التي تعرضها .

ولفهم نوعيات أدوات البحث يجب فهم نوعين من المقاربات في البحث عن المعلومات في الانترنت هما :
مقاربة الدليل الموضوعي SUBJECT DIRECTORY APPROACH )
التصفح أو البحث في قاعدة بيانات صغيرة تشمل عناوين وشروحاً أعدتها مواقع الويب وقام أفراد بانتقائها وتنظيمها في فئات موضوعية .

مقاربة محرك البحث : ( ENGINES APPROACH SEARCH )
البحث في قاعدة بيانات ضخمة لمواقع الإنترنت تحوي النص الكامل لكل مصدر تغطية قاعدة البيانات ، ولكنها لا تنظم المعلومات في فئات موضوعية 6 .


الأدلة الموضوعية 7 :
الأدلة الموضوعية هي مواقع متخصصة بالإنترنت تنتقي مواقع ويب أخري وتنظمها تحت رؤوس موضوعات عريضة مثل الفن ، والتربية ، والتسلية ، والعلوم . كما يمكنك التصفح باعتماد موضوعات عريضة إلي أن تجد الموضوع المحدد الذي ترغب فيه ، أو أن تقوم ببحث ضمن الدليل الموضوعي باستخدام كلمات مفتاحية (Keywords ) .
ونظرا لغياب ترتيب هرمي معياري أو لغة موحدة تؤخذ منها المصطلحات الموضوعية ، فإن الأدلة الموضوعية تختلف فيما بينها اختلافاً كبيراً في مستوي تنظيم الفئات الموضوعية وترتيبها .

يمكن الهدف من وراء إعداد الأدلة الموضوعية في تنظيم المعلومات مسبقاً في فئات موضوعية حتى يتمكن المستفيد من استخدامها في تصفح المعلومات .
إن البحث داخل قاعدة بيانات أحد الأدلة الموضوعية يشبه البحث عن المعلومات باعتماد فهرس المكتبة فأنت تبحث عن مؤلف الكتاب أو عنوانه أو موضوعه . وعليه ، فأنت لا تتوقع من فهرس المكتبة أن يمكنك من البحث باعتماد النص الكامل للكتاب . كذلك فإن للمكتبات نظامها الخاص الذي يمكنك من التعرف إلي الموضوعات الأخرى ذات العلاقة بموضوع بحتك . وتقوم الأدلة الموضوعية بهذه الوظيفة بتمكين المستفيد من التصفح من خلال رؤوس موضوعات واسعة . وتتيح العديد من المتصفحات للمستفيد إمكانيات استرجاع المعلومات ليس عن طريق التصفح فحسب . وأنما أيضاً بواسطة الكلمات المفتاحية ( Keywords ) .
إن جوانب القوة الكامنة في الأدلة الموضوعية مقارنة بمحركات البحث يتمثل في أن الإنسان هو الذي يقوم بتنظيم مصادر المعلومات في فئات موضوعية . ونجد بعض هذه الأدلة أقل تشدداً فيما يتعلق بصفحات الويب التي يتم إدراجها ضمن محتويات الدليل . إن تنظيم المعلومات بوضعها في فئات موضوعية باعتماد الموضوعات العامة التي يمكن أن تدرج تحتها يساعد علي رفع الغموض الذي قد يبرز نتيجة استخدام مصطلحات محددة واردة في المصدر . وعليه ، فإن صفحة ويب التي تتناول زراعة الشمر ستظهر تحت بستنة
( Gardening ) وليس تحت وصفات الطعام ( Recipes ) بالرغم من أن كلمة شمر ستظهر في صفحات وضعت في كلا الفئتين ( بستنة ووصفات الطعام ) . وبناء علي ذلك فإن المستفيد الذي يستخدم الأدلة الموضوعية يمكنه أن يتوقع أن تكون النتائج متطابقة مع موضوع البحث .

محركات البحث :
علي خلاف الأدلة الموضوعية ، فإن محركات البحث تشكل كشافات شاملة للإنترنت . وبالرغم من أن محركات البحث تهدف إلي تكشيف كل كلمة واردة في كل صفحة من صفحات الويب ، فإن ذلك يمثل مهمة مستحيلة . فحتى أكبر محركات البحث لا تستطيع تكشيف سوى ما يقارب 60 – 80 بالمائة مما يتوفر من معلومات في الإنترنت . وتتأثر عملية تكشيف المعلومات بالإنترنت بقوة الحوسبة المتوفرة ، وبالطبيعة المتغيرة للويب ، وببعض المسائل ذات العلاقة ببنية قاعدة البيانات لمحرك البحث وطريقة تصميم موقع الويب . وتقوم حواسيب تسمى بالإنسان الآلي ( Robots ) وبالعناكب ( Spiders ) وبزواحف الويب ( WebCrawler ) وبالديدان ( Worms ) باستمرار بتجميع صفحات الويب وتكشيفها .
ويقوم المستفيد بصياغة بحثه بطباعة الكلمات المفتاحية في قاعدة بياناته الضخمة . ويتم استرجاع كل الوثائق التي تتضمن تلك المصطلحات وترتيبها في قائمة النتائج أو في ما يعرف بقائمة الإصابات (hit list ) . وغالباً ما يغرق المستفيد في النتائج وذلك لكثرة ما يوجد من معلومات بالإنترنت . ولا تشكل القوائم التي تتضمن الآلاف من النتائج مشكلة بالنسبة إليك مادامت الإجابة علي سؤالك موجودة في أعلي القائمة . وتستخدم محركات البحث خوارزمية الترتيب ( ranking algorithm ) حتى تظهر الإصابات ذات العلاقة بموضوع البحث في أعلي القائمة . وخوارزمية الترتيب هي عبارة عن معادلات رياضية تحدد الترتيب الذي يجب أن تعرض وفقه نتائج البحث . وعليه ، فإن الوثائق ذات العلاقة الأقوى بموضوع البحث تظهر في أعلي القائمة ، وأضعفها علاقة تظهر في أسفل القائمة 8.
ولكل محرك بحث ما يلي :
- نظام للتجميع بغرض ملء قاعدة البيانات بالمعلومات .
- نظام للتكشيف لتنظيم محتويات قاعدة البيانات .
- خوارزمية للبحث تفي بمتطلبات بناء الجملة للبحث في قاعدة البيانات .
- خوارزمية للترتيب لتنظيم قائمة النتائج .
أن وجود اختلاف وإن كان بسيطاً ، في هذه البرامج الأربعة يؤثر علي النتائج المتحصل عليها . وهذا هو السبب الذي يجعل النتائج تختلف اختلافاً كبيراً بين محركات البحث حتى وإن كانت تستخدم مصطلحات البحث نفسها . وهذا سبب كاف ليجعلك تتجنب التعود علي استخدام محرك بحث واحد .
أن السر في نجاح البحث بواسطة أحد المحركات البحث يكمن في حسن اختيار الكلمات المفتاحية التي ستؤدي إلي استرجاع الوثائق الملائمة لموضوع بحثك ثم ترتيب تلك الكلمات وفقاً لقواعد بناء الجملة للإستفاذة من الخصائص المتقدمة التي تتيحها أداة البحث . ويجدر التنويه بأن محركات البحث غالباً ما تتجاهل بعض الكلمات ذات التواتر المرتفع ( Frequency High- ) في صفحات الويب مثل ( of , to , a, the , in and ) كما أن بعض الكلمات الأخرى مثل ( find , tell , how , help )هي من الكلمات العامة المتداولة علي نطاق واسع ، وهو ما يجعل استخدامها كمصطلحات بحث غير مجد . فكلما قل تداول الكلمة أو الجملة ساعد ذلك في الحد من استرجاع وثائق لا علاقة لها بموضوع البحث .
ماذا يحدث عندما تنجز بحثاً:
إن البحث الأساس الذي يغلب على الإنترنت هو طباعة كلمات في صندوق ثم النقر على زر للحصول على نتائج . وتقوم أداة البحث بمضاهاة كل مصطلح من المصطلحات التي تستخدم في عملية البحث مع المصطلحات التي توجد بقاعدة البيانات ثم تعطيك قائمة بصفحات الويب التي تتضمن تلك المصطلحات .
إن المضاهاة تعني في هذه الحالة أن المصطلحات التي استخدمت في البحث عن المعلومات توجد في واحدة أو أكثر من الأماكن التالية :
- مستخلص في الصفحة .
- شرح ليس بالضرورة أن يكون قد أعده كاتب الصفحة .
- ضمن أدوات البحث الكبرى .
- رؤوس موضوعات في صفحة الويب .
- في أي مكان آخر من نص صفحة الويب

فهم الاختلافات بين أدوات البحث 9 :
إن فهم الاختلافات الموجودة في مستوى قيام كل أداة بحث لعملها سيساعد كثيراً علي تحسين فاعلية استرجاع المعلومات التي ترغب فيها من الإنترنت . وتمكن الاختلافات الأساسية بين أدوات البحث في الجوانب التالية :
1. التفاعل أثناء إنجاز البحث .
2. حجم قاعدة البيانات .
3. أساليب إنشاء قاعدة البيانات .
4. عمق التكشيف .
5. تنظيم قائمة نتائج البحث ( الترتيب حسب الملاءمة ) .
6. خصائص البحث المتقدم .
7. تقديم نتائج البحث .

1. التفاعل أثناء البحث :
توفر كل أداة بحث صندوقاً أبيض اللون ومستطيل الشكل ( صندوق البحث ) تطبع فيه مصطلحات البحث وزراً ينقر عليه لتنفيذ البحث . أما بقية عناصر التفاعل فإنها تختلف من أداة بحث إلي أخرى . ويتوجب عليك أن تبدى اهتماماً خاصاً للتأكد من أنه توجد أزرار أو صندوق يتضمن قائمة للاختيار تبين بالتحديد جزء قاعدة البيانات الذي ستبحث فيه أو نوع خصائص البحث المتقدم المتوافرة . وتوفر بعض الأدوات للمستفيد إمكانية اختيار الطريقة التي يرغب أن تعرض وفقها نتائج البحث .

2. حجم قاعد البيانات :
الأدلة الموضوعية : لها قواعد بيانات صغيرة نسيباً تحتوي مواقع مختارة . وتتميز قواعد بيانات الأدلة الموضوعية باحتوائها لعدد قليل من المصادر التي تم تنظيمها حسب فئات موضوعية واختيارها لنوعيتها .
محركات البحث :
تتوافر لديها قواعد بيانات ضخمة تسعي لتكون شاملة . وتهدف محركات البحث إلي تكشيف كل الكلمات الواردة في صفحات الإنترنت بقواعد بياناتها . وتوكل مهمة اختيار مصطلحات البحث بعناية وتقييم نوعية النتائج المتوصل إليها إلي المستفيد . ونظراً للنمو المطرد الذي تشهده الإنترنت والتغيير الدائم الذي يشمل طبيعتها فإنه من الصعوبة بمكان أن يتمكن أي واحد من محركات البحث من تغطية كل محتويات الإنترنت . وفي الوقت الحالي فإن محرك البحث الذي يدعي أن لديه أكبر قاعدة بيانات ، ويقوم بتكشيف حوالي 100 مليون صفحة ويب . ووفقً لهذا الرقم فإن نسبة تغطيته للانترنت تقع ما بين 60 و 80 بالمائة من إجمالي مواقع الإنترنت . ولا توجد في الواقع وسيلة للتأكد من صحة هذه الأرقام .

3. أساليب إنشاء قواعد البيانات :
- الأدلة الموضوعية : يقوم الإنسان باختيار المواقع التي سيتم تخزينها بقاعدة البيانات ولا دخل للبرمجيات (Software ) في ذلك .
- محركات البحث : تبني قواعد البيانات من قبل برمجيات تسمي في الغالب بالعناكب أو الإنسان الآلي (الروبوت ) أو زواحف الويب أو الديدان .

4. عمق التكشيف :
- الأدلة الموضوعية : تكشف هذه الأدلة في بعض الأحيان جوانب محدودة من صفحة الويب مثل العنوان فقط ، وتتعمق في بعض الأحيان الأخرى في عملية التكشيف فتغطي العناوين والمستخلصات والعروض (Reviews ) وغيرها من العناصر الأخرى ذات العلاقة بإحدى صفحات الويب .
- محركات البحث : تكشف محركات البحث كل الكلمات الموجودة بكل صفحات الويب المدرجة بقاعدة بياناتها.
وتتبع بعض محركات البحث طريقة في التكشيف تسمح للمستفيد بتحديد بحثه بحقول معينة . وتعتبر حقول البحث التالية من أكثر الحقول شيوعاً :
1. عنوان صفحة الويب .
2. محصل المصادر الموحد ( URL ) .
3. مجال الإنترنت ( مثلاً حكومي gov أو تجاري com ....الخ ) .
4. الروابط التي يمكن النقر عليها بصفحة الويب .
5. نوع وعاء المعلومات ( صورة ، صوت ، ... الخ ) .
. طلب قوائم النتائج :
- الأدلة الموضوعية : عادة ما تكون النتائج مرتبة هجائياً .
- محركات البحث : تتبع محركات البحث ما يسمي بخوارزمية الترتيب حسب الملاءمة
( Relevancy Ranking Algorithm ) في تحديد طريقة عرض نتائج البحث .

المصادر /
1. مصطفى السيد . دليلك الشامل إلى شبكة إنترنت . ـ ط3 .ـ القاهرة : دار الكتب العلمية ،2000 ،ص 19 .
2. خالد محمد رياض."دور محركات البحث في نشر الوثائق على الإنترنت"، في الموتمر العلمي الثاني لمركز بحوث نظم وخدمات المعلومات بالقاهرة 25/26أكتوبر1999 .
3. تشيرل غولد.البحث الذكي في شبكة الانترنت.ـ ترجمة عبدالمجيد بوعزة .ـالرياض:مكتبة الملك فهد ،2001 ،ص 72.
4. تشيرل غولد. مرجع سبق ذكره ص ص 61-66.
5. جيري هونيكوت . مبادئ الانترنت .ـ ترجمة عمر الأيوبي .ـ بيروت : أكاديمي، 1997 ، ص84 .
6. تشيرل غولد. مرجع سبق ذكره ص ص 71-72.
7. تشيرل غولد. مرجع سبق ذكره ص ص 72-77.
8. تشيرل غولد. مرجع سبق ذكره ص ص 84-85.
9. تشيرل غولد. مرجع سبق ذكره ص ص 111-116.


مع فائق إحترامي وتقديري
للجميع












التوقيع
ادعو إلى سبيل ربك بالحكمة والموعظة الحسنة وجادلهم بالتي هي أحسن
  رد مع اقتباس
قديم Jan-29-2007, 12:50 PM   المشاركة5
المعلومات

الاء المهلهل
رئيسة قسم المكتبة
والطباعة والنشر
بمعهد التخطيط
طرابلس

الاء المهلهل غير متواجد حالياً
البيانات
 
العضوية: 12923
تاريخ التسجيل: Oct 2005
الدولة: ليبيــا
المشاركات: 894
بمعدل : 0.27 يومياً


افتراضي

الله يبارك فيك اختي
وانا مع راي اخوتي اللذين سبقوني
واود شكر اخي عبد المطلب على نشره لهذه المقالة الرائعة
وشكر اخي w_kopycki على الروابط المفيدة والممتعة التي ارفقها
وربي يوفقكم
تحيااااااااااتي












  رد مع اقتباس
إضافة رد

مواقع النشر (المفضلة)


الذين يشاهدون محتوى الموضوع الآن : 1 ( الأعضاء 0 والزوار 1)
 
أدوات الموضوع
انواع عرض الموضوع تقييم هذا الموضوع
تقييم هذا الموضوع:

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code is متاحة
كود [IMG] متاحة
كود HTML معطلة

الانتقال السريع

المواضيع المتشابهه
الموضوع كاتب الموضوع المنتدى مشاركات آخر مشاركة
ماهي المصادر البشرية التي يمكن أن تساعد المستفيدين في تحديد الوصول إلى مصادر الداخلية جآء الأمل منتدى الإجراءات الفنية والخدمات المكتبية 18 Oct-13-2011 12:29 PM
التعلم بالبحث السايح منتدى الدروس النموذجية 0 Oct-03-2006 12:56 PM
محركات البحث على شبكة الانترنت العنقود المنتدى الــعــام للمكتبات والمعلومات 0 Dec-20-2004 09:58 AM


الساعة الآن 09:18 PM.
Powered by vBulletin® Copyright ©2000 - 2014, Jelsoft Enterprises Ltd. جميع الحقوق محفوظة لـ : منتديات اليسير للمكتبات وتقنية المعلومات
المشاركات والردود تُعبر فقط عن رأي كتّابها
توثيق المعلومة ونسبتها إلى مصدرها أمر ضروري لحفظ حقوق الآخرين