مع وجود المليارات من مواقع الأنترنت , أصبح من المستحيل حفظ أسماء وعناوين المواقع المراد الوصول إليها , نتج عن ذلك وجود محركات البحث لتقوم بتسهيل الأمر عليك من خلال تنظيم وترتيب المواقع الموجودة علي الأنترنت , بطرق خاصة تختلف من محرك بحث إلي أخر لكي تظهر لك نتائج مرتبطة بعملية البحث , بشكل منظم ومرتب.
ما هو محرك البحث
عباره عن موقع إلكتروني يمتلك قاعدة بيانات ضخمة نتيجة لثلاث عمليات وهما (Crawling , Indexing , Ranking)
+ Crawling : تعني عمليه الأستكشاف لصفحات الويب , وتتم من خلال bots و كلمه bot هنا تعني برنامج مُبرمج من قبل الجهه المنشئه لمحرك البحث لكي يقوم بجمع البيانات من صفحات الويب وتختلف البيانات التي يتم جمعها مثل مستندات , صور , فيدوهات. وتتم هذه العمليه من خلال التنقل بين روابط موقع الويب .
+ Indexing : هي عمليه تخزين المحتوي الناتج عن عمليات الأستكشاف , وتنظيمه حتي يسهل الوصول إليه.
+ Ranking : هي عمليه الفرز , عندما يقوم المستخدم بالبحث عن شئ ما , تقوم محركات البحث بفحص الفهرس الخاص بها والبحث عن محتوي ذات صله , ثم تقوم بترتيب المحتويات المشابهه وإظهارها للمستخدم.
طبقات الإنترنت
يحتوي الإنترنت علي ثلاث طبقات أساسيه وهما
+ Surface web : هو جزء من الإنترنت يكون فيه الوصول إلي المواقع وصفحات الويب سهل عن طريق محركات البحث , وذلك لأن محركات البحث تقوم بأرشفة هذه المواقع والصفحات عن طريق برامج bots خاصة بها.
+ Deep web : هو الجزء الأعمق من الإنترنت ويمثل الفئه الأكبر من محتوياته , كالصفحات أو المستندات التي لم يتم أرشفتها من قبل محركات البحث , وهذا يعني انك إذا قمت بالبحث عن هذه الصفحات أو المستندات من خلال محركات البحث لن يظهر لك أي نتائج والسبب فى ذلك أن هذه البيانات إما أن تكون محميه بكلمات مرور أو تحتاج إلي صلاحيات خاصه للوصول , معظم الناس تعتقد أن deep web شئ خطير أو لا نستطيع الوصول إليه ولكن فى الحقيقه هذا مفهوم خاطئ لأننا كل يوم نستخدم هذا الجزء من الإنترنت ومن أمثله هذه الصفحات التي لا تستطيع محركات البحث أرشفتها.
- صفحات تحتاج إلي إسم مستخدم وكلمه مرور
- صفحات تقدم خدمات مدفوعه مثل Netflix أو Amazon
- صفحات داخليه خاصه بشركات أو منظمات
كل موقع إلكتروني يحتوي علي ملف إسمه robots.txt
يحتوي هذا الملف علي تعليمات عن الصفحات التي تستطيع محركات البحث أرشفتها والصفحات الممنوع علي محركات البحث أو أي شخص الوصول إليها
إذا بإختصار الفرق بين surface web و deep web هو أن هذه صفحات تم أرشفتها من محركات البحث والأخري لم يتم أرشفتها.
+ Dark web : هو الجزء أو الطبقه المخفيه فى الإنترنت ولا تستطيع الوصول إليها إلا بصلاحيات محدده ومعرفه إلي أين تذهب لأن فى هذه الطبقه يكون أسم الموقع معقد ومتغير بشكل مستمر لذلك حتي محركات البحث فى هذه الطبقه لا تستطيع عمل أرشفه لهذه المواقع بشكل مستمر.
Post a Comment