इंटरनेट पर सर्च इंजन का उपयोग करने वाले बहुत से लोग आश्चर्य करते हैं कि यह कैसे पता चलता है कि एक अनुरोध के जवाब में, आप विभिन्न साइटों से आवश्यक जानकारी प्राप्त कर सकते हैं और इसके अलावा, प्रासंगिक।
खोज प्रौद्योगिकियां
साइटों की सूची प्राप्त करने के लिए, आपको शब्दों से युक्त एक खोज क्वेरी दर्ज करनी होगी। एक अलग शाब्दिक इकाई के रूप में शब्द खोज परिणामों के गठन का आधार है।
खोज रोबोट का कार्य इंटरनेट पर अधिक से अधिक पृष्ठों को क्रॉल करना और उनकी सामग्री को याद रखना है, किसी विशिष्ट विषय पर पृष्ठ का एंकर बनाने के लिए संपूर्ण पाठ को शब्दों में तोड़ना। फिर यह ध्यान में रखा जाता है कि क्या क्वेरी के सभी शब्द पृष्ठ के पाठ में आते हैं और उन्हें कितनी बार पाया जा सकता है। इन्हीं आंकड़ों के आधार पर मामला बनता है। सर्च इंजन के काम करने का यह सामान्य सिद्धांत 2000 और हमारे समय दोनों के लिए प्रासंगिक है।
खोज परिणामों को क्या प्रभावित करता है
लेकिन फिर भी, साइटों की सूची बनाने के लिए और भी कई कारक हैं। आज यह माना जाता है कि सामान्य सूची में साइटों का क्रम न केवल पाठ से प्रभावित होता है, बल्कि अन्य आगंतुकों ने उस पर कैसे व्यवहार किया, अर्थात, उन्होंने जो समय बिताया, जहां वे रुके थे, आदि।
अन्य स्रोतों से पृष्ठों पर रखे गए लिंक, उपयोगी जानकारी की मात्रा, साइट की आयु और अपडेट की आवृत्ति का भी प्रभाव पड़ता है।
बेशक, काम के सभी सिद्धांत अज्ञात हैं, ताकि साइटों की सूचियों में कोई कृत्रिम हेरफेर न हो। यह लोगों को स्पैम और वायरस वाले अवांछित पृष्ठों से बचने के लिए आवश्यक जानकारी प्राप्त करने की अनुमति देता है।
खोज इंजन आज एक अविश्वसनीय रूप से जटिल प्रणाली है, जिसमें प्रत्येक सेवा के लिए एक बड़ी विकास टीम है। आखिरकार, उदाहरण के लिए, यांडेक्स पर आप वीडियो देख सकते हैं, चित्र खोज सकते हैं और समाचार पढ़ सकते हैं। ये सभी सेवाएं अपने-अपने सिद्धांतों के अनुसार काम करती हैं, साथ ही उनके द्वारा खोजी भी जाती हैं।
प्रत्येक खोज इंजन में विश्लेषिकी विभाग होते हैं जिनका कार्य यह पता लगाना है कि क्या सब कुछ उपयोगकर्ताओं के अनुकूल है। एल्गोरिदम में हर दिन सुधार किया जा रहा है। ऐसी प्रणालियों के संचालन को बनाए रखने के लिए, दुनिया भर में स्थित हजारों सर्वरों को संसाधनों तक पहुंच की लगातार उच्च गति प्रदान करने की आवश्यकता होती है।