സെർച്ച് എഞ്ചിനുകൾ എങ്ങനെ വെബ് പേജുകൾ കണ്ടെത്തുന്നു, അവർ കണ്ടെത്തിയ പേജുകൾ ഉപയോഗിച്ച് അവർ എന്തുചെയ്യുന്നു, എന്ത് ഫലങ്ങൾ കാണിക്കണമെന്ന് അവർ എങ്ങനെ തീരുമാനിക്കും എന്നതിനെക്കുറിച്ചുള്ള അടിസ്ഥാനകാര്യങ്ങൾ ആണ് എവിടെ വിശദമാക്കുന്നത് . ഏറ്റവും അടുത്തുള്ള കോഫി ഷോപ്പ് കണ്ടെത്താൻ നിങ്ങൾ ഒരു ഗൂഗിൾ ഉപയോഗിക്കുമ്പോൾ, നിങ്ങൾ ചിന്തിച്ചേക്കാം, അത് എങ്ങനെ ചെയ്തു? മുഴുവൻ ഇന്റർനെറ്റിലൂടെയും ഇത്ര വേഗത്തിൽ അടുക്കി, പേജിൽ ഫലങ്ങൾ എങ്ങനെ തിരഞ്ഞെടുത്തു?
പ്രധാനമായും മൂന്ന് ജോലികൾ ആണ് സെർച്ച് എൻജിനുകൾ ചെയ്യുന്നത് :
# കീവേർഡുകൾക്കനുസരിച് എല്ലാ വെബ് പേജുകളുടെ ഉള്ളടക്കം പരിശോധിക്കുക (അതാണ് ക്രോളിംഗ് ).
# അവർ ഓരോ ഉള്ളടക്കത്തെയും തരംതിരിക്കുന്നു (ഇതിനെ ഇൻഡെക്സിംഗ് എന്ന് വിളിക്കുന്നു).
# മൂന്നാമതായി, ഏത് ഉള്ളടക്കമാണ് തിരയുന്നവർക്ക് ഏറ്റവും ഉപയോഗപ്രദമെന്ന് അവർ തീരുമാനിക്കുന്നു (അതിനെ റാങ്കിംഗ് എന്ന് വിളിക്കുന്നു).
ഇവ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് നമുക്ക് അടുത്തറിയാം. വെബ് പേജുകൾ, ഇമേജുകൾ, വീഡിയോകൾ എന്നിവ പോലുള്ള ഉള്ളടക്കം കണ്ടെത്താൻ ഗൂഗിൾ ഇന്റർനെറ്റിനെ “ക്രാൾ” ചെയ്യുന്നു. പേജുകളിലൂടെ കടന്നുപോകാൻ “ബോട്ടുകൾ” (റോബോട്ടിനായി ഹ്രസ്വമായത്), “ക്രാളറുകൾ” അല്ലെങ്കിൽ “Spider ” എന്ന് വിളിക്കുന്ന കമ്പ്യൂട്ടർ പ്രോഗ്രാമുകൾ ഉപയോഗിക്കുന്നു.
മറ്റ് പേജുകളിലേക്കുള്ള ലിങ്കുകൾ പിന്തുടർന്ന് ബോട്ടുകൾ പേജിൽ നിന്ന് പേജിലേക്ക് സഞ്ചരിക്കുന്നു . ഈ ബോട്ടുകൾ ഒരിക്കലും നിൽക്കുന്നില്ല ; റിസൾട്ട് പേജിൽ ഉൾപ്പെടുത്തുന്നതിനായി പുതിയ ലിങ്കുകളും പുതിയ ഉള്ളടക്കവും തിരയുക എന്നതാണ് അവരുടെ ഏക ലക്ഷ്യം. ഇൻഡെക്സിംഗ് പ്രക്രിയയുടെ രണ്ടാം ഭാഗമാണ്. ബോട്ടുകൾ കണ്ടെത്തിയ എല്ലാ വെബ് പേജുകളുടെയും ഉള്ളടക്കത്തിന്റെയും ഭീമാകാരമായ പട്ടിക ഓർഗനൈസ് ചെയ്യുന്ന ഘട്ടമാണിത് . സെർച്ച് റിസൾട്ട് പേജുകളിൽ പ്രദർശിപ്പിച്ചിരിക്കുന്ന വിവരങ്ങളുടെ ഉറവിടമായി ഗൂഗിൾ ഈ സൂചിക ഉപയോഗിക്കുന്നു.
പക്ഷേ, ബോട്ടുകൾ കണ്ടെത്തുന്നതെല്ലാം ഇൻഡക്സ് ലിസ്റ്റിൽ ഉൾപ്പെടുന്നില്ല .
ഉദാഹരണത്തിന്, വ്യത്യസ്ത വെബ്സൈറ്റുകളിൽ സ്ഥിതിചെയ്യുന്ന കൃത്യമായ ഒരേ ഉള്ളടക്കത്തിന്റെ ഒന്നിലധികം പകർപ്പുകൾ തിരയൽ ഗൂഗിൾ ബോട്സ് കണ്ടെത്തിയേക്കാം.
ഇങ്ങനെ ഒരേ കണ്ടെന്റ് ധാരാളം വെബ്സൈറ്റുകളിൽ കണ്ടെത്തിയാൽ , ഒറിജിനൽ കണ്ടെന്റ് ഉള്ള വെബ് പേജ് ആണ് ഇൻഡക്സ് ചെയ്യപ്പെടുക.
അതിനാൽ, നിങ്ങളുടെ വെബ്സൈറ്റിൽ നിങ്ങളുടെ സ്വന്തം വിവരണം എഴുതുന്നതാണ് നല്ലത്.
മനസിലാവുന്നുണ്ടോ ? ക്രാളിംഗും ഇൻഡെക്സിംഗും കഴിഞ്ഞാൽ അടുത്തത് റാങ്കിങ്ങ് ആണ് . നിങ്ങൾ ഗൂഗിളിൽ സെർച്ച് ടൈപ്പുചെയ്യുമ്പോൾ, പൊരുത്തപ്പെടുന്ന ഫലങ്ങൾക്കായി എഞ്ചിൻ നിങ്ങൾ ഉപയോഗിക്കുന്ന പദങ്ങളും വേർഡുകളും ഉപയോഗിച്ചു കണ്ടെത്തിയ ഭീമാകാരമായ പട്ടിക ഇൻഡക്സ് ചെയ്യുന്നു. ഉദാഹരണത്തിന്, ഗൂഗിൾ 230 ദശലക്ഷം പൊരുത്തപ്പെടുന്ന ഫലങ്ങൾ കണ്ടെത്തുന്നു. ഇപ്പോൾ ഗൂഗിളിന്റെ ചുമതലയുടെ അവസാന ഭാഗത്തിനുള്ള സമയമാണ് : റാങ്കിംഗ്.
സെർച്ച് എഞ്ചിനുകൾ പേജുകൾ റാങ്ക് ചെയ്യുന്ന രീതി പ്രധാന രഹസ്യമാണ് - ഇത് അവരുടെ IP (Intellectual Property ) ആണ് . റാങ്ക് നിർണ്ണയിക്കുന്നതിന് നൂറു കണക്കിന് ഘടകങ്ങൾ ആണ് പരിഗണിക്കപ്പെടുന്നത് . പേജിലെ വാക്കുകൾ, അതിലേക്ക് ലിങ്കുചെയ്യുന്ന മറ്റ് വെബ്സൈറ്റുകളുടെ എണ്ണം, പുതുമ എന്നിവ ഉൾപ്പെടെ പരിഗണിച്ചാണ് റാങ്ക് നിർണ്ണയിക്കുന്നത് .
റാങ്ക് നിർണ്ണയിക്കാൻ അവർ ഏത് സൂത്രവാക്യം ഉപയോഗിച്ചാലും, ലക്ഷ്യം മാറ്റമില്ലാതെ തുടരുന്നു: തിരയുന്നവരെ അവർ തിരയുന്നതുമായി ബന്ധിപ്പിക്കാൻ ശ്രമിക്കുക.
ഈ സെർച്ച് എങ്ങിനെ പ്രക്രിയ മനസിലാക്കുന്നത് നിങ്ങളുടെ ഗൂഗിൾ ആഡ്സ് ഏറ്റവും മികച്ചതാക്കാൻ സഹായിക്കും.
പ്രധാനമായും മൂന്ന് ജോലികൾ ആണ് സെർച്ച് എൻജിനുകൾ ചെയ്യുന്നത് :
# കീവേർഡുകൾക്കനുസരിച് എല്ലാ വെബ് പേജുകളുടെ ഉള്ളടക്കം പരിശോധിക്കുക (അതാണ് ക്രോളിംഗ് ).
# അവർ ഓരോ ഉള്ളടക്കത്തെയും തരംതിരിക്കുന്നു (ഇതിനെ ഇൻഡെക്സിംഗ് എന്ന് വിളിക്കുന്നു).
# മൂന്നാമതായി, ഏത് ഉള്ളടക്കമാണ് തിരയുന്നവർക്ക് ഏറ്റവും ഉപയോഗപ്രദമെന്ന് അവർ തീരുമാനിക്കുന്നു (അതിനെ റാങ്കിംഗ് എന്ന് വിളിക്കുന്നു).
ഇവ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് നമുക്ക് അടുത്തറിയാം. വെബ് പേജുകൾ, ഇമേജുകൾ, വീഡിയോകൾ എന്നിവ പോലുള്ള ഉള്ളടക്കം കണ്ടെത്താൻ ഗൂഗിൾ ഇന്റർനെറ്റിനെ “ക്രാൾ” ചെയ്യുന്നു. പേജുകളിലൂടെ കടന്നുപോകാൻ “ബോട്ടുകൾ” (റോബോട്ടിനായി ഹ്രസ്വമായത്), “ക്രാളറുകൾ” അല്ലെങ്കിൽ “Spider ” എന്ന് വിളിക്കുന്ന കമ്പ്യൂട്ടർ പ്രോഗ്രാമുകൾ ഉപയോഗിക്കുന്നു.
മറ്റ് പേജുകളിലേക്കുള്ള ലിങ്കുകൾ പിന്തുടർന്ന് ബോട്ടുകൾ പേജിൽ നിന്ന് പേജിലേക്ക് സഞ്ചരിക്കുന്നു . ഈ ബോട്ടുകൾ ഒരിക്കലും നിൽക്കുന്നില്ല ; റിസൾട്ട് പേജിൽ ഉൾപ്പെടുത്തുന്നതിനായി പുതിയ ലിങ്കുകളും പുതിയ ഉള്ളടക്കവും തിരയുക എന്നതാണ് അവരുടെ ഏക ലക്ഷ്യം. ഇൻഡെക്സിംഗ് പ്രക്രിയയുടെ രണ്ടാം ഭാഗമാണ്. ബോട്ടുകൾ കണ്ടെത്തിയ എല്ലാ വെബ് പേജുകളുടെയും ഉള്ളടക്കത്തിന്റെയും ഭീമാകാരമായ പട്ടിക ഓർഗനൈസ് ചെയ്യുന്ന ഘട്ടമാണിത് . സെർച്ച് റിസൾട്ട് പേജുകളിൽ പ്രദർശിപ്പിച്ചിരിക്കുന്ന വിവരങ്ങളുടെ ഉറവിടമായി ഗൂഗിൾ ഈ സൂചിക ഉപയോഗിക്കുന്നു.
പക്ഷേ, ബോട്ടുകൾ കണ്ടെത്തുന്നതെല്ലാം ഇൻഡക്സ് ലിസ്റ്റിൽ ഉൾപ്പെടുന്നില്ല .
ഉദാഹരണത്തിന്, വ്യത്യസ്ത വെബ്സൈറ്റുകളിൽ സ്ഥിതിചെയ്യുന്ന കൃത്യമായ ഒരേ ഉള്ളടക്കത്തിന്റെ ഒന്നിലധികം പകർപ്പുകൾ തിരയൽ ഗൂഗിൾ ബോട്സ് കണ്ടെത്തിയേക്കാം.
ഇങ്ങനെ ഒരേ കണ്ടെന്റ് ധാരാളം വെബ്സൈറ്റുകളിൽ കണ്ടെത്തിയാൽ , ഒറിജിനൽ കണ്ടെന്റ് ഉള്ള വെബ് പേജ് ആണ് ഇൻഡക്സ് ചെയ്യപ്പെടുക.
അതിനാൽ, നിങ്ങളുടെ വെബ്സൈറ്റിൽ നിങ്ങളുടെ സ്വന്തം വിവരണം എഴുതുന്നതാണ് നല്ലത്.
മനസിലാവുന്നുണ്ടോ ? ക്രാളിംഗും ഇൻഡെക്സിംഗും കഴിഞ്ഞാൽ അടുത്തത് റാങ്കിങ്ങ് ആണ് . നിങ്ങൾ ഗൂഗിളിൽ സെർച്ച് ടൈപ്പുചെയ്യുമ്പോൾ, പൊരുത്തപ്പെടുന്ന ഫലങ്ങൾക്കായി എഞ്ചിൻ നിങ്ങൾ ഉപയോഗിക്കുന്ന പദങ്ങളും വേർഡുകളും ഉപയോഗിച്ചു കണ്ടെത്തിയ ഭീമാകാരമായ പട്ടിക ഇൻഡക്സ് ചെയ്യുന്നു. ഉദാഹരണത്തിന്, ഗൂഗിൾ 230 ദശലക്ഷം പൊരുത്തപ്പെടുന്ന ഫലങ്ങൾ കണ്ടെത്തുന്നു. ഇപ്പോൾ ഗൂഗിളിന്റെ ചുമതലയുടെ അവസാന ഭാഗത്തിനുള്ള സമയമാണ് : റാങ്കിംഗ്.
സെർച്ച് എഞ്ചിനുകൾ പേജുകൾ റാങ്ക് ചെയ്യുന്ന രീതി പ്രധാന രഹസ്യമാണ് - ഇത് അവരുടെ IP (Intellectual Property ) ആണ് . റാങ്ക് നിർണ്ണയിക്കുന്നതിന് നൂറു കണക്കിന് ഘടകങ്ങൾ ആണ് പരിഗണിക്കപ്പെടുന്നത് . പേജിലെ വാക്കുകൾ, അതിലേക്ക് ലിങ്കുചെയ്യുന്ന മറ്റ് വെബ്സൈറ്റുകളുടെ എണ്ണം, പുതുമ എന്നിവ ഉൾപ്പെടെ പരിഗണിച്ചാണ് റാങ്ക് നിർണ്ണയിക്കുന്നത് .
റാങ്ക് നിർണ്ണയിക്കാൻ അവർ ഏത് സൂത്രവാക്യം ഉപയോഗിച്ചാലും, ലക്ഷ്യം മാറ്റമില്ലാതെ തുടരുന്നു: തിരയുന്നവരെ അവർ തിരയുന്നതുമായി ബന്ധിപ്പിക്കാൻ ശ്രമിക്കുക.
ഈ സെർച്ച് എങ്ങിനെ പ്രക്രിയ മനസിലാക്കുന്നത് നിങ്ങളുടെ ഗൂഗിൾ ആഡ്സ് ഏറ്റവും മികച്ചതാക്കാൻ സഹായിക്കും.