How-Search-Engines-Works

How Search Engines Works #Part2

How Search Engines Works – সার্চ ইঞ্জিন কীভাবে কাজ করে?

ইতিমধ্যে আমরা জেনেছি যে সার্চ ইঞ্জিন হলো – ইন্টারনেটে ইউজারদের বিভিন্ন প্রশ্নের উত্তরদাতা মেশিন।

যা ইন্টারনেটে ছড়িয়ে থাকা সব কন্টেন্ট খোঁজা, সেগুলোকে বোঝা, রিলেভেন্ট অনুসারে সাজানো ।

যখন কোন ইউজার সার্চ করে তখন ইউজারের সার্চ অনুযায়ী তা সার্চ রেজাল্ট হিসেবে দেখিয়ে দেয়।

আর এ নিয়ম অনুসারে আপনার কন্টেন্টকে সার্চ ইঞ্জিনের রেজাল্ট পেজের প্রথম পেজে থাকতে হবে। আর এটা নিশ্চিত করার জন্য SEO বিকল্প নেই । আপনার কন্টেন্ট যদি সার্চ ইঞ্জিন খুঁজে না পায় তবে তা SERPs-এ দেখানোর কোনো সম্ভাবনা নেই

কীভাবে Search Engines কাজ করে?

সার্চ ইঞ্জিনের প্রধানত তিনটি কাজ হলো :

১. ক্রলিং: ইন্টারনেটের সব কন্টেন্ট এবং কোড ইউআরএলসহ খুঁজে বের করা।

২. ইনডেক্সিং: ক্রলিং প্রসেসের পর তা সুনির্দিষ্ট নিয়ম অনুসারে সেগুলো স্টোরেজ এবং অর্গানাইজড করা।

একবার ইনডেক্স করা তথ্য পরে ইউজারের সার্চ এবং রিলেভেন্সি অনুযায়ী সার্চ রেজাল্টে দেখাবে।

৩. র‍্যাঙ্কিং: ইউজারের সার্চ অনুযায়ী ইনডেক্সিং করা কন্টেন্ট থেকে সর্বোত্তম কন্টেন্টটি দেখানো, যা কি না সার্চের সাথে রিলেভেন্স ও সঠিক।

What is search engine crawling?

Search-Engine-Crawling
Search-Engine-Crawling

সার্চ ইঞ্জিনের একটি প্রসেস, যার মাধ্যমে সার্চ ইঞ্জিন এক বা একাধিক বটের/রোবটের মাধ্যমে ইন্টারনেটের সব নতুন ও আপডেটেড কন্টেন্ট এবং কোড ইউআরএলসহ খুঁজে বের করে ।

কন্টেন্ট বিভিন্ন ধরনের হতে পারে। যেমন: ওয়েব পেজ, ইমেজ/অধ্যায় ছবি, ভিডিও, অডিও, পিডিএফ ইত্যাদি ।

কিন্তু মনে রাখতে হবে যে সব ইন্টারনেটের কন্টেন্ট লিঙ্কের মাধ্যমে খুঁজে পাওয়া যায়।

Kodular অ্যাপ ডেভেলপমেন্ট – ফ্রি কোর্স Join Now

গুগলবট ক্রলিং শুরু করে কিছু ওয়েব পেজ ফেচিংয়ের মাধ্যমে, তারপর ওই ওয়েব পেজের লিঙ্ক ধরে অন্যান্য পেজ ক্রলিং করে। এভাবে লিঙ্কের মাধ্যমে নতুন নতুন কন্টেন্ট খুঁজে পায় এবং তা ইনডেক্সে অ্যাড করে, যাকে ক্যাফিন বলা হয়।

যেখানে বিশাল একটি ডেটাবেসে ক্রলিং করা তথ্যগুলো জমা করে রাখা হয় এবং যখন কোনো ইউজার সার্চ করে তখন তাঁর সার্চ অনুযায়ী তথ্য মিলিয়ে দেখা হয় ।

What is a Search Engine index?

গুগলবট ক্রলিং প্রসেসের পর সার্চ ইঞ্জিন তা সুনির্দিষ্ট নিয়ম অনুসারে তথ্যগুলোকে একটি বিশাল ডেটাবেসে স্টোর এবং অর্গানাইজড করে থাকে।

পরে যখন কোনো ইউজার সার্চ করে, তখন সার্চ ইঞ্জিন সার্চ এবং রিলেভেন্সি অনুযায়ী ইউজারকে সার্চ রেজাল্টে সেটা দেখায়।

Search Engine Ranking

যখন একজন ইউজার সার্চ করে, সার্চ ইঞ্জিন তখন তার ইনডেক্সকৃত বিশাল ডেটাবেস থেকে ইউজারের সার্চ অনুযায়ী সবচেয়ে ভালো তথ্যটি যা কিনা সার্চের সঙ্গে মিলে তা দেখায়।

আর এভাবে সার্চ রেজাল্ট দেখানোর পদ্ধতিকে র‍্যাঙ্কিং বলা হয়।

Search-Engine-Ranking
Search-Engine-Ranking

যা সার্চ ইঞ্জিনের অ্যালগরিদম মেনে কাজ করে থাকে। আপনি সার্চ করার পর যে ওয়েবসাইটটি প্রথম দেখেন, তা ইউজারের সমস্যার সুনির্দিষ্ট সমাধান দিতে পারবে বলে সার্চ ইঞ্জিন বিশ্বাস করে।

আপনি চাইলে সার্চ ইঞ্জিনকে ব্লক বা ক্রলিং করা থেকে বিরত রাখতে পারবেন । ধরা যাক, আপনার ওয়েবসাইটের একটি সুনির্দিষ্ট পেজ বা পুরো ওয়েবসাইটটি যদি ক্রলিংয়ের জন্য প্রস্তুত না হয় বা সার্চ ইঞ্জিনের জন্য পুরোপুরি তৈরি না হয় তবে আপনি ক্রলিং বন্ধ করে রাখতে পারবেন। আপনি যখন মনে করবেন ক্রলিং এবং ইনডেক্সিংয়ের জন্য সাইটটি পুরোপুরি প্রস্তুত তখন আপনি সার্চ ইঞ্জিনকে এটার জন্য অনুরোধ করতে পারবেন ।

আপনাকে মনে রাখতে হবে, ইউজার এবং সার্চ ইঞ্জিনের জন্য ওয়েবসাইট তৈরি করতে হবে।

Can search engines find your pages?

আপনার সাইটটি SERPs-এ দেখানোর পূর্বশর্ত হলো সাইটটিকে অবশ্যই সার্চ ইঞ্জিন ক্রল ও ইনডেক্স করাতে হবে।

আপনার যদি নিজস্ব কোনো ওয়েবসাইট থাকে তবে চেক করে দেখুন যে কতগুলো পেজ ইনডেক্স হয়েছে।

তাতে আপনি জানতে পারবেন যে আপনার ওয়েবসাইটকে গুগল ক্রস ও ইনডেক্স করতে পারছে কিনা।

সাইটের ইনডেক্স চেক করার একটি পদ্ধতি হলো,

site: digitalmultistore.com

আপনি গুগলের সার্চ বারে site:digitalmultistore.com লিখে সার্চ করলে গুগল সুনির্দিষ্টভাবে আপনাকে সাইটের ইনডেক্সকৃত পেজের সংখ্যা এবং পেজগুলা দেখাবে।

সাইটের ইনডেক্সকৃত পেজের সংখ্যা এবং পেজগুলো সঠিকভাবে জানতে আপনাকে গুগল সার্চ কনসোলকে মনিটর করতে হবে।

তার জন্য আপনাকে গুগল সার্চ কনসোল-এ জিমেইল দিয়ে সাইনআপ করে একটি অ্যাকাউন্ট তৈরি করতে হবে।

CPA Marketing Full Course Join Now

যার মাধ্যমে আপনি সাইটের সাইটম্যাপকে গুগল সার্চ কনসোল-এ ইনডেক্স করার জন্য অনুরোধ করতে হবে এবং তারপর আপনি ইনডেক্স রিপোর্টের মাধ্যমে দেখতে পারবেন যে কোন কোন পেজ ইনডেক্স হচ্ছে, কোনগুলো হচ্ছে না বা কী কী সমস্যা রয়েছে ইত্যাদি।

আপনার সাইটটি যদি সার্চ ইঞ্জিনের কোথাও খুঁজে না পাওয়া যায়, তবে তার

কিছু সম্ভাব্য কারণ থাকতে পারে।

যথা :

• আপনার সাইটটি একেবারে নতুন এবং যা এখনো ক্রল হয়নি।

•সাইটের কোনো ব্যাকলিঙ্ক নেই।

• সাইটের মেনু / নেভিগেশন অনেক অগোছালো যার ফলে ইঞ্জিনবট ক্রল করার জন্য খুঁজে পাচ্ছে না।

• সাইটের মধ্যে কিছু কোড দেওয়া আছে যা সার্চ ইঞ্জিনবটকে ক্রল করতে বাধা দিচ্ছে।

•সাইটটি গুগল স্প্যাম সাইট হিসেবে পেনাল্টি দিয়েছে।

How Google bot treats robots.txt files

রোবটস ডট টিএক্সটি ফাইলটি ওয়েবসাইটের রুট ডিরেক্টরিতে থাকে ।

ex. digitalmultistore.com/robots.txt

যার মাধ্যমে সার্চ ইঞ্জিনকে নির্দেশ করা হয় যে সাইটের কোন কোন অংশ ইনডেক্স করা হবে এবং কোনগুলো নয়। এর পাশাপাশি কোন গতিতে সাইটটি ইনডেক্স হবে।

যদি GoogleBot কোনো সাইটের জন্য robots.txt ফাইল খুঁজে না পায়, তবে এটি কোনো নির্দেশ ছাড়াই সাইটটিকে ক্রল করা শুরু করে।

যদি গুগলবট কোনো সাইটের জন্য robots.txt ফাইল খুঁজে পায়। তবে এটি সাধারণত নির্দেশ মেনে চলবে এবং সাইটটিকে ক্রল করা শুরু করে।

কোন সাইটের robots.txt ফাইলটি অ্যাকসেস করার সময় কোনো ত্রুটির মুখোমুখি হয়।

তা নির্ধারণ করতে না পারে। তবে এটি সাইটটিকে ক্রল করবে না। সব মার্চ ইঞ্জিন robots.txt ফলো করে না।

যারা সাইবার অপরাধ করে। যেমন: ই-মেইল অ্যাড্রেস স্ক্র্যাপার। তারা বিভিন্ন বট তৈরি করে যা কোনো ধরনের প্রটোকল ফলো করে না। এমনকি কিছু সার্চ ইঞ্জিনও রয়েছে যারা (robots.txt) ফলো করে না।

কিছু পেজ আছে যেগুলোকে আপনি ব্লক করতে হবেই। যেমন লগ ইন, অ্যাডমিন পেজ যাতে করে তা ইনডেক্স না হয়।

এ ধরনের পেজগুলো যাতে সাইবার অপরাধীরা সহজে খুঁজে বের না করতে পারে তার জন্য (robots.txt) ফাইলে ব্লক করা হয়।

মেশিন লার্নিং এবং ডেটা সায়েন্স– বিস্তারিত পড়ুন।

Search Engines কি আপনার সাইটের নেভিগেশন অনুসরণ করতে পারে? (Can search engines follow your site navigation?)

সার্চ ইঞ্জিন বট যেহেতু এল করে, তাই এর কাজ হচ্ছে বিভিন্ন সাইট থেকে লিঙ্কের মাধ্যমে ওয়েবসাইটের কন্টেন্ট খুঁজে বের করা।

এর পাশাপাশি আপনার সাইটের অন্য পেজগুলো ক্রল করার জন্য অর্থাৎ, এক পেজ থেকে অন্য পেজে যাওয়ার জন্য ইন্টারনাল লিঙ্ক বা লিঙ্কের একটি সুনির্দিষ্ট রাস্তা বা পথ থাকতে হবে। যদি আপনার একটি পেজ ক্রল হয় এবং ওই পেজের সঙ্গে অন্য কোনো পেজের কোনো লিঙ্ক না থাকে তবে তা ক্রল না হওয়ার মতোই।

অনেক ওয়েবসাইট আছে যাদের নেভিগেশন সমস্যা থাকার কারণে সার্চ ইঞ্জিন বট ভালোভাবে ক্রল করতে পারে না এবং ইনডেক্সও হয় না। যার ফলে তারা আর সার্চ ইঞ্জিন রেজাল্ট পেজে আসতে পারে না।

কিছু সাধারণ নেভিগেশনগত ভুল যেগুলোর কারণে আপনার সাইট

• যেখানে মোবাইল নেভিগেশনের চেয়ে আপনার ডেস্কটপ নেভিগেশন ব্যতিক্রম দেখায়।

• যেকোনো ধরনের নেভিগেশন যেখানে মেনু HTML নয়, যেমন: JavaScript নির্ভর নেভিগেশন। যদিও গুগল এখন আগের চেয়ে ভালো JavaScript ক্রলিং করা এবং বুঝতে সক্ষম, কিন্তু এটি এখনও একটি নিখুঁত প্রক্রিয়া নয়। সবচেয়ে গুরুত্বপূর্ণ বিষয় হলো গুগল বটকে খুঁজে পেতে, বুঝতে এবং ক্রলিং করে ইনডেক্স করতে সাহায্য করা। যা HTML ব্যবহার করে সম্ভব।

•পার্সোনালাইজেশন, বা অন্য কোনো ইউনিক নেভিগেশন করে তা কিছু ব্যক্তিবিশেষের জন্য দেখানো, যা সার্চ ইঞ্জিন ক্রলারের কাছে ক্লোকিং বলে মনে হতে পারে।

• আপনার ওয়েবসাইটের নেভিগেশন থেকে কোনো গুরুত্বপূর্ণ পেজকে লিঙ্ক দিতে ভুলে যাওয়া, মনে রাখবেন, লিঙ্ক হচ্ছে নতুন পেজ খুঁজে পাওয়ার একটি পথ যা ক্রলার অনুসরণ করে।

আশা করি আপনি বুঝতে পেরেছেন যে, কী কী কারণে সুনির্দিষ্ট ও সুস্পষ্ট নেভিগেশন একটা সাইটের জন্য জরুরি।

Join our others social media

Next – What is sitemap and Crawling ErrorsRead More

Leave a Reply

Shopping cart

0
image/svg+xml

No products in the cart.

Continue Shopping