What-is-sitemap-and-Crawling-Errors

What is sitemap and Crawling Errors

What is sitemap and Crawling Errors #part3

সাইটম্যাপ হচ্ছে এমন একটি ফাইল যেখানে আপনার ওয়েবসাইটের সব URL গুলো একটি লিস্ট আকারে থাকে।

যাতে করে সার্চ ইঞ্জিন বট সহজে খুঁজে পেয়ে ক্রল এবং ইনডেক্স করতে পারে। গুগলের কাছে আপনার ওয়েবসাইটকে ক্রল এবং ইনডেক্সের জন্য সবচেয়ে সহজ উপায় হচ্ছে সাইটম্যাপ ।

যেখানে আপনার ওয়েবসাইটের যেসব পেজ ইনডেক্স করাতে চান তার একটি ফাইল তৈরি করা যা অবশ্যই গুগলের স্ট্যান্ডার্ড ফলো করবে।

সাইটম্যাপ তৈরি করার পর তা Google Search Console এ সাবমিট করতে হবে। সাইটম্যাপ সাবমিট করা কোনো ভালো নেভিগেশনের বিকল্প নয়।

এটি অবশ্যই ক্রলারকে আপনার সব গুরুত্বপূর্ণ পেজগুলোর সুনির্দিষ্ট একটি পথ অনুসরণ করতে সহায়তা করে।

যদি আপনার ওয়েবসাইটের কোনো লিঙ্ক অন্য কোনো ওয়েবসাইটে না-ও থাকে। তথাপি আপনার ওয়েবসাইটটি ইনডেক্স করানো সম্ভব XML sitemap-কে Google Search Console-এ সাবমিট করার মাধ্যমে।

XML-Sitemap
XML-Sitemap

Are crawlers getting errors when they try to access your URL?

ক্রল করার সময় সার্চ ইঞ্জিন বট বিভিন্ন ধরনের সমস্যার সম্মুখীন হতে পারে।

ক্রল রিলেটেড সমস্যাগুলো আপনি Google Search Console-এ গিয়ে ‘Crawl Errors রিপোর্ট চেক করে তা জানতে পারবেন।

রিপোর্টটিতে আপনি প্রধানত server errors এবং not found errors দেখতে পারবেন।

আপনাকে সমস্যাগুলো ঠিক করার আগে অবশ্যই জানতে হবে তা কেন এবং কীভাবে তা সমাধান করা যায়।

4xx কোড Crawling Errors

যখন সার্চ ইঞ্জিন ক্রলার আপনার ওয়েবসাইটের কন্টেন্ট অ্যাকসেস করতে পারে না, আপনার ওয়েবসাইটের ইন্টারনাল কোনো সমস্যার কারণে তখন তাকে 4xx errors বলে।

404 Page not found এর একটা নমুনা দেখানো হয়েছে :

4xx-কোড-Crawling-Errors
4xx-কোড-Crawling-Errors

4xx errors-কে ওয়েবসাইটের নিজস্ব সমস্যা বলা হয়। যার অর্থ হলো URL-এ যদি কোন খারাপ সিনট্যাক্স বা তা যদি সার্চ ইঞ্জিন গাইডলাইন ফলো না করে।

সবচেয়ে জনপ্রিয় 4xx errors হলো – 404 Page not found। এটা হতে পারে URL টাইপে, কোন পেজ ডিলেট করা, ব্রোকেন রিডাইরেক্ট ইত্যাদি।

CPA Marketing Full Course Join Now

যখন সার্চ ইঞ্জিন 404 পেজে হিট করে। তখন আর সে পেজে অ্যাকসেস করতে পারে না। আর যখন ইউজার হিট করে তখন সে হতাশ হয় এবং পেজটি ত্যাগ করে ।

5xx কোড Crawling Errors

যখন সার্চ ইঞ্জিন ক্রলার আপনার ওয়েবসাইটের কন্টেন্ট অ্যাকসেস করতে পারে না, সার্ভারের কোনো সমস্যার কারণে তখন তাকে 5xx errors বলে।

5xx-কোড-Crawling-Errors
5xx-কোড-Crawling-Errors

5xx errors কে সার্ভারের সমস্যা হিসেবে চিহ্নিত করা হয় ।

যার অর্থ হলো যখন কোনো ইউজার বা সার্চ ইঞ্জিন ক্রলার কোনো কন্টেন্ট পেজের অ্যাকসেস করতে না পারে।

Google Search Console এ Crawl Error রিপোর্টে 5xx error- এর জন্য আলাদা অপশন রয়েছে।

এটা সাধারণত হয়ে থাকে যখন কোনো রিকোয়েস্ট টাইম আউট হয়ে যায় এবং গুগলবট সে পেজ ত্যাগ করে।

কিন্তু এখানে একটি পদ্ধতি রয়েছে।

যার মাধ্যমে ইউজার এবং সার্চ ইঞ্জিন ক্রলারকে এ ধরনের সমস্যাসংবলিত পেজ থেকে আপনি সুনির্দিষ্ট ভালো একটি পেজে নিয়ে যেতে পারবেন।

যাকে 301 বা পার্মানেন্ট রিডাইরেক্ট বলা হয়।

মনে করুন, আপনার example.com/women-clothing/ পেজটি 4xx বা 5xx errors।

এখন আপনি example.com/women-dress/ নতুন একটি পেজে নিয়ে যাওয়ার জন্য 301 বা পার্মানেন্ট রিডাইরেক্ট পদ্ধতিতে তাদের মধ্যে একটি সেতুবন্ধন তৈরি করলেন।

301 বা পার্মানেন্ট রিডাইরেক্ট করার কিছু নিয়ম নিম্নরূপ:

কখন 301 রিডাইরে করবেন:

  1. যখন পুরানো কোনো থেকে কোনো পেজে ইক্যুইটি ট্রান্সফার করা ।
  2. গুগলবটকে নতুন পে কলিং এবং ইনডেক্সিং করতে সাহায্য করা ।
  3. ইউজাররা যেসব পেজ সার্চ করছে সেগুলো তারা পাচ্ছে তা নিশ্চিত হোন ।

কখন 301 রিডাইরেক্ট করবেন না :

  1. 301 ছাড়া পুরানো পেজের রিডাইরেক্টশন নতুন নতুন পেজে কাজ করবে না।
  2. আপনার সাইটে 404 সাইটের সার্চ পারফরম্যান্সে কোনো প্রভাব ফেলবে না। কিন্তু ইনডেক্সিং না হওয়ার ফলে র‍্যাঙ্কিং থেকে আউট হয়ে যাবে এবং ইউজারদের ওপর বাজে প্রভাব ফেলবে। যার ফলে ইনডেক্সিং,র‍্যাঙ্কিং এবং ট্রাফিক হারিয়ে আপনি ক্ষতির সম্মুখীন হবেন।
  3. 4xx বা 5xx errors পেজগুলোতে যদি, ইউজাররা ক্লিক করে তবে তারা কিছুই পাবে না এবং হতাশ হবে পেজটি ত্যাগ করবে ।

301 কোড দিয়ে কোনো পেজকে পার্মানেন্ট রিডাইরেক্ট করা হয়, তাই অবশ্যই প্রাসঙ্গিক কোনো পেজে রিডাইরেক্ট করবেন। যদি কোনো অপ্রাসঙ্গিক পেজে রিডাইরেক্ট করেন তবে ইউজার তাঁর কাঙ্ক্ষিত রেজাল্ট পাবে না এবং সার্চ ইঞ্জিন তখন তাকে অপ্রাসঙ্গিক মনে করবে।

যদি পুরোনো পেজটি ইতিমধ্যে ব্র্যাঙ্ক পেয়ে থাকে আর আপনি পুরোনো পেজটিকে নতুন কোনো অপ্রাসঙ্গিক পেজে 301 রিডাইরেক্ট করেন তবে সে পেজটি অর্থাৎ নতুন পেজটি র‍্যাঙ্ক হারাবে।

তাই 301 রিডাইরেক্ট করার আগে চিন্তা করে কাজ করুন।

কোনো পেজকে যদি সাময়িক সময়ের জন্য রিডাইরেক্ট করার প্রয়োজন হয় তবে আপনি 302 কোড দিয়ে রিডাইরেক্ট করতে পারেন।

যা দিয়ে আপনি অল্প সময়ের জন্য র‍্যাঙ্কিং এবং ব্যাকলিঙ্ক উভয়ই বাঁচাতে পারবেন । মনে রাখবেন যে এই পদ্ধতি শুধু সাময়িক সময়ের জন্য পার্মানেন্ট না।

Join our others social media

Next – How does a search engine store data? –Read More

Leave a Reply

Shopping cart

0
image/svg+xml

No products in the cart.

Continue Shopping