الگوریتم آرش چیست؟ | اهمیت فایل XML Sitemap در سئو


مقدمه: الگوریتم آرش چیست؟

آیا می‌دانستید که می‌توانید به گوگل بگویید چه صفحاتی از سایت شما مهم‌تر هستند و کدام صفحات را سریع‌تر ایندکس کند؟ این کار با فایل XML Sitemap انجام می‌شود. الگوریتم آرش (Aarsh) در کراولر پیشرفته P2X دقیقاً به همین موضوع می‌پردازد: آیا سایت شما دارای فایل XML Sitemap است یا خیر؟

الگوریتم آرش از الگوریتم‌های مثبت سیستم P2X محسوب می‌شود. این الگوریتم بررسی می‌کند که آیا فایل Sitemap در سایت وجود دارد، آیا آدرس آن در robots.txt ذکر شده است و آیا ساختار آن استاندارد است یا خیر.

اما Sitemap چیست و چرا اینقدر مهم است؟ در ادامه، همه چیز را بررسی خواهیم کرد.


XML Sitemap چیست و چه شکلی است؟

فایل XML Sitemap فایلی است که لیست تمام صفحات مهم سایت را در قالبی استاندارد به موتورهای جستجو معرفی می‌کند.

نمونه یک فایل Sitemap ساده:

xml
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>https://site.com/</loc>
        <lastmod>2024-05-24</lastmod>
        <changefreq>daily</changefreq>
        <priority>1.0</priority>
    </url>
    <url>
        <loc>https://site.com/about/</loc>
        <lastmod>2024-05-20</lastmod>
        <changefreq>monthly</changefreq>
        <priority>0.8</priority>
    </url>
</urlset>

اجزای هر URL در Sitemap:

 
 
تگ توضیح ضرورت
<loc> آدرس کامل صفحه الزامی
<lastmod> تاریخ آخرین بروزرسانی اختیاری
<changefreq> میزان تغییرات (daily, weekly, monthly, yearly, never) اختیاری
<priority> اولویت نسبی (0.0 تا 1.0) اختیاری

دسته‌بندی سایت‌ها بر اساس وضعیت Sitemap

 
 
دسته وضعیت توضیح
Sitemap کامل Sitemap + ذکر در robots.txt + ثبت در Search Console ✅ عالی
Sitemap ساده فقط Sitemap وجود دارد ✅ خوب
Sitemap با خطا Sitemap وجود دارد اما ساختار آن مشکل دارد ⚠️ متوسط
Sitemap قدیمی Sitemap وجود دارد اما به روز نیست ⚠️ متوسط
بدون Sitemap هیچ فایل Sitemap وجود ندارد ❌ ضعیف

نحوه عملکرد الگوریتم آرش در P2X

الگوریتم آرش به صورت دقیق طراحی شده است. مراحل اجرای این الگوریتم در کراولر P2X به این صورت است:

 
 
مرحله توضیح
۱. بررسی robots.txt الگوریتم آدرس Sitemap را در robots.txt جستجو می‌کند
۲. بررسی آدرس‌های رایج الگوریتم آدرس‌های رایج Sitemap را چک می‌کد (/sitemap.xml)
۳. اعتبارسنجی الگوریتم ساختار و فرمت XML فایل را بررسی می‌کند
۴. بررسی محتوا الگوریتم تعداد و کیفیت URLهای داخل Sitemap را بررسی می‌کند
۵. امتیازدهی بر اساس وضعیت Sitemap، امتیاز تعلق می‌گیرد

نکته مهم: الگوریتم آرش فقط وجود فایل Sitemap را بررسی نمی‌کند. همچنین صحت ساختار، به‌روز بودن و ارتباط آن با robots.txt را نیز ارزیابی می‌کند.


انواع مختلف Sitemap

 
 
نوع Sitemap توضیح مثال
XML Sitemap (عادی) برای صفحات معمولی sitemap.xml
XML Sitemap (تصاویر) برای تصاویر sitemap-image.xml
XML Sitemap (ویدیوها) برای ویدیوها sitemap-video.xml
Sitemap Index برای سایت‌های خیلی بزرگ (فهرست چند Sitemap) sitemap-index.xml
HTML Sitemap برای کاربران (نه برای گوگل) sitemap.html

چرا Sitemap برای سئو مهم است؟

Sitemap از چند جهت برای سئو و ایندکس شدن صفحات حائز اهمیت است:

 
 
دلیل اهمیت توضیح
کشف صفحات جدید گوگل صفحات جدید را سریع‌تر پیدا می‌کند
پوشش صفحات عمیق صفحاتی که لینک داخلی قوی ندارند، توسط Sitemap پیدا می‌شوند
اولویت‌بندی خزش با priority می‌توانید بگویید کدام صفحات مهم‌تر هستند
نشان دادن تاریخ بروزرسانی با lastmod به گوگل می‌گویید محتوا کی بروز شده است
کمک به سایت‌های بزرگ برای سایت‌های با بیش از ۵۰۰ صفحه، Sitemap ضروری است

معادل Google برای الگوریتم آرش

الگوریتم آرش در P2X معادل فاکتور "XML Sitemap" در الگوریتم‌های گوگل است. گوگل در مستندات رسمی خود اعلام کرده است:

"A sitemap helps search engines discover pages on your site that they might not otherwise find, especially for new websites, large websites, or websites with pages that are not well-linked."

منابع معتبر گوگل برای مطالعه بیشتر:


تفاوت Sitemap در سایت‌های بزرگ و کوچک

 
 
معیار سایت کوچک (کمتر از ۵۰۰ صفحه) سایت بزرگ (بیش از ۵۰۰ صفحه)
نیاز به Sitemap کم (مفید است ولی ضروری نیست) بالا (ضروری است)
نوع Sitemap یک فایل چند فایل + Sitemap Index
بروزرسانی ماهی یک بار هفته ای یک بار
اولویت (priority) مهم خیلی مهم

راهکارهای بهینه‌سازی برای کسب امتیاز عالی از الگوریتم آرش

برای اینکه از الگوریتم آرش بهترین امتیاز را دریافت کنید، این راهکارها را رعایت کنید:

۱. فایل XML Sitemap ایجاد کنید

ساده‌ترین روش: استفاده از پلاگین‌های SEO (مانند Yoast SEO یا Rank Math در وردپرس) یا ابزارهای آنلاین ساخت Sitemap.

آدرس استاندارد Sitemap: https://site.com/sitemap.xml


۲. آدرس Sitemap را در robots.txt ذکر کنید

txt
User-agent: *
Allow: /

Sitemap: https://site.com/sitemap.xml

۳. Sitemap را در Google Search Console ثبت کنید

  1. وارد Google Search Console شوید

  2. به بخش Sitemaps بروید

  3. آدرس Sitemap را وارد کنید و دکمه Submit را بزنید


۴. فقط صفحات مهم و Indexable را در Sitemap قرار دهید

صفحات زیر را نداخل Sitemap قرار دهید:

  • صفحات noindex

  • صفحات خطا (404، 500)

  • صفحات تکراری

  • صفحات ریدایرکت


۵. Sitemap را به‌روز نگه دارید

هر بار که صفحه جدید اضافه می‌کنید یا صفحه قدیمی بروز می‌شود، Sitemap را به‌روز کنید.


۶. از Sitemap Index برای سایت‌های بزرگ استفاده کنید

اگر بیش از ۵۰۰۰۰ صفحه یا بیش از ۵۰ مگابایت Sitemap دارید، از Sitemap Index استفاده کنید.

xml
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <sitemap>
        <loc>https://site.com/sitemap-pages.xml</loc>
        <lastmod>2024-05-24</lastmod>
    </sitemap>
    <sitemap>
        <loc>https://site.com/sitemap-posts.xml</loc>
        <lastmod>2024-05-24</lastmod>
    </sitemap>
</sitemapindex>

اشتباهات رایج در الگوریتم آرش

 
 
اشتباه توضیح راهکار
بدون Sitemap هیچ فایل Sitemap وجود ندارد Sitemap ایجاد کنید
Sitemap در robots.txt نیست Sitemap وجود دارد ولی معرفی نشده آدرس را به robots.txt اضافه کنید
Sitemap ثبت نشده در Search Console گوگل از آن خبر ندارد در Search Console ثبت کنید
Sitemap شامل صفحات noindex صفحاتی که نباید ایندکس شوند داخل Sitemap هستند صفحات noindex را حذف کنید
Sitemap قدیمی صفحات جدید در Sitemap نیستند بروزرسانی کنید

تأثیر الگوریتم آرش بر سئو و رتبه گوگل

 
 
فاکتور تأثیر
داشتن Sitemap استاندارد کشف سریع‌تر صفحات جدید - ایندکس بهتر
بدون Sitemap (سایت بزرگ) ممکن است برخی صفحات ایندکس نشوند
Sitemap حاوی صفحات noindex هدر دادن بودجه خزش گوگل

جمع‌بندی نهایی

الگوریتم آرش (Aarsh) در کراولر P2X، یکی از الگوریتم‌های مثبت است که وجود فایل XML Sitemap را بررسی می‌کند.

سه نکته کلیدی که باید همیشه به خاطر داشته باشید:

  1. حتماً فایل XML Sitemap ایجاد کنید و آدرس آن را در robots.txt ذکر کنید - این کار به گوگل کمک می‌کند صفحات شما را سریع‌تر پیدا کند.

  2. Sitemap را در Google Search Console ثبت کنید - ثبت در Search Console به گوگل می‌گوید "بیا و این صفحات را بخز".

  3. فقط صفحات مهم و indexable را در Sitemap قرار دهید - صفحات noindex را داخل Sitemap قرار ندهید، این کار بودجه خزش گوگل را هدر می‌دهد.

با رعایت این اصول، می‌توانید از الگوریتم آرش امتیاز عالی دریافت کنید و ایندکس صفحات سایت خود را بهبود بخشید.