الگوریتم رادین چیست؟ | اهمیت تگ کانونیکال در سئو و جلوگیری از محتوای تکراری


مقدمه: الگوریتم رادین چیست؟

آیا می‌دانستید که یک صفحه واحد در سایت شما ممکن است با چندین آدرس مختلف قابل دسترسی باشد؟ مثلاً:

  • https://site.com/product

  • https://site.com/product?ref=email

  • https://site.com/product?session=123

  • https://site.com/product/

گوگل اینها را صفحات جداگانه می‌بیند و ممکن است اعتبار صفحه شما را بین چندین نسخه تقسیم کند. الگوریتم رادین (Raadin) در کراولر پیشرفته P2X دقیقاً به همین موضوع می‌پردازد: آیا سایت شما دارای تگ کانونیکال (Canonical Tag) صحیح است یا خیر؟

الگوریتم رادین از الگوریتم‌های مهم سیستم P2X محسوب می‌شود. این الگوریتم بررسی می‌کند که آیا تگ کانونیکال در صفحات وجود دارد، آیا به صفحه صحیح اشاره می‌کند و آیا خودارجاع (self-referential) است یا خیر.

اما تگ کانونیکال چیست و چرا اینقدر مهم است؟ در ادامه، همه چیز را بررسی خواهیم کرد.


تگ کانونیکال (Canonical Tag) چیست؟

تگ کانونیکال یک تگ HTML است که در بخش <head> صفحه قرار می‌گیرد و به گوگل می‌گوید کدام نسخه از یک صفحه، نسخه اصلی و معتبر است.

نمونه کد تگ کانونیکال:

html
<head>
    <link rel="canonical" href="https://site.com/product">
</head>

معنی: "نسخه اصلی این صفحه، آدرس https://site.com/product است."


دسته‌بندی صفحات بر اساس وضعیت تگ کانونیکال

 
 
دسته وضعیت توضیح
کانونیکال کامل تگ وجود دارد + صحیح + خودارجاع ✅ عالی
کانونیکال صحیح تگ وجود دارد + به صفحه دیگر اشاره می‌کند ✅ خوب
کانونیکال خودارجاع تگ وجود دارد + به خود صفحه اشاره دارد ✅ خوب
بدون کانونیکال تگ وجود ندارد ❌ ضعیف
کانونیکال اشتباه تگ وجود دارد اما آدرس اشتباه (404 یا ریدایرکت) ❌ بسیار ضعیف
کانونیکال زنجیره‌ای صفحه A به B کانونیکال دارد، B به C ❌ ضعیف

نحوه عملکرد الگوریتم رادین در P2X

الگوریتم رادین به صورت دقیق طراحی شده است. مراحل اجرای این الگوریتم در کراولر P2X به این صورت است:

 
 
مرحله توضیح
۱. بررسی صفحه الگوریتم تگ <link rel="canonical"> را در بخش head صفحه جستجو می‌کند
۲. استخراج آدرس الگوریتم آدرس (href) داخل تگ را استخراج می‌کند
۳. اعتبارسنجی آدرس الگوریتم بررسی می‌کند آیا آدرس معتبر است (بدون خطا)
۴. بررسی زنجیره الگوریتم بررسی می‌کند آیا زنجیره کانونیکال وجود دارد
۵. امتیازدهی بر اساس وضعیت تگ کانونیکال، امتیاز تعلق می‌گیرد

نکته مهم: الگوریتم رادین فقط وجود تگ را بررسی نمی‌کند. همچنین صحت آدرس، نبود زنجیره و خودارجاع بودن (در صورت نیاز) را نیز ارزیابی می‌کند.


چرا تگ کانونیکال برای سئو مهم است؟

تگ کانونیکال از چند جهت برای سئو حائز اهمیت است:

 
 
دلیل اهمیت توضیح
جلوگیری از جریمه محتوای تکراری گوگل صفحات تکراری را جریمه می‌کند، کانونیکال به رفع این مشکل کمک می‌کند
هدایت PageRank به صفحه اصلی اعتبار لینک‌های نسخه‌های مختلف به یک صفحه اصلی منتقل می‌شود
بهینه‌سازی بودجه خزش گوگل زمان کمتری را برای خزش صفحات تکراری تلف می‌کند
کنترل نسخه صحیح در ایندکس شما تعیین می‌کنید کدام نسخه در نتایج جستجو نمایش داده شود
مدیریت پارامترهای URL صفحات با پارامترهای tracking (مانند ?ref=email) را به نسخه اصلی هدایت کنید

منابع محتوای تکراری (Duplicate Content)

تگ کانونیکال در چه شرایطی ضروری است؟

 
 
منبع تکراری مثال راهکار
پارامترهای URL ?ref=email?session=123?page=2 کانونیکال به نسخه بدون پارامتر
نسخه‌های HTTP/HTTPS http:// و https:// ریدایرکت 301 + کانونیکال
نسخه‌های www و non-www www.site.com و site.com ریدایرکت 301 + کانونیکال
نسخه‌های چاپی print.html کانونیکال به نسخه اصلی
محصولات مشابه دو محصول بسیار شبیه کانونیکال به صفحه اصلی

معادل Google برای الگوریتم رادین

الگوریتم رادین در P2X معادل فاکتور "Canonical URL tag" در الگوریتم‌های گوگل است. گوگل در مستندات رسمی خود اعلام کرده است:

"A canonical URL tells Google which version of a URL you want to appear in search results. This helps prevent problems caused by duplicate content."

منابع معتبر گوگل برای مطالعه بیشتر:


خودارجاع (Self-Referential) یعنی چه؟

خودارجاع یعنی تگ کانونیکال به خود صفحه اشاره کند.

مثال خودارجاع:
صفحه آدرس: https://site.com/product
تگ کانونیکال: <link rel="canonical" href="https://site.com/product">

نکته مهم: گوگل توصیه می‌کند همه صفحات حتی صفحه اصلی نیز تگ کانونیکال خودارجاع داشته باشند. این کار به گوگل تأیید می‌کند که "این صفحه نسخه اصلی است".


تفاوت 301 ریدایرکت و تگ کانونیکال

 
 
روش عملکرد سطح انتقال PageRank
301 ریدایرکت کاربر و خزنده را به صفحه جدید هدایت می‌کند سرور کامل
تگ کانونیکال فقط به گوگل می‌گوید کدام نسخه اصلی است صفحه تقریباً کامل

نکته: اگر هر دو روش را دارید، 301 قوی‌تر است. اما گاهی نمی‌توانید ریدایرکت کنید (مثلاً صفحات با پارامترهای tracking)، در این موارد کانونیکال راه حل مناسبی است.


راهکارهای بهینه‌سازی برای کسب امتیاز عالی از الگوریتم رادین

برای اینکه از الگوریتم رادین بهترین امتیاز را دریافت کنید، این راهکارها را رعایت کنید:

۱. به همه صفحات تگ کانونیکال اضافه کنید

حتی صفحه اصلی و صفحاتی که نسخه دیگری ندارند، باید تگ کانونیکال خودارجاع داشته باشند.

html
<head>
    <link rel="canonical" href="https://site.com/current-page-url">
</head>

۲. از آدرس مطلق (Absolute URL) استفاده کنید

صحیح: https://site.com/product

نادرست: /product (آدرس نسبی)


۳. تگ کانونیکال را به نسخه صحیح (ترجیحاً HTTPS + بدون www) اشاره دهید

آدرس استاندارد را انتخاب کنید و همه کانونیکال‌ها را به آن اشاره دهید.

مثال: https://site.com/product (HTTPS، non-www)


۴. از زنجیره کانونیکال خودداری کنید

اشتباه: صفحه A -> کانونیکال به B -> کانونیکال به C

صحیح: صفحه A و B -> کانونیکال به C


۵. تگ کانونیکال را در بخش <head> قرار دهید

نه در <body>.


۶. از کانونیکال برای صفحات pagination استفاده کنید

برای صفحات دسته‌بندی با چند صفحه:

  • صفحه 1: کانونیکال به خودش (self-referential)

  • صفحه 2، 3، ...: کانونیکال به صفحه 1

  • یا از rel="prev" و rel="next" استفاده کنید


اشتباهات رایج در الگوریتم رادین

 
 
اشتباه توضیح راهکار
بدون تگ کانونیکال تگ وجود ندارد به همه صفحات اضافه کنید
کانونیکال به صفحه 404 آدرس مقصد وجود ندارد به صفحه معتبر اشاره کنید
زنجیره کانونیکال A->B و B->C مستقیم به صفحه اصلی اشاره کنید
آدرس نسبی href="/product" از آدرس مطلق استفاده کنید
کانونیکال در body تگ در جای اشتباه به head منتقل کنید

مثال تگ کانونیکال برای سناریوهای مختلف

صفحه اصلی (self-referential):

html
<head>
    <link rel="canonical" href="https://site.com/">
</head>

صفحه محصول با پارامتر tracking:

html
<!-- آدرس صفحه: https://site.com/product?ref=email -->
<head>
    <link rel="canonical" href="https://site.com/product">
</head>

نسخه HTTP به HTTPS:

html
<!-- آدرس صفحه: http://site.com/product -->
<head>
    <link rel="canonical" href="https://site.com/product">
</head>

صفحه چاپی:

html
<!-- آدرس صفحه: https://site.com/product/print -->
<head>
    <link rel="canonical" href="https://site.com/product">
</head>

تأثیر الگوریتم رادین بر سئو و رتبه گوگل

 
 
فاکتور تأثیر
کانونیکال صحیح و خودارجاع جلوگیری از جریمه محتوای تکراری - هدایت اعتبار
بدون کانونیکال تقسیم PageRank بین نسخه‌های مختلف - افت رتبه
کانونیکال اشتباه هدایت اعتبار به صفحه نامناسب - از دست رفتن رتبه

جمع‌بندی نهایی

الگوریتم رادین (Raadin) در کراولر P2X، یکی از الگوریتم‌های مهم است که وجود و صحت تگ کانونیکال را بررسی می‌کند.

سه نکته کلیدی که باید همیشه به خاطر داشته باشید:

  1. به همه صفحات تگ کانونیکال خودارجاع اضافه کنید - حتی صفحاتی که نسخه دیگری ندارند، تگ کانونیکال داشته باشند تا به گوگل تأیید کنید "این نسخه اصلی است".

  2. از آدرس مطلق (Absolute URL) استفاده کنید و از زنجیره کانونیکال خودداری کنید - همه کانونیکال‌ها باید مستقیماً به صفحه اصلی اشاره کنند، نه به صفحه دیگری که خودش کانونیکال دارد.

  3. برای صفحات با پارامترهای tracking (مثل ?ref=email)، کانونیکال را به نسخه بدون پارامتر اشاره دهید - این کار اعتبار را به صفحه اصلی هدایت می‌کند و از تقسیم PageRank جلوگیری می‌نماید.

با رعایت این اصول، می‌توانید از الگوریتم رادین امتیاز عالی دریافت کنید و از جریمه محتوای تکراری در امان بمانید.