سایت مپ یا نقشه سایت چیست؟

سایت مپ یا نقشه سایت چیست؟

تا به حال فکر کرده اید که موتورهای جستجو چگونه سایت شما را مشاهده می کنند؟ اصلاً می دانید که موتور جستجو چگونه صفحات سایت شما را ارزش گذاری می کنند؟ در جواب تان باید بگوییم: سایت مپ.

اینترنت دنیایی بزرگ است و روز به روز با سرعت زیادی، رشد خود را ادامه می دهد. برپایه مطالعات انجام شده توسط سایت Netcraft در سال ۲۰۱۲، بیش از نیم میلیارد سایت در اینترنت وجود دارد (اگر دقیق تر بگوییم حدود ۶۴۴,۲۷۵,۷۵۴ سایت در فضای مجازی وجود دارد که البته همانطور که گفتیم این آمار مربوط به سال ۲۰۱۲ است) و مطمئناً این مقدار تا سال ۲۰۱۶ رشد چشمگیری داشته است.

حالاسوال اینجاست که صاحبان سایت های کوچک برای ایندکس شدن محتوای خود باید چه کاری انجام دهند؟ دانستن این نکته، بخش مهمی از روند بهینه سازی سایت شما محسوب می شود. در پاسخ باید گفت یکی از بهترین ابزارها برای تغذیه کردن موتورهای جستجو، سایت مپ یا همان نقشه سایت مبتنی بر XML است.

سایت مپ چیست؟
سایت مپ در واقع، فایلی است که لیستی از پر اعتبار ترین محتواهای موجود در سایت را در بر دارد تا کراولر های موتورهای جستجو بتوانند به راحتی سایت را ایندکس کنند. در مقابل این نوع Sitemap یک نوع نقشه سایت دیگر نیز وجود دارد (که با حروف کوچک نوشته می شود: sitemap) که مبتنی بر HTML است و در آن لیستی از پر اعتبار ترین فایل های موجود در سایت قرار دارد. این نوع نقشه سایت، بیشتر برای کاربران انسانی مورد استفاده قرار می گیرد تا بتوانند محتوای موجود در سایت را بیابند و از آن استفاده کنند.

موتورهای جستجو از نقشه سایت XML استفاده می کنند تا ساختار سایت ها را یاد بگیرند. باید به خاطر داشته باشید که قرار دادن URL صفحاتِ سایت در سایت مپ، حضور سایت در ایندکس های جستجو را تضمین می کند.

این موضوع به این معنی است که اگر نقشه سایتی از کدهای XML خوب استفاده کند، نشانی های معتبر و تمیزی را برای کارولرها فراهم کند و سایر نیازمندی های موتور های جستجوگر را برآورده سازد، URL های موجود در آن در Crawl های بعدی مورد توجه قرار خواهند گرفت. همین امر شانس دیده شدن صفحات متفاوت در موتورهای جستجوگر را رشد می دهد. اگرچه سایت مپ در هر شرایطی برای وب گاه سودمند خواهد بود، اما در شرایط زیر انبوه موثر و کارساز است:

داشتن یک سایت جدید با صفحات جدیدی که هنوز به خوبی به آنها لینک داده نشده است (لینک داخلی و خارجی).
سایت هایی که از URL های داینامیک برای محتوای خود استفاده می کنند.
سایت هایی که محتوای بایگانی شدۀ آنها به خوبی به صفحات فعال، لینک نشده اند.
سایت هایی که تشخیص و شناسایی صفحاتشان انبوه دشوار است یا دارای محتوای غیر متنی سنگین، مانند فلش هستند.
می توان گفت سایت مپ ها، در واقع ابزاری برای خوراک دادن و شناساندن سایت به موتورهای جستجوگر هستند.

ساختار نقشه سایت XML
همه موتورهای جستجوی پر اعتبار از پروتکل های XML رسمی که در سایت Sitemaps.org تعریف شده است، استفاده می کنند.

کدهای XML سایت مپ حاوی تگ های اختیاری و الزامی هستند. کدهای XML معتبر با تگ های شروع (بازشونده) “


هر آدرسی که در سایت مپ قرار می گیرد باید دارای دو تگ و یک تگ باشد. بقیه تگ ها اختیاری هستند.

فرمت فایل نقشه سایت و انواع آن
موتورهای جستجوی گوگل و بینگ، نوع XML را برای نقشه سایت به نام یک پروتکل پذیرفته اند. با این حال، آنها Feed نقشه سایت را که از پروتکل های RSS 2.0، Atom 1.0 و فایل های متنی ASCII استفاده می کنند را نیز می پذیرند. سایت مپ را می توان به فرم XML نیز مورد استفاده قرار داد یا در صورتی که حجم بالایی دارد با استفاده از ابزار Gzip، فشرده سازی کرد.

علاوه بر استانداردهای نقشه سایت برای محتوای وب، گوگل از نوع های خاصی برای سایت مپ کمک می کند که برای رسانه های خاصی مورد استفاده قرار می گیرد. این موارد دربرگیرنده نقشه هایی برای فایل های ویدئویی، تصاویر، محتوای موبایلی، کد منبع نرم افزار و محتوای خبری هستند. بعد از اینکه نوع سازگار نقشه سایت در فضای نام اعلام شد، می توان تمامی محتواهای اضافی دیگر را به آن افزود.

نکات پر اعتبار درباره نوع فایل سایت مپ

بینگ از نوع هایی که توسط گوگل کمک می شود حمایت نمی کند، اما یکی از مسئولان بینگ بیان کرده است هر چیزی که کمک نشود، نادیده گرفته خواهد شد. بنابراین وبمسترها می توانند از این موارد در سایت مپ خود به راحتی استفاده کنند.
گوگل توصیه می کند که نقشه سایتِ حاویِ محتوایِ خبری را به نام یک فایل جداگانه در نظر بگیرید زیرا این نوع سایت مپ بیشتر از سایر فایل ها خزیده می شوند.
موتورهای جستجوی گوگل و بینگ از فایل های Media RSS به نام جایگزینی برای تشخیص توضیحات متای فایل های ویدئویی استفاده می کنند. از آنجایی که بینگ نیز از این نوع فایل کمک می کند، توسعۀ Feed ویدئویی mRSS راهکاری هوشمندانه خواهد بود که از هدر رفتن وقت تان جلوگیری می کند.

محدودیت های موجود در فایل سایت مپ
بهتر است بدانید در فایل نقشه سایت، قوانین و محدودیت هایی نیز وجود دارد. این محدودیت ها دربرگیرنده موارد زیر هستند:

فضای نام یا namespace نقشه سایت را مشخص کنید: نقشه سایت باید فضای نام XML پیش فرض را به خوبی مشخص کند: xmlns=http://www.sitemaps.org/schemas/sitemap/0.9
محدودیت در اندازه: فایل نقشه سایت نباید بیشتر از ۵۰۰۰۰ نشانی در خود داشته باشد. نیز سایز این فایل نباید بیشتر از ۵۰ مگابایت باشد. اگر به ورودی بیشتری برای نشانی های خود نیاز داشتید، از فایل ایندکس نقشه سایت استفاده کنید.
نیازمندیهای متنی: فایل نقشه سایت باید به صورت UTF-8 باشد و از کاراکترهای entity-escaped در URL استفاده شود (به نام مثال جایگزین کردن کاراکتر “&” با کاراکتر “&” در نشانی های داینامیک).
قواعد نحوی سازگار: همه نشانی هایی که در نقشه سایت نوشته می شوند باید از قواعد یکسانی پیروی کنند. این موضوع به این معناست نشانی هایی که با WWW ابتدا می شوند را نمی توان با نشانی های بدون پیشوند WWW مخلوط کرد. نیز نشانی هایی که دارای شناسه جلسه (session ID) هستند را نیز در این فایل قرار ندهید.
موقعیت: فایل نقشه سایتی که در دایرکتوری ذخیره شده است، تنها می تواند نشانی هایی را نشان دهد که در آن دایرکتوری یا زیر دایرکتوری های آن ذخیره شده اند. نشانی های موجود در دایرکتوری های موازی، دایرکتوری های والد، Subdomain های متفاوت یا آنهایی که از پروتکل متفاوت استفاده می کنند مرجع های معتبری نیستند. ذخیره کردن نقشه سایت در دایرکتوری ریشه می تواند از به وجود آمدن مرجع نامعتبر جلوگیری کند.
لینک های پاک: به این نکته توجه داشته باشید که نقشه سایت تان نباید بیش از ۱% خطای لینک داشته باشد. در غیر اینصورت کل نقشه دور انداخته می شود. خطای لینک، هر نوع کد پاسخ HTTP است که دربرگیرنده دگرگونی مسیر ۴۰۴ برای لینک های شکسته و ریدایرکت ۳۰۱ و ۳۰۲ برای لینک های دگرگونی مسیر یافته است. این موضوع برای بینگ نیز یک قانونِ شناخته شده است. استفاده از لینک های صحیح در قوانین بهینه سازی موتور جستجو برای تمامی موتورهای جستجو الزامی است. شما می توانید کد پاسخ HTTP برای هر URL را با استفاده از ابزار Header Checker بررسی کنید. برای نشانی های متعدد در یک سایت، می توان از ابزارهایی همچون Find Broken Link و Find Broken Links, Redirects & Google Sitemap Generator Free Tool استفاده کرد.
مراجع کراس سایت از لحاظ جهانی سودمند نیست: گوگل اجازه ثبت URL کراس سایت در نقشه سایت را به افرادی داده است که بتوانند ثابت کنند همه سایت های مرجع متعلق به خودشان است. این تایید معمولاً از روش اکانت وبمستر تولز انجام می شود. به خاطر داشته باشید که این موضوع در بینگ سازگار نیست و برای استفاده جهانی توصیه نمی شود.
حتما بخوانید: شفافیت: راهکار اصلی یک کسب و کار با ثبات و مثال زدنی
فایل ایندکس نقشه سایت
بیشتر سایت های بزرگ بیش از ۵۰۰۰۰ نشانی URL دارند که ایندکس شدنشان در موتورهای جستجو اعتبار دارد. از آنجایی که در نقشه سایت تنها اجازه ورود ۵۰۰۰۰ نشانی وجود دارد، وبمسترها می توانند یک فایل ایندکس نقشه سایت برای خود ایجاد کنند. فایل ایندکس نقشه سایت می تواند بیش از ۵۰۰۰۰ ورودی داشته باشد.

از لحاظ تئوری این موضوع بدین معناست که شما می توانید تا ۲٫۵ میلیارد نشانی را در فایل خود ثبت کنید. ساختار کد XML فایل ایندکس انبوه شبیه نقشه سایت است.

همانند نوع نقشه سایت استاندارد، فایل ایندکس نیز حاوی تگ های الزامی و اختیاری است. در یک فایل ایندکس معتبر نیز کدهای XML با تگ آغازین استاندارد شروع می شود. این تگ با تگ “” دنبال خواهد شد که حاوی صفت “xmlns” می باشد که طرح کلی XML فایل ایندکس را تعریف می کند.

هر نقشه سایت در فایل ایندکس نیازمند تگ و تگ در داخل آن است.

به کارگیری و اجرای سایت مپ
فرایند به کارگیری نقشه سایت و در دسترس قرار دادن آن برای موتورهای جستجو انبوه ساده است. کافیست مراحل زیر را به دقت دنبال کنید:

ابتدا محتوای صفحاتی که برای جستجو پر اعتبار است را شناسایی کنید: شما می توانید صفحات سبد خرید، صفحات لاگین کاربران یا هر صفحه نامتعارف دیگر را نادیده بگیرید.
سایت مپ را با یک CMS یا ابزار خارجی ایجاد کنید: اگر سایت شما بر روی سیستم های مدیریت محتوا اجرا می شود، می توانید از ابزار تولید کننده نقشه سایت که در آن وجود دارد، استفاده کنید. با این حال اگر CMS نداشتید یا سایتتان کوچک بود، می توانید از ابزارهای دیگری برای اینکار استفاده کنید. ابزارهایی همچون Find Broken Links، Find Broken Links, Redirects & Google Sitemap Generator Free Tool در دسترس شما قرار دارد. در هر مورد، شما می توانید فایل به دست آمده را ویرایش کنید تا مطمئن شوید همه چیز به درستی در آن قرار گرفته است.
فایل سایت مپ خود را اعتبار سنجی کنید: پیش از اینکه فایل خود را در اختیار خزنده های موتور جستجو قرار دهید، باید اعتبار آن را تایید کنید. ابزارهای اعتبار سنجی زیادی برای این کار موجود است.
فایل نقشه سایت را بر روی سایت خود قرار دهید: همانطور که قبلاً هم ذکر کردیم، روت دایرکتوری (دایرکتوری ریشه) بهترین مکان برای قرار دادن نقشه سایت است. زمانی که از فایلِ ایندکسِ نقشه سایت استفاده می کنید، پُست کردن نقشه سایت در دایرکتوری URL ای که حاوی آن است، نقشه خوبی محسوب می شود. نیز بعد از اینکه نقشه سایت پُست شد باید مطمئن شوید که فایل robots.txt را بروزرسانی می کنید. به انتهای فایل robots.txt کدی شبیه کد زیر را اضافه کنید:

Sitemap: http://www.example.com/sitemap.xml


سایت مپ خود را در گوگل و بینگ ثبت کنید: بر خلاف فایل robots.txt، موتورهای جستجو نمی توانند به صورت خودکار به دنبال نقشه سایت بگردند و آن را بخوانند. بنابراین همه چیز باید روشن و روشن باشد. بهترین شیوه برای انجام اینکار، استفاده از وبمستر تولز گوگل (مسیر Site configuration > Sitemaps > Add/Test Sitemap) و وبمستر تولز بینگ (مسیر Crawl > Sitemaps (XML, Atom, RSS) > Add Feed ) است. اگر در حال حاضر اکانتی در این ابزارها ندارید بهتر است همین امروز دست به کار شوید.
با دگرگونی محتوای سایت، نقشه سایت را بروزرسانی کنید: سایت شما دارای محتوای ثابت و استاتیک نخواهد بود. تغییرات جدید ایجاد شده را در مرحله های زمانی متفاوت در نقشه سایت نشان دهید. اینکه چند وقت یک بار به این به روزرسانی نیاز دارید به محتوای سایت و تغییرات ایجاد شده بستگی دارد. تعدادی از سایت ها می توانند نقشه سایت را به صورت ماهانه به روز کنند.
امیدواریم که این مطلب توانسته باشد به سوالات شما پاسخ دهد. در صورتی که در زمینه فراگیری بهینه سازی موتور جستجو سوالی دارید می توانید آن را در قسمت دیدگاه ها مطرح کنید تا کارشناسان نوین، پس از بررسی سوال شما در پوسته یک دیدگاه یا مقاله به شما پاسخ دهند.

راهنمای لغات

domain: نامی منحصر به فرد برای یک سرور یا صفحه وب، مثلا Google.com یک دامین (نام دامین) است

  • درباره نویسنده :
    • Avatar
    • مهدی قزوینی

      مدیر ویوپرس، یادگیری مداوم و خلاقیت رو دو رکن اصلی برای موفقیت میدونم. در حوضه های مختلف اما مرتبط فعالیت کردم و امیدوارم مطالب ارایه شده در وبلاگ ویوپرس برای شما مفید بوده باشه.

شرایط ارسال دیدگاه برای کاربران غیرعضو سایت