¿Qué es y para qué sirve un sitemap?

El posicionamiento en buscadores de los sitios que diseñamos y realizamos tiene una enorme importancia en un entorno muy competitivo como la web de hoy. De este aspecto depende muchas veces el éxito o fracaso del sitio.

En el mundo del diseño web, el posicionamiento en los buscadores de los sitios que realizamos ha ganado una enorme importancia. Una medida de ello es la cantidad de tiempo y esfuerzo que dedicamos a optimizar los sitios primero y a conseguir buenos enlaces entrantes después.

Un requisito básico para que todo ese empeño rinda frutos es lograr que todas las páginas del sitio estén correctamente indexadas en los motores de búsqueda. Esto ocurrirá siempre y cuando los crawlers (arañas) de los buscadores importantes visiten e indexen esas páginas con la periodicidad adecuada y sin omitir ninguna.

Aún sin recurrir a ningún procedimiento extra, las arañas relevan las páginas de los sitios web simplemente siguiendo los enlaces (a menos que estos incluyan el atributo “no-follow”), pero hay más cosas que pueden hacerse. Una buena estrategia consiste en suministrar a los buscadores una “lista” de las páginas que nos interesa que se indexen, junto con alguna información adicional que haga la visita más eficaz. Concretamente, eso se logra mediante el uso de Sitemaps.

Un sitemap es un archivo XML que contiene una lista de las páginas del sitio junto con alguna información adicional, tal como con qué frecuencia la página cambia sus contenidos, cuándo fue su última actualización y qué tan importante es respecto al resto de las páginas del mismo sitio.
La construcción del archivo XML debe seguir una serie de pautas especificadas en el protocolo de sitemaps, que describimos a continuación:

Contenidos obligatorios del sitemap

El protocolo Sitemap se construye en base a etiquetas XML (Tags) incluidas en un archivo con codificación UTF-8.
Los valores de datos (por contraposición a las etiquetas mismas) deben utilizar códigos de escape para ciertos caracteres especiales, tal como se acostumbra en HTML.

Por ejemplo, las comillas dobles (") deben ser reemplazadas por &quot; y los signos menor (<) y mayor (>) por &lt; y &gt; respectivamente.

El archivo XML debe:

  • Comenzar con una etiqueta de apertura <urlset> y terminar con una de cierre </urlset>
  • Especificar el protocolo estándar al que responde dentro de la etiqueta de apertura <urlset> (ver en el ejemplo)
  • Incluir una entrada <url> por cada dirección URL (que corresponderá a cada una de las páginas del sitio) como nodo XML padre.
  • Incluir un nodo XML hijo <loc> para cada dirección URL (cada nodo XML padre <url>).

Resumiendo estos aspectos en un ejemplo (sitio con dos páginas):

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.com/</loc>
</url>
<url>
<loc>http://www.misitio.com/contacto.htm</loc>
</url>
</urlset>

Contenidos opcionales del sitemap

Cada nodo <url> padre puede contener (además del nodo <loc> hijo obligatorio) cierta información adicional útil para que el proceso de indexación se realice más inteligentemente. Los nodos opcionales, aunque importantes, son:

<lastmod>Fecha</lastmod>

Se refiere a la fecha de la última modificación de la página que figura en <loc>
Esta fecha debe expresarse en formado AAAA-MM-DD, por lo que el 8 de julio de 2006 será 2006-07-08.

<changefrec>Frec</changefrec>

Se refiere a que tan a menudo cambia la página que figura en <loc> y será un dato que indicará a la araña con qué frecuencia volver a visitar el sitio. Es un valor orientativo, por lo que no quiere decir que deba cumplirse forzosamente.

Frec puede tomar alguno de los siguientes valores: always (siempre, para páginas que cambian cada vez que se muestran. Típicamente, las dinámicas), hourly (a cada hora), daily (diariamente), weekly (semanalmente), monthly (mensualmente), yearly (anualmente) o never (nunca, típicamente para páginas archivadas).

<priority>Valor</priority>

Se refiere a la importancia que tiene la página que figura en <loc> respecto de las demás que componen el sitio. Es simplemente una manera de indicar prioridades relativas dentro del sitio, sin ningún efecto hacia el exterior del mismo.
Valor puede tomar valores entre 0 y 1. El valor por defecto es 0.5

Volviendo al ejemplo anterior y agregando los atributos opcionales:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.com/</loc>
<lastmod>2006-11-20</lastmod>
<changefrec>monthly</changefrec>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.misitio.com/contacto.htm</loc>
<lastmod>2006-08-01</lastmod>
<changefrec>yearly</changefrec>
<priority>0.3</priority>
</url>
</urlset>

El archivo XML así construido se aloja en el servidor como un archivo más del sitio, con la salvedad de que puede contener las URL contenidas en el mismo directorio en que se encuentra o en otros contenidos en él.

Por ejemplo, si ubicamos el archivo sitemap.xml en el directorio ejemplo.com/catalogo/ no podrá incluir URLs que se encuentren en ejemplo.com/
Por esta razón se recomienda enfáticamente colocar sitemap.xml directamente en el root del sitio.

A partir de este punto solo queda enviar el sitemap a los buscadores, que generalmente disponen de una página específica para aceptarlo.

Hace unas semanas, Yahoo, Google y Microsoft llegaron a un acuerdo (detalle poco común entre estas empresas) para que el formato Sitemaps 0.90 fuera el aceptado en sus motores de búsqueda.

A través de Google Webmaster Tools o de Yahoo Site explorer podemos proporcionarles la información de nuestro sitemap.

Fernando Campaña
Diseñador y desarrollador web, reside en Argentina y actualmente es encargado del sitio rakidwam.com.ar.
Ken Torrealba
8/12/2006

Interesante información, trataré de aplicarla en lo mediado posible.

Ken Torrealba
El Callao – Venezuela

Interesante e importante, diria yo. Pregunto dos cosas que no tengo claro:
¿Los sistemaps, estan relacionados con los subenlaces que muestra google en algunos resultados? ¿Los habituales “mapas de web” tienen alguna funcionalidad?

frank
13/12/2006

podria hacerlo mas claro por q no entendi casi nada

Esta bastante bien explicado en general el articulo. Saludos.

aun mas facil: http://www.sitemapbuilder.net/ te lo arman online y sino tambien te bajas el soft FREEWARE y te lo arma escaneando las urls de tu sitio ke obviamente ya tiene k estar armado y subido a tu servidor.. te crea el xml k pones en la raiz d tu sitio.. ta bueno

isan
25/01/2007

he encontrado en la documentación de google que da errore la etiqueta xml la he cambiado por que era lo que ponia en la página de google.

Creo que así funcionará

Gerard
16/02/2007

Por favor, cambien por

Confiando que en este artículo estaría bien, luego veo en el panel de control para webmasters, al cabo de un mes casi, que el googlebot ha encontrado un error en el sitemap.xml. Y era porque estaba puesto con “c” en vez de con “q” . . . . .

Saludos.

Gerard
16/02/2007

El cambio que hay que realizar es:

- en vez de “changefrec” poner “changefreq”, con “q”…

(en mi comentario anterior no salía porque lo puse con los tags incluidos…)

Saludos.

Jo lo que saben algunos, y yo que sigo sin aclararme, haber si alguien puede hacerme un sitemap de mi pagina, lo agradeceria. Saludos

Julian Morales
4/03/2007

Es posible hacer el sitemap con direcciones como http://www.ejemplo.com/index.php?variable
¿don de puedo encontrar ayuda? pues todos mis enlaces van así.
Gracias de antemano

Muy buen editorial para entender los conceptos que emplea el sitemap.
Saludos!

Como siempre genial

Disculpen la falta de información mia, pero los mapsites.xml tiene algo que ver con la páginas mapa de la web que se suele colocar en las webs para mostar la estructura de la web site?

Cesar
31/05/2007

My buena explicacion , saludos desde peru.

Leif Ferreira
8/06/2007

Pero a ver, la version esta que comentas de 0.9 del acuerdo es mejor que la 0.8? en que cambia? y si tienes la 0.8 ya no funciona?
Otra cosa, realmente es obligado el sitemap o con unos buenos metas ya vale?
Otra cosa, el sitemap da = que sea con las urls sin variables del mod rewrite o con las urls con variables? cual es mejor poner?
Otra cosa, Cuanto tarda google desde que haces el sitemap y se lo indexas corresctamente a realizar los cambios en las busquedas, y a indexarte todas las nuevas paginas al poner site:tudominio.com??

Bueno un saludo!

muy bien explicado gracias

es interesante la explicacion y me a despejado de las dudas que tenia con respecto alos sitemaps
saludos desde celaya guanajuato.

enya
1/10/2007

mm estuvo bien chafa uagggg buaggg que asco y no se ve nada por la letra tan chica jajaja

[...] ¿Qué es y para qué sirve un sitemap? [...]

Ya hemos visto que la existencia de un buen sitemap es importante para el éxito de cualquier web. Pero, en vuestra opinión, ¿cual es el mejor software que te haga esto automaticamente?

pd: y que no sea de pago :p

Para “Julian Morales”

No creo que un sitemap pueda usar ese tipo de direcciones, aunque no se del tema de sitemaps, pero esas direcciones no son buenas para un motor de busqueda.

Buscate algo de informacion sobre MOD_REWRITE y trata de comenzar a programar tus sitios de esta manera, pues es hasta ahora lo mejor para posicionamiento web.

¿Qué es y para qué sirve un sitemap?…

Este post fue agregado a teknear.com para votarlo. Votalo!…

hola a todos
estoy tatando de hacer un sitemap , bueno gracias por la info igual me estoy agarrando de los pelos.
saludos

Yo siempre intento tener mi sitemap actualizado. Además me he percatado que contra más lo actualices (sin trampas) con mayor frecuencia pasa el boot de google por tu web.

[...] en los resultados de Google. No obstante, existen algunos procedimientos, como subir instalar un sitemap al sitio web o dar de alta manualmente tu URL que permiten que una página web sin enlaces [...]

[...] Site explorer podemos proporcionarles la información de nuestro sitemap. Autor: Fernando Campaña http://www.maestrosdelweb.com/editorial/sitemap/ [...]

Me gustaría saber como utilizar un sitemap con blogger para mi sitio web.

Tengo una duda, que significa el T01:00:00-07:00 en el atributo lastmod=”2008-02-23T01:00:00-07:00″

una preguna gerard,

has dicho que mejor poner el sitemap en el dominios que en directorio.

pero en caso de tene runa web con estructura muy complicada, no piensas que es mas claro y mas facil de leer si hacemos un sitemape por categoria ?

saludos
ouali benmeziane
seo experto barcelona

error mi url : searchengineoptimiser.wordpress.com/

[...] se trata de Google Sitemap Generator para los que no sepan lo que es un Sitemap pueden visitar este enlace que les explica todo paso a [...]

El mejor Generator de SItemap que conozco es xml-sitemaps.com

muy sencillo de usar y te saca el sitemap en todos los formatos..
:+)
ouali benmeziane
seo consultant

y ademas es divertido de ver como ven tu web los spiders..

[...] El nuevo parametro en la barra de seoquake . es que nos muestra si un sitio web tiene sitemap o [...]

Quiero aprender a generar el sitemap automatico

Es lo mismo un sitemap con .com y .com.ar

me gustaria saber si agregar en blogger el sitemap de atom sirve…

Muy bune aporte

excelte el aporte, muchas gracias a todos. Qu mas se puede hacer para el SEO

Gracias por toda la info, muy buen explicacion!

[...] Descarga | Site Map Plugin Información | Instalacion de Site Map Información | ¿Qué es y para qué sirve un sitemap? [...]

he cambiado de dominio y estaba dando de alta en yahoo y veo qu ellos piden la direccion del feed, al parecer cuando das de alta a una web en yahoo tambien das de alta a un sitemap.

[...] te presentamos  XML-Sitemaps.com,  una herramienta para crear tus archivos de sitemap. Con ella, podrás crear archivos XML, de texto plano, ROR o [...]

Buen articulo. Ahora hay que aprender a volcarlo sin errores.

Yo tambien lo he creado con el http://www.sitemapbuilder.net/ , lo hacen online al momento.
No lo tenia puetso en la web, espero que ponerlo ayude

leo
8/09/2009

Hola, muy buen articulo, tengo una pregunta – que pasaria si cambio la info del “2009-03-02T22:46:33+00:00″ a una fecha mas reciente y en que puede perjudicarme cambiar el orden de todo mi sitemap.xml por el que normalmente tiene ahora.

[...] en los resultados de Google. No obstante, existen algunos procedimientos, como subir instalar un sitemap al sitio web o dar de alta manualmente tu URL que permiten que una página web sin enlaces [...]

Muy bueno, no conocia el funcionanmiento del sitemap, me lo apunto para probarlo.

[...] Antes de nada os preguntaréis, ¿qué es un sitemap? ¿Por qué decís que es importante? En este post vamos a resumir muy brevemente qué es, para qué sirve y cómo puedo generarlo automáticamente con algún CMS como WordPress. Si queréis información en profundidad y calidad os recomiendo que os leáis este artículo aparecido en Maestros del Web. [...]

Muy buena la explicación!

;-)

muy interesante tu comentario saludos

Hola. tengo una gran duda que me trae de cabeza.
tengo una web de ocio para adultos y no entiendo por que al poner en google site:www.miweb.com un dia me dice que tengo 12500 paginas y al dia siguiente me dice que solo hay 800 paginas. Como se come eso? y porque ocurre?
Se que tengo 2 BD una con unos nombres y otras con otro tipo de informacion.
saludos
jordi

Webpadawan
23/04/2010

Gran ayuda, muy bien explicado, claro y práctico.

gracias!

Como consigo los codigos para el sitemap de Live Search

muy buen articulo sobre el sitemap
sencillosanuncios.22web.net

webbish
24/07/2010

holaaaaaaaa papi ayyyyyyyyyyyy que ricoooooooo

muchas gracias me quedo mas claro algunas pautas olvidadas …

para implementarlo

Hola, quisiera saber las maneras que hay para optener mas visitas en una pagina. poniendo accesos , anuncios.? no tengo idea, gracia s anticipadas.

    Yo te recomiendo Google Adsense. Es fácil, rápido y da algunas ganancias si tienes un buen volúmen de visitas. Además, es muy fácil de integrar en tu web.

Corregid esta etiqueta porque está mal y luego no funciona bien el sitemap:

changefrec

lo correcto es con “q”

changefreq

este tipo es un estafador

Hacer un sitemap ayuda mucho a indexar las paginas que google no ha podido encontrar.

380