Un espacio para los entusiastas del web

¿Qué es y para qué sirve un sitemap?

Publicado el 7 de Diciembre, 2006

El posicionamiento en buscadores de los sitios que diseñamos y realizamos tiene una enorme importancia en un entorno muy competitivo como la web de hoy. De este aspecto depende muchas veces el éxito o fracaso del sitio.

En el mundo del diseño web, el posicionamiento en los buscadores de los sitios que realizamos ha ganado una enorme importancia. Una medida de ello es la cantidad de tiempo y esfuerzo que dedicamos a optimizar los sitios primero y a conseguir buenos enlaces entrantes después.

Un requisito básico para que todo ese empeño rinda frutos es lograr que todas las páginas del sitio estén correctamente indexadas en los motores de búsqueda. Esto ocurrirá siempre y cuando los crawlers (arañas) de los buscadores importantes visiten e indexen esas páginas con la periodicidad adecuada y sin omitir ninguna.

Aún sin recurrir a ningún procedimiento extra, las arañas relevan las páginas de los sitios web simplemente siguiendo los enlaces (a menos que estos incluyan el atributo “no-follow”), pero hay más cosas que pueden hacerse. Una buena estrategia consiste en suministrar a los buscadores una “lista” de las páginas que nos interesa que se indexen, junto con alguna información adicional que haga la visita más eficaz. Concretamente, eso se logra mediante el uso de Sitemaps.

Un sitemap es un archivo XML que contiene una lista de las páginas del sitio junto con alguna información adicional, tal como con qué frecuencia la página cambia sus contenidos, cuándo fue su última actualización y qué tan importante es respecto al resto de las páginas del mismo sitio.
La construcción del archivo XML debe seguir una serie de pautas especificadas en el protocolo de sitemaps, que describimos a continuación:

Contenidos obligatorios del sitemap

El protocolo Sitemap se construye en base a etiquetas XML (Tags) incluidas en un archivo con codificación UTF-8.
Los valores de datos (por contraposición a las etiquetas mismas) deben utilizar códigos de escape para ciertos caracteres especiales, tal como se acostumbra en HTML.

Por ejemplo, las comillas dobles (") deben ser reemplazadas por &quot; y los signos menor (<) y mayor (>) por &lt; y &gt; respectivamente.

El archivo XML debe:

  • Comenzar con una etiqueta de apertura <urlset> y terminar con una de cierre </urlset>
  • Especificar el protocolo estándar al que responde dentro de la etiqueta de apertura <urlset> (ver en el ejemplo)
  • Incluir una entrada <url> por cada dirección URL (que corresponderá a cada una de las páginas del sitio) como nodo XML padre.
  • Incluir un nodo XML hijo <loc> para cada dirección URL (cada nodo XML padre <url>).

Resumiendo estos aspectos en un ejemplo (sitio con dos páginas):

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.com/</loc>
</url>
<url>
<loc>http://www.misitio.com/contacto.htm</loc>
</url>
</urlset>

Contenidos opcionales del sitemap

Cada nodo <url> padre puede contener (además del nodo <loc> hijo obligatorio) cierta información adicional útil para que el proceso de indexación se realice más inteligentemente. Los nodos opcionales, aunque importantes, son:

<lastmod>Fecha</lastmod>

Se refiere a la fecha de la última modificación de la página que figura en <loc>
Esta fecha debe expresarse en formado AAAA-MM-DD, por lo que el 8 de julio de 2006 será 2006-07-08.

<changefrec>Frec</changefrec>

Se refiere a que tan a menudo cambia la página que figura en <loc> y será un dato que indicará a la araña con qué frecuencia volver a visitar el sitio. Es un valor orientativo, por lo que no quiere decir que deba cumplirse forzosamente.

Frec puede tomar alguno de los siguientes valores: always (siempre, para páginas que cambian cada vez que se muestran. Típicamente, las dinámicas), hourly (a cada hora), daily (diariamente), weekly (semanalmente), monthly (mensualmente), yearly (anualmente) o never (nunca, típicamente para páginas archivadas).

<priority>Valor</priority>

Se refiere a la importancia que tiene la página que figura en <loc> respecto de las demás que componen el sitio. Es simplemente una manera de indicar prioridades relativas dentro del sitio, sin ningún efecto hacia el exterior del mismo.
Valor puede tomar valores entre 0 y 1. El valor por defecto es 0.5

Volviendo al ejemplo anterior y agregando los atributos opcionales:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.com/</loc>
<lastmod>2006-11-20</lastmod>
<changefrec>monthly</changefrec>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.misitio.com/contacto.htm</loc>
<lastmod>2006-08-01</lastmod>
<changefrec>yearly</changefrec>
<priority>0.3</priority>
</url>
</urlset>

El archivo XML así construido se aloja en el servidor como un archivo más del sitio, con la salvedad de que puede contener las URL contenidas en el mismo directorio en que se encuentra o en otros contenidos en él.

Por ejemplo, si ubicamos el archivo sitemap.xml en el directorio ejemplo.com/catalogo/ no podrá incluir URLs que se encuentren en ejemplo.com/
Por esta razón se recomienda enfáticamente colocar sitemap.xml directamente en el root del sitio.

A partir de este punto solo queda enviar el sitemap a los buscadores, que generalmente disponen de una página específica para aceptarlo.

Hace unas semanas, Yahoo, Google y Microsoft llegaron a un acuerdo (detalle poco común entre estas empresas) para que el formato Sitemaps 0.90 fuera el aceptado en sus motores de búsqueda.

A través de Google Webmaster Tools o de Yahoo Site explorer podemos proporcionarles la información de nuestro sitemap.

¿Te gustó?

¡Sí, me gusta! Le ha gustado a 45 personas
Loading ... Loading ...

Fernando CampañaFernando Campaña para Maestros del Web.
Agrega tu comentario | Enlace permanente al artículo

Síguenos en: @maestros | Fan page

Comentarios

  1. Ken Torrealba

    Interesante información, trataré de aplicarla en lo mediado posible.

    Ken Torrealba
    El Callao – Venezuela

    Responder
  2. Interesante e importante, diria yo. Pregunto dos cosas que no tengo claro:
    ¿Los sistemaps, estan relacionados con los subenlaces que muestra google en algunos resultados? ¿Los habituales “mapas de web” tienen alguna funcionalidad?

    Responder
  3. frank

    podria hacerlo mas claro por q no entendi casi nada

    Responder
    1. jajaja tú estás loco

  4. Esta bastante bien explicado en general el articulo. Saludos.

    Responder
  5. X

    aun mas facil: http://www.sitemapbuilder.net/ te lo arman online y sino tambien te bajas el soft FREEWARE y te lo arma escaneando las urls de tu sitio ke obviamente ya tiene k estar armado y subido a tu servidor.. te crea el xml k pones en la raiz d tu sitio.. ta bueno

    Responder
  6. isan

    he encontrado en la documentación de google que da errore la etiqueta xml la he cambiado por que era lo que ponia en la página de google.

    Creo que así funcionará

    Responder
  7. Gerard

    Por favor, cambien por

    Confiando que en este artículo estaría bien, luego veo en el panel de control para webmasters, al cabo de un mes casi, que el googlebot ha encontrado un error en el sitemap.xml. Y era porque estaba puesto con “c” en vez de con “q” . . . . .

    Saludos.

    Responder
  8. Gerard

    El cambio que hay que realizar es:

    - en vez de “changefrec” poner “changefreq”, con “q”…

    (en mi comentario anterior no salía porque lo puse con los tags incluidos…)

    Saludos.

    Responder
  9. Jo lo que saben algunos, y yo que sigo sin aclararme, haber si alguien puede hacerme un sitemap de mi pagina, lo agradeceria. Saludos

    Responder
  10. Julian Morales

    Es posible hacer el sitemap con direcciones como http://www.ejemplo.com/index.php?variable
    ¿don de puedo encontrar ayuda? pues todos mis enlaces van así.
    Gracias de antemano

    Responder
  11. Muy buen editorial para entender los conceptos que emplea el sitemap.
    Saludos!

    Responder
  12. Como siempre genial

    Responder
  13. Disculpen la falta de información mia, pero los mapsites.xml tiene algo que ver con la páginas mapa de la web que se suele colocar en las webs para mostar la estructura de la web site?

    Responder
  14. Cesar

    My buena explicacion , saludos desde peru.

    Responder
  15. Leif Ferreira

    Pero a ver, la version esta que comentas de 0.9 del acuerdo es mejor que la 0.8? en que cambia? y si tienes la 0.8 ya no funciona?
    Otra cosa, realmente es obligado el sitemap o con unos buenos metas ya vale?
    Otra cosa, el sitemap da = que sea con las urls sin variables del mod rewrite o con las urls con variables? cual es mejor poner?
    Otra cosa, Cuanto tarda google desde que haces el sitemap y se lo indexas corresctamente a realizar los cambios en las busquedas, y a indexarte todas las nuevas paginas al poner site:tudominio.com??

    Bueno un saludo!

    Responder
  16. muy bien explicado gracias

    Responder
  17. es interesante la explicacion y me a despejado de las dudas que tenia con respecto alos sitemaps
    saludos desde celaya guanajuato.

    Responder
  18. enya

    mm estuvo bien chafa uagggg buaggg que asco y no se ve nada por la letra tan chica jajaja

    Responder
  19. Ya hemos visto que la existencia de un buen sitemap es importante para el éxito de cualquier web. Pero, en vuestra opinión, ¿cual es el mejor software que te haga esto automaticamente?

    pd: y que no sea de pago :p

    Responder
  20. Para “Julian Morales”

    No creo que un sitemap pueda usar ese tipo de direcciones, aunque no se del tema de sitemaps, pero esas direcciones no son buenas para un motor de busqueda.

    Buscate algo de informacion sobre MOD_REWRITE y trata de comenzar a programar tus sitios de esta manera, pues es hasta ahora lo mejor para posicionamiento web.

    Responder
  21. hola a todos
    estoy tatando de hacer un sitemap , bueno gracias por la info igual me estoy agarrando de los pelos.
    saludos

    Responder
  22. Yo siempre intento tener mi sitemap actualizado. Además me he percatado que contra más lo actualices (sin trampas) con mayor frecuencia pasa el boot de google por tu web.

    Responder
  23. Me gustaría saber como utilizar un sitemap con blogger para mi sitio web.

    Responder
  24. Tengo una duda, que significa el T01:00:00-07:00 en el atributo lastmod=”2008-02-23T01:00:00-07:00″

    Responder
  25. una preguna gerard,

    has dicho que mejor poner el sitemap en el dominios que en directorio.

    pero en caso de tene runa web con estructura muy complicada, no piensas que es mas claro y mas facil de leer si hacemos un sitemape por categoria ?

    saludos
    ouali benmeziane
    seo experto barcelona

    Responder
  26. error mi url : searchengineoptimiser.wordpress.com/

    Responder
  27. El mejor Generator de SItemap que conozco es xml-sitemaps.com

    muy sencillo de usar y te saca el sitemap en todos los formatos..
    :+)
    ouali benmeziane
    seo consultant

    Responder
  28. y ademas es divertido de ver como ven tu web los spiders..

    Responder
  29. Quiero aprender a generar el sitemap automatico

    Responder
  30. Es lo mismo un sitemap con .com y .com.ar

    Responder
  31. me gustaria saber si agregar en blogger el sitemap de atom sirve…

    Responder
  32. excelte el aporte, muchas gracias a todos. Qu mas se puede hacer para el SEO

    Responder
  33. Gracias por toda la info, muy buen explicacion!

    Responder
  34. he cambiado de dominio y estaba dando de alta en yahoo y veo qu ellos piden la direccion del feed, al parecer cuando das de alta a una web en yahoo tambien das de alta a un sitemap.

    Responder
  35. Buen articulo. Ahora hay que aprender a volcarlo sin errores.

    Responder
  36. Yo tambien lo he creado con el http://www.sitemapbuilder.net/ , lo hacen online al momento.
    No lo tenia puetso en la web, espero que ponerlo ayude

    Responder
  37. leo

    Hola, muy buen articulo, tengo una pregunta – que pasaria si cambio la info del “2009-03-02T22:46:33+00:00″ a una fecha mas reciente y en que puede perjudicarme cambiar el orden de todo mi sitemap.xml por el que normalmente tiene ahora.

    Responder
  38. AyP

    Muy bueno, no conocia el funcionanmiento del sitemap, me lo apunto para probarlo.

    Responder
  39. Muy buena la explicación!

    ;-)

    Responder
  40. muy interesante tu comentario saludos

    Responder

Deja tu Comentario

Maestros del Web se reserva el derecho de moderación de los comentarios. Evita utilizar palabras soeces, ataques directos, descalificativos, insultos, de lo contrario tu comentario será eliminado.



Acerca de

Maestros del Web nace cuando intentamos traducir Webmaster al Español. Nacimos orientados al diseño y desarrollo web. Hoy somos un espacio de apoyo para los entusiastas que participan en proyectos en la red.
Leer más de Maestros del Web