Maestros del Web


Estás en Inicio / Editorial / SEO

07.12.2006

¿Qué es y para qué sirve un sitemap?

El posicionamiento en buscadores de los sitios que diseñamos y realizamos tiene una enorme importancia en un entorno muy competitivo como la web de hoy. De este aspecto depende muchas veces el éxito o fracaso del sitio.

En el mundo del diseño web, el posicionamiento en los buscadores de los sitios que realizamos ha ganado una enorme importancia. Una medida de ello es la cantidad de tiempo y esfuerzo que dedicamos a optimizar los sitios primero y a conseguir buenos enlaces entrantes después.

Un requisito básico para que todo ese empeño rinda frutos es lograr que todas las páginas del sitio estén correctamente indexadas en los motores de búsqueda. Esto ocurrirá siempre y cuando los crawlers (arañas) de los buscadores importantes visiten e indexen esas páginas con la periodicidad adecuada y sin omitir ninguna.

Aún sin recurrir a ningún procedimiento extra, las arañas relevan las páginas de los sitios web simplemente siguiendo los enlaces (a menos que estos incluyan el atributo “no-follow”), pero hay más cosas que pueden hacerse. Una buena estrategia consiste en suministrar a los buscadores una “lista” de las páginas que nos interesa que se indexen, junto con alguna información adicional que haga la visita más eficaz. Concretamente, eso se logra mediante el uso de Sitemaps.

Un sitemap es un archivo XML que contiene una lista de las páginas del sitio junto con alguna información adicional, tal como con qué frecuencia la página cambia sus contenidos, cuándo fue su última actualización y qué tan importante es respecto al resto de las páginas del mismo sitio.
La construcción del archivo XML debe seguir una serie de pautas especificadas en el protocolo de sitemaps, que describimos a continuación:

Contenidos obligatorios del sitemap

El protocolo Sitemap se construye en base a etiquetas XML (Tags) incluidas en un archivo con codificación UTF-8.
Los valores de datos (por contraposición a las etiquetas mismas) deben utilizar códigos de escape para ciertos caracteres especiales, tal como se acostumbra en HTML.

Por ejemplo, las comillas dobles (") deben ser reemplazadas por &quot; y los signos menor (<) y mayor (>) por &lt; y &gt; respectivamente.

El archivo XML debe:

  • Comenzar con una etiqueta de apertura <urlset> y terminar con una de cierre </urlset>
  • Especificar el protocolo estándar al que responde dentro de la etiqueta de apertura <urlset> (ver en el ejemplo)
  • Incluir una entrada <url> por cada dirección URL (que corresponderá a cada una de las páginas del sitio) como nodo XML padre.
  • Incluir un nodo XML hijo <loc> para cada dirección URL (cada nodo XML padre <url>).

Resumiendo estos aspectos en un ejemplo (sitio con dos páginas):

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.com/</loc>
</url>
<url>
<loc>http://www.misitio.com/contacto.htm</loc>
</url>
</urlset>

Contenidos opcionales del sitemap

Cada nodo <url> padre puede contener (además del nodo <loc> hijo obligatorio) cierta información adicional útil para que el proceso de indexación se realice más inteligentemente. Los nodos opcionales, aunque importantes, son:

<lastmod>Fecha</lastmod>

Se refiere a la fecha de la última modificación de la página que figura en <loc>
Esta fecha debe expresarse en formado AAAA-MM-DD, por lo que el 8 de julio de 2006 será 2006-07-08.

<changefrec>Frec</changefrec>

Se refiere a que tan a menudo cambia la página que figura en <loc> y será un dato que indicará a la araña con qué frecuencia volver a visitar el sitio. Es un valor orientativo, por lo que no quiere decir que deba cumplirse forzosamente.

Frec puede tomar alguno de los siguientes valores: always (siempre, para páginas que cambian cada vez que se muestran. Típicamente, las dinámicas), hourly (a cada hora), daily (diariamente), weekly (semanalmente), monthly (mensualmente), yearly (anualmente) o never (nunca, típicamente para páginas archivadas).

<priority>Valor</priority>

Se refiere a la importancia que tiene la página que figura en <loc> respecto de las demás que componen el sitio. Es simplemente una manera de indicar prioridades relativas dentro del sitio, sin ningún efecto hacia el exterior del mismo.
Valor puede tomar valores entre 0 y 1. El valor por defecto es 0.5

Volviendo al ejemplo anterior y agregando los atributos opcionales:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.misitio.com/</loc>
<lastmod>2006-11-20</lastmod>
<changefrec>monthly</changefrec>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.misitio.com/contacto.htm</loc>
<lastmod>2006-08-01</lastmod>
<changefrec>yearly</changefrec>
<priority>0.3</priority>
</url>
</urlset>

El archivo XML así construido se aloja en el servidor como un archivo más del sitio, con la salvedad de que puede contener las URL contenidas en el mismo directorio en que se encuentra o en otros contenidos en él.

Por ejemplo, si ubicamos el archivo sitemap.xml en el directorio ejemplo.com/catalogo/ no podrá incluir URLs que se encuentren en ejemplo.com/
Por esta razón se recomienda enfáticamente colocar sitemap.xml directamente en el root del sitio.

A partir de este punto solo queda enviar el sitemap a los buscadores, que generalmente disponen de una página específica para aceptarlo.

Hace unas semanas, Yahoo, Google y Microsoft llegaron a un acuerdo (detalle poco común entre estas empresas) para que el formato Sitemaps 0.90 fuera el aceptado en sus motores de búsqueda.

A través de Google Webmaster Tools o de Yahoo Site explorer podemos proporcionarles la información de nuestro sitemap.

Califica esta nota:

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (8 votos, promedio: 4.5 de 5)
Loading ... Loading ...
Fernando Campaña

Sobre el autor

Fernando Campaña
Diseñador y desarrollador web, reside en Argentina y actualmente es encargado del sitio rakidwam.com.ar.

Si eres nuevo en Maestros del Web y te agradan nuestras publicaciones, te invitamos a suscribirte a nuestro Feed.

Sindícanos en: Google Reader, Bloglines, My Yahoo o My MSN | ¿Qué es el Feed?

Comentarios

28 comentarios en total.

  1. Ken Torrealba 08.12.2006 - 22:25 - #

    Interesante información, trataré de aplicarla en lo mediado posible.

    Ken Torrealba
    El Callao - Venezuela

  2. ukoegin 11.12.2006 - 03:25 - #

    Interesante e importante, diria yo. Pregunto dos cosas que no tengo claro:
    ¿Los sistemaps, estan relacionados con los subenlaces que muestra google en algunos resultados? ¿Los habituales “mapas de web” tienen alguna funcionalidad?

  3. frank 13.12.2006 - 19:31 - #

    podria hacerlo mas claro por q no entendi casi nada

  4. Ivan Garcia 14.12.2006 - 07:45 - #

    Esta bastante bien explicado en general el articulo. Saludos.

  5. X 19.12.2006 - 20:37 - #

    aun mas facil: http://www.sitemapbuilder.net/ te lo arman online y sino tambien te bajas el soft FREEWARE y te lo arma escaneando las urls de tu sitio ke obviamente ya tiene k estar armado y subido a tu servidor.. te crea el xml k pones en la raiz d tu sitio.. ta bueno

  6. isan 25.01.2007 - 11:16 - #

    he encontrado en la documentación de google que da errore la etiqueta xml la he cambiado por que era lo que ponia en la página de google.

    Creo que así funcionará

  7. Gerard 16.02.2007 - 04:06 - #

    Por favor, cambien por

    Confiando que en este artículo estaría bien, luego veo en el panel de control para webmasters, al cabo de un mes casi, que el googlebot ha encontrado un error en el sitemap.xml. Y era porque estaba puesto con “c” en vez de con “q” . . . . .

    Saludos.

  8. Gerard 16.02.2007 - 04:09 - #

    El cambio que hay que realizar es:

    - en vez de “changefrec” poner “changefreq”, con “q”…

    (en mi comentario anterior no salía porque lo puse con los tags incluidos…)

    Saludos.

  9. Jesús Bonilla 27.02.2007 - 05:17 - #

    Jo lo que saben algunos, y yo que sigo sin aclararme, haber si alguien puede hacerme un sitemap de mi pagina, lo agradeceria. Saludos

  10. Julian Morales 04.03.2007 - 09:13 - #

    Es posible hacer el sitemap con direcciones como http://www.ejemplo.com/index.php?variable
    ¿don de puedo encontrar ayuda? pues todos mis enlaces van así.
    Gracias de antemano

  11. Alejandro 14.03.2007 - 14:11 - #

    Muy buen editorial para entender los conceptos que emplea el sitemap.
    Saludos!

  12. GBCN 09.04.2007 - 08:30 - #

    Como siempre genial

  13. Arcenio 17.05.2007 - 13:54 - #

    Disculpen la falta de información mia, pero los mapsites.xml tiene algo que ver con la páginas mapa de la web que se suele colocar en las webs para mostar la estructura de la web site?

  14. Cesar 31.05.2007 - 17:46 - #

    My buena explicacion , saludos desde peru.

  15. Leif Ferreira 08.06.2007 - 06:33 - #

    Pero a ver, la version esta que comentas de 0.9 del acuerdo es mejor que la 0.8? en que cambia? y si tienes la 0.8 ya no funciona?
    Otra cosa, realmente es obligado el sitemap o con unos buenos metas ya vale?
    Otra cosa, el sitemap da = que sea con las urls sin variables del mod rewrite o con las urls con variables? cual es mejor poner?
    Otra cosa, Cuanto tarda google desde que haces el sitemap y se lo indexas corresctamente a realizar los cambios en las busquedas, y a indexarte todas las nuevas paginas al poner site:tudominio.com??

    Bueno un saludo!

  16. alex 01.07.2007 - 20:44 - #

    muy bien explicado gracias

  17. (voraz)gustavo Web master 19.07.2007 - 20:25 - #

    es interesante la explicacion y me a despejado de las dudas que tenia con respecto alos sitemaps
    saludos desde celaya guanajuato.

  18. enya 01.10.2007 - 10:18 - #

    mm estuvo bien chafa uagggg buaggg que asco y no se ve nada por la letra tan chica jajaja

  19. Jimbo 02.11.2007 - 13:04 - #

    Ya hemos visto que la existencia de un buen sitemap es importante para el éxito de cualquier web. Pero, en vuestra opinión, ¿cual es el mejor software que te haga esto automaticamente?

    pd: y que no sea de pago :p

  20. Roberto Mejia 22.11.2007 - 00:38 - #

    Para “Julian Morales”

    No creo que un sitemap pueda usar ese tipo de direcciones, aunque no se del tema de sitemaps, pero esas direcciones no son buenas para un motor de busqueda.

    Buscate algo de informacion sobre MOD_REWRITE y trata de comenzar a programar tus sitios de esta manera, pues es hasta ahora lo mejor para posicionamiento web.

  21. ivan ramos 17.12.2007 - 15:08 - #

    hola a todos
    estoy tatando de hacer un sitemap , bueno gracias por la info igual me estoy agarrando de los pelos.
    saludos

  22. Recetas 03.01.2008 - 07:48 - #

    Yo siempre intento tener mi sitemap actualizado. Además me he percatado que contra más lo actualices (sin trampas) con mayor frecuencia pasa el boot de google por tu web.

  23. Exito 06.02.2008 - 09:31 - #

    Me gustaría saber como utilizar un sitemap con blogger para mi sitio web.

  24. Patricia 23.02.2008 - 14:19 - #

    Tengo una duda, que significa el T01:00:00-07:00 en el atributo lastmod=”2008-02-23T01:00:00-07:00″

  25. ouali benmeziane 13.03.2008 - 10:11 - #

    una preguna gerard,

    has dicho que mejor poner el sitemap en el dominios que en directorio.

    pero en caso de tene runa web con estructura muy complicada, no piensas que es mas claro y mas facil de leer si hacemos un sitemape por categoria ?

    saludos
    ouali benmeziane
    seo experto barcelona

  26. ouali benmeziane 13.03.2008 - 10:14 - #

    error mi url : searchengineoptimiser.wordpress.com/

  27. Ouali Benmeziane 05.05.2008 - 09:44 - #

    El mejor Generator de SItemap que conozco es xml-sitemaps.com

    muy sencillo de usar y te saca el sitemap en todos los formatos..
    :+)
    ouali benmeziane
    seo consultant

  28. Posicionamiento 05.05.2008 - 09:45 - #

    y ademas es divertido de ver como ven tu web los spiders..

Deja tu Comentario


Maestros del Web se reserva el derecho de moderación de los comentarios. Evita utilizar palabras soeces, ataques directos, descalificativos, insultos, de lo contrario tu comentario será eliminado.


Boletín

Agrega nuestro feed a  Netvibes
wikio Add to Technorati Favorites

-


Maestros del Web es el punto de encuentro para los entusiastas de la red.

© Copyright 1997 - 2008 Maestros del Web. | CMS: Wordpress