Un espacio para los entusiastas del web

Rastrear a los robots de buscadores!

Publicado el 31 de Enero, 2005

En esta oportunidad les comentaré sobre la forma de hacer un rastreo del comportamiento o interactividad de los buscadores y nuestra web por medio de funciones PHP.

Rastrear a los robots de buscadores!El siguiente artículo ayudará a rastrear motores de búsqueda por medio de las funciones de PHP $HTTP_USER_AGENT y $QUERY_STRING

Lo primero que vamos hacer es defnir el buscador al que vamos a rastrear. En este ejemplo utilizaremos a Google aprovechando que lidera el mercado.

Veamos el siguiente código php que debe usarse en todas las páginas de nuestra web que se encargarán de rastrear al robot (se sugiere utilizar este código en un solo archivo y luego incorporarlo por medio de la función include a todas las demás páginas):

<?php
  if(eregi("google",$HTTP_USER_AGENT))
  {
  if ($QUERY_STRING != "")

  {$url = "http://".$SERVER_NAME.$PHP_SELF.'?'.$QUERY_STRING;}
  else
  {$url = "http://".$SERVER_NAME.$PHP_SELF;}
  $today = date("F j, Y, g:i a");

  mail("webmaster@jjcreaciones.com", "Se ha detectado un robot de Google en http://$SERVER_NAME",
"$today - Google ha indexado la página $url.\n
..:: OTRA PÁGINA MAS :) ::..");
  }

  ?>

Este script reconoce al robot de google y la página en la cual realizo el escáneo, y envía un mail al webmaster de la página con los datos fecha y hora del suceso y nos da un breve mensaje de aliento (Un toque de estimulo no vine mal cierto), claro también se puede almacenar en una base de datos etc.

Es cuestión de inventar y ya les dí la base para empezar.

Ahora bien para los demás buscadores solo basta con cambiar:

("google",$HTTP_USER_AGENT)

por el nombre respectivo al robot, ejemplo:

- Google: ("google",$HTTP_USER_AGENT )

- Yahoo: ("slurp",$HTTP_USER_AGENT )

- Altavista: ("scooter",$HTTP_USER_AGENT)

Si quieren utilizar algún otro robot, el listado de todos los robots está disponible en robotstxt.org

Espero que les sirva.

Compartir conocimientos es de inteligentes!

Otros artículos relacionados

Califica esta nota:

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (2 votos, promedio: 5.00 de 5)
Loading ... Loading ...

Comentarios

  1. elututo

    Disculpen la ignorancia, pero Para que sirve rastrear un buscador? que beneficios nos da?

    Saludos y gracias


  2. josemi

    Hola,

    Ya se que solo es una guia, pero el codigo estaria mejor usando el array superglobal $_SERVER, para que este mas actualizado:
    [PHP]
    < ?php
    if(eregi(”google”,$_SERVER['HTTP_USER_AGENT']))
    {
    if ($_SERVER['QUERY_STRING'] != “”)
    {$url = “http://”.$_SERVER['SERVER_NAME'].$_SERVER['PHP_SELF'].’?’.$_SERVER['QUERY_STRING'];}
    else
    {$url = “http://”.$_SERVER['SERVER_NAME'].$_SERVER['PHP_SELF'];}
    $today = date(”F j, Y, g:i a”);
    mail(”webmaster@jjcreaciones.com”, “Se ha detectado un robot de Google en http://{$_SERVER['SERVER_NAME']}”,
    “$today - Google ha indexado la página $url.\n
    ..:: OTRA PÁGINA MAS :) ::..”);
    }
    ?>
    [/PHP]
    Personalmente no creo que sea lo mejor recibir un email cada vez googlebot visita una pagina. ¿Cuantos emails generaria este script en forosdelweb?

    Creo que lo mejor para seguir las visitas de los robots son los logs del servidor (por ejemplo, una vez a la semana). Los logs contienen mucha informacion util (comportamiento de los usuarios en tu web, terminos de busqueda por los que llegan tus visitantes desde los buscadores, …).

    Otra cosa es que no tengas acceso a los logs del servidor, en ese caso recomendaria usar un script php que realice ese mismo trabajo.

    Saludos.


  3. juliodudu

    Si ami tambien me parece mejor, pero tambien depende al usuario, ademas google lo mas que puede visitar es una vez al dia o me equivoco?


  4. lisandro Arg

    Rastrear a los robots de buscadores ???

    El titulo y el copete no me dicen nada de la nota, creo que habria que mejorarlos para que se entienda que es lo que se esta por lograr al rastrear a un buscador…


  5. wap

    Ha sido de ayuda, gracias.


  6. Carlos

    Pero es que la gente es malagredecida carajo !! este articulo es un tip, idea, consejo o como quieran llamarlo.. solo para que estimulen su creatividad para ver las diferentes maneras de como pueden usar el lenguage php. quizas a alguno le parecio interesante este script, quizas para otros no, pero porque criticar o quejarse ??? Hey webmaster !! Gracias por el articulo y el script, la verdad esta interesante….


  7. claudia

    Jorge, podrias explicar mejor? no entendi bien para q sirve, gracias


  8. kikegavilan

    Para que sirve ?
    Yo si le encontre utilidad.
    Gracias.
    http://www.empresario.com.mx

    // http://www.empresario.com.mx //


  9. maresme

    Hola haber si me ayudais sobre el script lo he probado y va bien solo una cosa que al devolver la url solo me envia la del servidor osea si pongo en http://www.mundohotelonline.com/index y otra pagina con el mismo dominio pero otro directorio siempre sale el del index.
    Me podrias decir aque puede ser
    gracias
    buen script

    // http://www.mundohotelonline.com //


  10. maresme

    Hola perdonar el anterior tema pues esta mañana llegaron las otra paginas va de maravilla.
    Solo una pregunta sobre las entradas de google por las llegada de los e-mails veo que la pagina index el robot lo visita muy a menudo es normal esto gracias.
    maresme


  11. Jorge

    A ver, para los que no saben para que sirve este script, por ejemplo yo lo uso cuando creo una sección nueva o página adicional para saber cuando pasa en buscador, pero también lo uso introduciendo los resultados en una base de datos y contabilizo las veces que pasa el buscador por determinada página y veo que importancia le da el buscador a esta página tomando en cuenta que mientras mas veces pasa el buscador por esta página más importancia debería tener, esta es una de tantas formas de analizar cual es la mejor forma de mostrar el contenido en las páginas para los buscadores. por supuesto el script que publique es un método, una idea, una base, lo demás queda de parte de la persona que le interese buscar otra forma de usarlo. Y a los que critican, cada quien tiene su opinión pero les comento yo me tome un momento de mi tiempo para compartir esta idea con todos y despertar la creatividad, ideas, inventiva y si por alguna razón no le ven utilidad al script lamento que no tengan la inventiva o creatividad para usar este pequeño aporte. saludos


  12. Jano

    Muy bueno el articulo, hoy mismo implementaré esta aplicación php en mi sitio.
    Gracias


  13. Andrë

    Es muy buen tip si quieres llevar un control del progreso de un sitio web. Eñ dato seria utilizar esto para provar que keyword esta siendo mas efectivo.

    Saludo a todos


  14. Jhonn Blackam

    Yo lo implemente en mi sitio http://www.ebpi.com.ar y le agregue solo el de yahoo. Me devolvio datos que voy a evaluar dentro de un mes para ver si sirven de estadisticas

    // http://www.ebpi.com.ar //


  15. perdonar mi ignorancia, pero cosas como esta son la leche para quien empieza una web. Por otro lado, sabeis donde encontrar + info del include ??? es que tengo directorio de hoteles que son ciento y la madre, y para colocar es script en cada uno de ellos se ha interminable. Mil gracias.


  16. aprendiz

    yo tampoco tengo idea de para que sirve reastrear a un buscador???


  17. Se ve interesante, lo implementare mas adelante en mi web, pues el log de esta depende de la cantidad de documentos que consulto el navegante y si fueron muchos a lo mucho solo veo las estadisticas de uno o dos usuarios.


  18. La idea es buena , pero lo implementaria mejor en una base de datos en mysql y asi podria hacer una estadistica de tiempos de visita ,etc .

    Salu2

    http://www.merur.com


  19. Puedes explicar como poner el script include en todas las paginas porque no entiendo en que parte poner ese codigo PHP.

    Gracias excelente aporte para todo webmaster.


  20. Mario

    el robot debe rastrear tu web desde cualquier buscador


  21. ¿Funciona para todos los servidores o solo para algunos? Pregunto porque me funciona bien en paginas que tengo alojadas en terra, pero tengo otra en otro servidor y no me funciona.


  22. Hola quisiera saber si este escipt lo tengo q insertar depues de la etiqueta o despues de la etiqueta gracias espero q me respondan


Deja tu Comentario

Maestros del Web se reserva el derecho de moderación de los comentarios. Evita utilizar palabras soeces, ataques directos, descalificativos, insultos, de lo contrario tu comentario será eliminado.


Sobre el Autor

Jorge De Freitas

Jorge De Freitas
Diseñador Grafico, Webmaster, Programador de aplicaciones web (especialidades: Html, Php y Mysql), Asesor en tecnologías web y Desarrollador de proyectos web.

Más artículos de Jorge De Freitas

Las Notas en tu correo


Acerca de

Maestros del Web nace cuando intentamos traducir Webmaster al Español. Nacimos orientados al diseño y desarrollo web. Hoy somos un espacio de apoyo para los entusiastas que participan en proyectos en la red.
Leer más de Maestros del Web