Maestros del Web


Estás en Inicio / Editorial / SEO

06.07.2006

Optimizando una web con urls amigables con Apache y PHP

En este manual usted aprenderá cómo optimizar de manera sencilla una web dinámica hecha en PHP, cuyas urls pasadas a los enlaces contengan extensas variables mediante GET, a una web cuyas URL sean amigables (fáciles de recordar).

Los que programamos en PHP, o bajo cualquier otro lenguaje de programación orientado a web, por lo general tendemos a pasar datos de una web origen a otra destino mediante variables del tipo GET generando enlaces tal como:

http://www.tiperu.com/index.php?mod=ecommerce&producto=tienda&op=3 que difícilmente son indexadas por algunos buscadores y lo que es peor aún: son nada asimilables por un usuario común (a este grupo de URL las llamaremos URL extensas para efectos del presente artículo).

Si lo vemos desde esa perspectiva justo sería afirmar que las web dinámicas tienen desventajas en ese ámbito sobre las web estáticas del tipo http://www.tiperu.com/ecommerce.html que son mucho más fáciles de recordar por su simpleza y carencia de variables vía GET, a este tipo de URL las conocemos (y me referiré a ellas en adelante) como URL amigables.

Quiero dejar en claro que lejos de la división convencional entre lo que son web estáticas o dinámicas en este manual me referiré a ambas en función a la diferencia de URL especificadas en el párrafo anterior  hecha la aclaración continuo con el artículo.

Felizmente para los que usamos Apache como servidor web, conjuntamente con PHP, esto tiene solución gracias al módulo mod_rewrite (URL Rewriting Engine) que nos permitirá mediante unas cuantas reglas transformar nuestras URL extensas en URL amigables.

Si bien es altamente aconsejable aprender el correcto manejo del mod_rewrite y sus correspondientes reglas, en este artículo no se hará explicación extensiva del mismo.

Debido a que el objetivo principal, es mostrar al lector cómo optimizar una web de URL extensas a URL amigables; con esto quiero dejar claro que se asume que el lector posee un website ya creado con URL extensas y desea pasarlas fácilmente a URL amigables “en un dos por tres”.

Preparando el archivo “.htaccess”:

El archivo .htaccess nos permite pasarle información al servidor Apache para que cumpla ciertas reglas de configuración en la carpeta que lo contenga, por tal motivo debemos copiar este archivo en la carpeta que contengan los archivos php en los cuales realizaremos los cambios de URL:

Options +FollowSymLinks
RewriteEngine on
#4 variables
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5&$6=$7&$8=$9
#3 variables
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5&$6=$7
#2 variables
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
#1 variable
Rewriterule ^(.*)/(.*),(.*)/$ $1.php?$2=$3

En las dos primeras líneas nos aseguramos de que esté activado el mod_rewrite en el Apache (si esto no funciona deberá comunicarse con su administrador para que active el módulo en el servidor).

Las líneas antecedidas por “#”, como las 3, 5, 7 y 9 ; son simplemente comentarios, no los tome en cuenta.

En las líneas 4, 6, 8 y 10 se establecen las reglas que nos permitirán transformar nuestras URL extensas en amigables. Analizaremos aquella que permite transformar dos variables, las demás son similares:

Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5

La expresión (Rewriterule) es la que nos permitirá escribir la regla en el Apache. La cadena (^(.*)/(.*),(.*)/(.*),(.*)/$) permite escribirá la URL amigable, inicia desde el caracter ^ hasta el $. Y finalmente la cadena ($1.php?$2=$3&$4=$5) es nuestro URL extenso. La transformación se hará de la siguiente manera:

De URL extensa:

./index.php?categoria=monitores&productoID=12345

En URL amigable:

./index/categoria,monitores/productoID,12345/

Como se puede apreciar la regla tomara el nombre del script y le quitara la extensión “.php” para tomarlo como un directorio (nótese la parte en negritas):

Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5

./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/

Seguidamente toma el primer par ?valor=variable y lo transfroma en una subcarpeta valor,variable/:

Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5

./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/

Y finalmente hace lo propio con el par &valor=variable y lo transforma en una subcarpeta valor,variable/:

Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5

./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/

Como ya se habrá dado cuenta, los valores antecedidos por el símbolo dólar ($) en la parte de las URL extensas reemplazan a los (.*) de las URL amigables.

Bueno ya tenemos el archivo .htacces que nos permitirá lograr los resultados que deseamos a nivel del servidor, ahora procederemos a crear el script php que nos permita cambiar nuestras URL extensas en amigables sin tener que hacer ninguna modificación directa en los “N” enlaces que posea nuestro sitio web.

Generando el script en php:

El script php que se usaremos se encargará básicamente de tomar la URL extensa, si esta ha sido pasada mediante el método GET, y la transformará en una URL amigable a la cual redireccionará usando la función header.

Puesto que header redireccionará hacia la misma web, y esto causará lo que se conoce como un bucle infinito, se hará uso de variables de sesión que nos ayuden a evitar tal inconveniente.

Por tal motivo nuestro script se seccionará en 2 partes: la primera irá en las primeras líneas de todas las páginas a las que aplicaremos el script, y la segunda parte (encargada de limpiar la variable de sesión) irá al final de las páginas.

Aclarados los detalles, explicaré mediante comentarios el script php:

<?php

//Iniciamos o continuamos la sesión encargada de evitar el bucle infinito

	session_name("url_amigable");
	session_start(); //Almacenamos datos del server, script y variables (pasadas por GET)
	$Server=$_SERVER[´SERVER_NAME´];
	$Script=$_SERVER[´PHP_SELF´];
	$Variables=$_SERVER[´QUERY_STRING´]; //Verificando si tiene variables por GET

//y no se han pasado datos mediante un form por POST, ya que al redireccionar un post puede ocasionar errores.
//también verificamos que la variable de sesión ‘Listo’, sea diferente a 1, esto nos eviara un bucle infinito.

	if(!empty($Variables) & $_SERVER[’REQUEST_METHOD’]==’GET’ && $_SESSION[’Listo’]!=1){

//Si tiene variables pasadas por GET se procede a hacer el cambio.
//1. Agrupando $Variables por “variable=valor” en el array $Variable.

$Variable=explode(”&”,$Variables);
//2. Sustituyendo “=” por “,” y concadenandolo en variable $Amigable.
($i=0; $i < count($Variable); $i++){
$Amigable.="/".str_replace("=",",",$Variable[$i]);
} //3. Quitando la extension “.php” a $Script para simular un directorio.

$Dir=str_replace(”.php”,”",$Script); //4. Generando la URL Amigable.
$URL_AMIGABLE=”http://”.$Server.$Dir.$Amigable.”/”;
//5. Colocando la variable de sesión ‘Listo’ a 1 para evitar el bucle infinito al redireccionar la web.

$_SESSION[’Listo’]=1;
//6. Redireccionando a la url amigable

header(”Location: $URL_AMIGABLE”);
//7. Exit hará que culmine hasta este punto el script, si no estuviera ‘exit’el script continuaría ejecutándose y llegaría hasta el final del mismo, es decir,
// a la parte donde colocamos a la variable de sesión ‘Listo’ en cero, originándose, entonces un bucle infinito.
exit;

}//Cambie $_URL_BASE por la ruta raiz de su web, ya que al simular la url amigable.
//directorios, hará que no muestre adecuadamente los orígenes de los recursos que llama su página web.

$_URL_BASE="http://”.$Server.”/pruebas/url_amigable/index.php";
?>
<html>
<head>
<title >URL Amigables</title>
<base href = "<? echo $_URL_BASE; ?>" target="_top" />
</head>
<body>
<!-- Aquí el contenido de su página web -->
</body>
</html>
<?php
//Limpia el posible bucle, es decir, se puede volver a hacer el envío.
$_SESSION[’Listo’]=0;
?>

Recomendaciones finales:

Como habrán podido ver el script no es complicado, y la adaptación a una web ya constituida tampoco lo será. Ya he probado la técnica en uno de mis proyectos (de manera local) y me ha funcionado bastante bien.

Lo que sí quiero aclarar es que al momento de testear esta técnica en una url de 5 variables a más me generó errores (básicamente no encuentra la url amigable generada); una url de 4 variables redirecciona correctamente, pero si luego de ello refresco el navegador genera el mismo error, es decir, no (re)carga la url amigable.

Mi consejo es que usen esta técnica en una url de 3 a menos de 3 variables pasadas por GET y personalicen este script a sus necesidades. Y como es lógico, les aconsejo bastante informarse más sobre el uso del mod_rewrite en Apache, creanme que les aliviará más de un dolor de cabeza.

Finalmente les diré que pueden descargarse el script desde aquí: url_amigable.zip.

Este artículo fue publicado originalmente en willy.tiperu.com.

Califica esta nota:

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (5 votos, promedio: 3.2 de 5)
Loading ... Loading ...
William Wong Garay

Sobre el autor

William Wong Garay
De origen peruano, es desarrollador web autodidacta, amante del software y filosofía libre y la ética hacker.

Si eres nuevo en Maestros del Web y te agradan nuestras publicaciones, te invitamos a suscribirte a nuestro Feed.

Sindícanos en: Google Reader, Bloglines, My Yahoo o My MSN | ¿Qué es el Feed?

Comentarios

21 comentarios en total.

  1. Mario 08.07.2006 - 05:00 - #

    El texto no se puede leer bien, ya que lee cosas como “Este artículo fue publicado originalmente en  willy.tiperu.com por William Wong Garay.”

  2. Carla 14.07.2006 - 13:11 - #

    Y como se puede hacer los mismo pero con Microsoft y ASP?

  3. William Wong Garay 14.07.2006 - 17:47 - #

    Saludos comunidad, hola Carla… pues cureoseaba en los anuncios que salen en los google adsense de mi articulo y note que uno de ellos hablaba de un modulo similar pero para IIS de MS, revise someramente su web y hay una version libre y otra de paga, lo puedes ver en http://www.isapirewrite.com/ el modulo se llama isapi_rewrite. Espero te sea de utilidad y nos cuentes al respecto.

    En cuanto a Mario, pues te pediria que seas mas especifico con tu crítica.

    Nos vemos…

  4. Alex Rettig - globalMac.c 17.07.2006 - 12:18 - #

    Hola!
    Un jakarito me dió este url amigable ;-) -semanas después de propias investigaciones habiéndolo implementado con éxito en http://www.blogalmac.cl y http://www.globalmac.cl-
    Comparto otras fuentes:
    http://www.alistapart.com/articles/succeed
    http://www.seochat.com/seo-tools/url-rewriting/
    Gran artículo! felicitancias :-)

    // http://www.globalmac.cl //

  5. Saul_HarmFul 21.07.2006 - 07:44 - #

    no uses asp :)

  6. Cesar Camacho. 22.07.2006 - 02:03 - #

    emm habia leido esto antes, pero no encuentro que sea de gran utilidad. creo que justamente la garantia de ocupar GET , es que le permite al usuario es ir cambiando valores para ir obteniendo nuevos resultados. Creo que es muy rebuscado tal situacion.

  7. Marcelo 02.08.2006 - 15:48 - #

    muy bueno el articulo, yo tengo una pregunta, quiero hacer un rewrite rule para un listado con paginacion:

    quiero que quede asi, ej.:

    /manuales/id34/php/ (pagina 1)
    /manuales/id34/php/1/ (tambien pagina 1)
    /manuales/id34/php/2/ (pagina 2)
    /manuales/id34/php/3/ (pagina 3)
    ?. (etc.)

    Hay una forma de hacerlo? porque intente pero no me sale:

    RewriteRule manuales/(.*)/(.*)/(.*)/$ /manuales/listado.php?id=$1&tit=$2&pag=1

    Con esa regla me sale error al poner sin el /1/ de paginacion, intente poner dos reglas, una debajo de la otra pero tampoco va. Existe algo para agregar o alguna forma de hacerlo?

    Ojala puedan ayudarme! GRacias!

  8. Bane 20.11.2006 - 09:47 - #

    Yo utilice la informacion otorgada en este sitio que encuentro mas sencillo y aplique de manera exitosa:

    http://www.tutorial-enlace.net/tutorial-P%E1ginas_din%E1micas_y_buscadores-825.html

    Recomiendo eso si que los links sean absolutos y no relativos, es decir /urlamipagina.php en vez de ../urlamipagina.php por ejemplo.

    Pueden ver su utilizacion en http://www.war2hobby.cl/noticias.php

  9. RULO 24.11.2006 - 11:54 - #

    Lo que estaba buscando. Gracias por el artículo.

  10. Gustavo 26.12.2006 - 12:19 - #

    Como hace google para esconder la extensión..(google.com/search?..)

  11. presidente 16.01.2007 - 11:07 - #

    q me recomiendan ya logre

    mod
    nombre_del_articulo.html
    nombre-del-articulo.html
    nombre/del/articulo.html
    nombre+del+articulo.html
    cual es mejor para google yo creo q el ultimo porq el buscador de google busca nombre+del+articulo
    yo creo q este es magnifico opiniones

  12. Quasi 08.02.2007 - 12:40 - #

    A mi me ha parecido interesante el artículo. Junto con el y algunos otros se puede empezar a entender el mod_rewrite, gracias ;D

  13. Saul_HarmFul 21.02.2007 - 14:09 - #

    Saul_HarmFul porque dices que no usen ASP?, di 2 razones logicas con suficiente peso

  14. Freddy 22.02.2007 - 09:57 - #

    Hola, quisiera saber, como darle al final la extension.html al momento de pasar los valores.

  15. William Wong G. 03.03.2007 - 08:08 - #

    Saludos Freddy… debes usar \.html al final de tu regexp para lograr tal efecto. Ojo con el “\.”, este valor de escape te permitirá usar el “.” en tu expresión regular.

  16. danraf77 28.11.2007 - 17:32 - #

    hay otra manera de hacer urls amigables sin el uso de .htaccess? mi servidor no me deja subir dicho archivo ya me lo dijo, es yahoo hosting

  17. Josué Ramos 08.12.2007 - 08:16 - #

    Hola, felicidades por el tutorial. Sólo quería añadir dos cosas:

    1. Para que el .htaccess funcione correctamente hay que añadir el flag [L] al final de cada línea o sino la primera variable despues del nombre del archivo siempre tendrá el valor de la última ya que seguirá cambiando los valores línea por línea.

    2. No es necesario especificar las rutas absolutas en cada enlace interno. Se puede solucionar facilmente añadiendo la línea al header.

    Un saludo.

  18. Josué Ramos 08.12.2007 - 08:21 - #

    Vaya, no salió el código html para el head… es el siguiente:

    (head)
    (base href=”dominio.com” /)
    (/head)

    Hay que cambiar los parentesis por los sígnos de abrir y cerrar comando.

  19. David 28.02.2008 - 08:31 - #

    Este tutorial es lo que exactamente estaba buscando, lo he entendido en un 50%, la parte que no entiendo es como instalar o como llamar al script que convierte las URL largas en amigables. Es decir, en el archivo que descargue esta un index.php, pero tengo que sustituir este archivo por el index de mi sitio?.. espero haberme dado a entender… gracias.

  20. javier 27.04.2008 - 12:48 - #

    Hola,estoy haciendo un sito de busqueda de videos. Ya tengo cambiado el htaccess, pero lo que quiero es que cuando alguien escribe su busqueda y pulsa buscar en un formulario, la pagina que devuelva los resultados no sea por ejemplo : http://www.isinvideo.com/buscar.php?busco=“sexo”
    sino asi
    http://www.isinvideo.com/buscar/sexo.html

  21. Alquiberia 01.05.2008 - 10:35 - #

    Muy buenas. Tengo una pequeña duda.
    Tengo implementado el mod_rewrite en mi web:
    http://www.alquiberia.es
    Pero tengo un problema cuando supero las 10 variables. Todo funciona perfectamente mientras no supere las 10 variables.
    Por ejemplo:
    Rewriterule ^([^/]+)-([^/]+)/([^/]+)-([^/]+)/([^/]+)-([^/]+)/([^/]+)-([^/]+)\.html$ index.php?$1=$2&$3=$4&$5=$6&$7=$8 [NC,L]

    Funciona perfectamente pero si supero las 9 variables falla y mezcla el valor de las variables.

    Alguna sugerencia???

    Gracias

Trackbacks

1 trackbacks en total.

  1. Url inteligentes - Foros del Web
Deja tu Comentario


Maestros del Web se reserva el derecho de moderación de los comentarios. Evita utilizar palabras soeces, ataques directos, descalificativos, insultos, de lo contrario tu comentario será eliminado.


Boletín

Agrega nuestro feed a  Netvibes
wikio Add to Technorati Favorites

-


Maestros del Web es el punto de encuentro para los entusiastas de la red.

© Copyright 1997 - 2008 Maestros del Web. | CMS: Wordpress