Estás en Inicio / Editorial / SEO
06.07.2006
En este manual usted aprenderá cómo optimizar de manera sencilla una web dinámica hecha en PHP, cuyas urls pasadas a los enlaces contengan extensas variables mediante GET, a una web cuyas URL sean amigables (fáciles de recordar).
Los que programamos en PHP, o bajo cualquier otro lenguaje de programación orientado a web, por lo general tendemos a pasar datos de una web origen a otra destino mediante variables del tipo GET generando enlaces tal como:
http://www.tiperu.com/index.php?mod=ecommerce&producto=tienda&op=3 que difícilmente son indexadas por algunos buscadores y lo que es peor aún: son nada asimilables por un usuario común (a este grupo de URL las llamaremos URL extensas para efectos del presente artículo).
Si lo vemos desde esa perspectiva justo sería afirmar que las web dinámicas tienen desventajas en ese ámbito sobre las web estáticas del tipo http://www.tiperu.com/ecommerce.html que son mucho más fáciles de recordar por su simpleza y carencia de variables vía GET, a este tipo de URL las conocemos (y me referiré a ellas en adelante) como URL amigables.
Quiero dejar en claro que lejos de la división convencional entre lo que son web estáticas o dinámicas en este manual me referiré a ambas en función a la diferencia de URL especificadas en el párrafo anterior hecha la aclaración continuo con el artículo.
Felizmente para los que usamos Apache como servidor web, conjuntamente con PHP, esto tiene solución gracias al módulo mod_rewrite (URL Rewriting Engine) que nos permitirá mediante unas cuantas reglas transformar nuestras URL extensas en URL amigables.
Si bien es altamente aconsejable aprender el correcto manejo del mod_rewrite y sus correspondientes reglas, en este artículo no se hará explicación extensiva del mismo.
Debido a que el objetivo principal, es mostrar al lector cómo optimizar una web de URL extensas a URL amigables; con esto quiero dejar claro que se asume que el lector posee un website ya creado con URL extensas y desea pasarlas fácilmente a URL amigables “en un dos por tres”.
El archivo .htaccess nos permite pasarle información al servidor Apache para que cumpla ciertas reglas de configuración en la carpeta que lo contenga, por tal motivo debemos copiar este archivo en la carpeta que contengan los archivos php en los cuales realizaremos los cambios de URL:
Options +FollowSymLinks RewriteEngine on #4 variables Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5&$6=$7&$8=$9 #3 variables Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5&$6=$7 #2 variables Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5 #1 variable Rewriterule ^(.*)/(.*),(.*)/$ $1.php?$2=$3
En las dos primeras líneas nos aseguramos de que esté activado el mod_rewrite en el Apache (si esto no funciona deberá comunicarse con su administrador para que active el módulo en el servidor).
Las líneas antecedidas por “#”, como las 3, 5, 7 y 9 ; son simplemente comentarios, no los tome en cuenta.
En las líneas 4, 6, 8 y 10 se establecen las reglas que nos permitirán transformar nuestras URL extensas en amigables. Analizaremos aquella que permite transformar dos variables, las demás son similares:
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
La expresión (Rewriterule) es la que nos permitirá escribir la regla en el Apache. La cadena (^(.*)/(.*),(.*)/(.*),(.*)/$) permite escribirá la URL amigable, inicia desde el caracter ^ hasta el $. Y finalmente la cadena ($1.php?$2=$3&$4=$5) es nuestro URL extenso. La transformación se hará de la siguiente manera:
De URL extensa:
./index.php?categoria=monitores&productoID=12345
En URL amigable:
./index/categoria,monitores/productoID,12345/
Como se puede apreciar la regla tomara el nombre del script y le quitara la extensión “.php” para tomarlo como un directorio (nótese la parte en negritas):
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/
Seguidamente toma el primer par ?valor=variable y lo transfroma en una subcarpeta valor,variable/:
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/
Y finalmente hace lo propio con el par &valor=variable y lo transforma en una subcarpeta valor,variable/:
Rewriterule ^(.*)/(.*),(.*)/(.*),(.*)/$ $1.php?$2=$3&$4=$5
./index.php?categoria=monitores&productoID=12345
./index/categoria,monitores/productoID,12345/
Como ya se habrá dado cuenta, los valores antecedidos por el símbolo dólar ($) en la parte de las URL extensas reemplazan a los (.*) de las URL amigables.
Bueno ya tenemos el archivo .htacces que nos permitirá lograr los resultados que deseamos a nivel del servidor, ahora procederemos a crear el script php que nos permita cambiar nuestras URL extensas en amigables sin tener que hacer ninguna modificación directa en los “N” enlaces que posea nuestro sitio web.
El script php que se usaremos se encargará básicamente de tomar la URL extensa, si esta ha sido pasada mediante el método GET, y la transformará en una URL amigable a la cual redireccionará usando la función header.
Puesto que header redireccionará hacia la misma web, y esto causará lo que se conoce como un bucle infinito, se hará uso de variables de sesión que nos ayuden a evitar tal inconveniente.
Por tal motivo nuestro script se seccionará en 2 partes: la primera irá en las primeras líneas de todas las páginas a las que aplicaremos el script, y la segunda parte (encargada de limpiar la variable de sesión) irá al final de las páginas.
Aclarados los detalles, explicaré mediante comentarios el script php:
<?php
//Iniciamos o continuamos la sesión encargada de evitar el bucle infinito
session_name("url_amigable");
session_start(); //Almacenamos datos del server, script y variables (pasadas por GET)
$Server=$_SERVER[´SERVER_NAME´];
$Script=$_SERVER[´PHP_SELF´];
$Variables=$_SERVER[´QUERY_STRING´]; //Verificando si tiene variables por GET
//y no se han pasado datos mediante un form por POST, ya que al redireccionar un post puede ocasionar errores.
//también verificamos que la variable de sesión ‘Listo’, sea diferente a 1, esto nos eviara un bucle infinito.
if(!empty($Variables) & $_SERVER[’REQUEST_METHOD’]==’GET’ && $_SESSION[’Listo’]!=1){
//Si tiene variables pasadas por GET se procede a hacer el cambio.
//1. Agrupando $Variables por “variable=valor” en el array $Variable.
$Variable=explode(”&”,$Variables);
//2. Sustituyendo “=” por “,” y concadenandolo en variable $Amigable.
($i=0; $i < count($Variable); $i++){
$Amigable.="/".str_replace("=",",",$Variable[$i]);
} //3. Quitando la extension “.php” a $Script para simular un directorio.
$Dir=str_replace(”.php”,”",$Script); //4. Generando la URL Amigable.
$URL_AMIGABLE=”http://”.$Server.$Dir.$Amigable.”/”;
//5. Colocando la variable de sesión ‘Listo’ a 1 para evitar el bucle infinito al redireccionar la web.
$_SESSION[’Listo’]=1;
//6. Redireccionando a la url amigable
header(”Location: $URL_AMIGABLE”);
//7. Exit hará que culmine hasta este punto el script, si no estuviera ‘exit’el script continuaría ejecutándose y llegaría hasta el final del mismo, es decir,
// a la parte donde colocamos a la variable de sesión ‘Listo’ en cero, originándose, entonces un bucle infinito.
exit;
}//Cambie $_URL_BASE por la ruta raiz de su web, ya que al simular la url amigable.
//directorios, hará que no muestre adecuadamente los orígenes de los recursos que llama su página web.
$_URL_BASE="http://”.$Server.”/pruebas/url_amigable/index.php";
?>
<html>
<head>
<title >URL Amigables</title>
<base href = "<? echo $_URL_BASE; ?>" target="_top" />
</head>
<body>
<!-- Aquí el contenido de su página web -->
</body>
</html>
<?php
//Limpia el posible bucle, es decir, se puede volver a hacer el envío.
$_SESSION[’Listo’]=0;
?>
Como habrán podido ver el script no es complicado, y la adaptación a una web ya constituida tampoco lo será. Ya he probado la técnica en uno de mis proyectos (de manera local) y me ha funcionado bastante bien.
Lo que sí quiero aclarar es que al momento de testear esta técnica en una url de 5 variables a más me generó errores (básicamente no encuentra la url amigable generada); una url de 4 variables redirecciona correctamente, pero si luego de ello refresco el navegador genera el mismo error, es decir, no (re)carga la url amigable.
Mi consejo es que usen esta técnica en una url de 3 a menos de 3 variables pasadas por GET y personalicen este script a sus necesidades. Y como es lógico, les aconsejo bastante informarse más sobre el uso del mod_rewrite en Apache, creanme que les aliviará más de un dolor de cabeza.
Finalmente les diré que pueden descargarse el script desde aquí: url_amigable.zip.
Este artículo fue publicado originalmente en willy.tiperu.com.
Califica esta nota:
William Wong Garay
De origen peruano, es desarrollador web autodidacta, amante del software y filosofía libre y la ética hacker.
Si eres nuevo en Maestros del Web y te agradan nuestras publicaciones, te invitamos a suscribirte a nuestro Feed.
Sindícanos en: Google Reader, Bloglines, My Yahoo o My MSN | ¿Qué es el Feed?
21 comentarios en total.
El texto no se puede leer bien, ya que lee cosas como “Este artículo fue publicado originalmente en willy.tiperu.com por William Wong Garay.”
Y como se puede hacer los mismo pero con Microsoft y ASP?
Saludos comunidad, hola Carla… pues cureoseaba en los anuncios que salen en los google adsense de mi articulo y note que uno de ellos hablaba de un modulo similar pero para IIS de MS, revise someramente su web y hay una version libre y otra de paga, lo puedes ver en http://www.isapirewrite.com/ el modulo se llama isapi_rewrite. Espero te sea de utilidad y nos cuentes al respecto.
En cuanto a Mario, pues te pediria que seas mas especifico con tu crítica.
Nos vemos…
Hola!
Un jakarito me dió este url amigable
-semanas después de propias investigaciones habiéndolo implementado con éxito en http://www.blogalmac.cl y http://www.globalmac.cl-
Comparto otras fuentes:
http://www.alistapart.com/articles/succeed
http://www.seochat.com/seo-tools/url-rewriting/
Gran artículo! felicitancias
// http://www.globalmac.cl //
no uses asp ![]()
emm habia leido esto antes, pero no encuentro que sea de gran utilidad. creo que justamente la garantia de ocupar GET , es que le permite al usuario es ir cambiando valores para ir obteniendo nuevos resultados. Creo que es muy rebuscado tal situacion.
muy bueno el articulo, yo tengo una pregunta, quiero hacer un rewrite rule para un listado con paginacion:
quiero que quede asi, ej.:
/manuales/id34/php/ (pagina 1)
/manuales/id34/php/1/ (tambien pagina 1)
/manuales/id34/php/2/ (pagina 2)
/manuales/id34/php/3/ (pagina 3)
?. (etc.)
Hay una forma de hacerlo? porque intente pero no me sale:
RewriteRule manuales/(.*)/(.*)/(.*)/$ /manuales/listado.php?id=$1&tit=$2&pag=1
Con esa regla me sale error al poner sin el /1/ de paginacion, intente poner dos reglas, una debajo de la otra pero tampoco va. Existe algo para agregar o alguna forma de hacerlo?
Ojala puedan ayudarme! GRacias!
Yo utilice la informacion otorgada en este sitio que encuentro mas sencillo y aplique de manera exitosa:
http://www.tutorial-enlace.net/tutorial-P%E1ginas_din%E1micas_y_buscadores-825.html
Recomiendo eso si que los links sean absolutos y no relativos, es decir /urlamipagina.php en vez de ../urlamipagina.php por ejemplo.
Pueden ver su utilizacion en http://www.war2hobby.cl/noticias.php
Lo que estaba buscando. Gracias por el artículo.
Como hace google para esconder la extensión..(google.com/search?..)
q me recomiendan ya logre
mod
nombre_del_articulo.html
nombre-del-articulo.html
nombre/del/articulo.html
nombre+del+articulo.html
cual es mejor para google yo creo q el ultimo porq el buscador de google busca nombre+del+articulo
yo creo q este es magnifico opiniones
A mi me ha parecido interesante el artículo. Junto con el y algunos otros se puede empezar a entender el mod_rewrite, gracias ;D
Saul_HarmFul porque dices que no usen ASP?, di 2 razones logicas con suficiente peso
Hola, quisiera saber, como darle al final la extension.html al momento de pasar los valores.
Saludos Freddy… debes usar \.html al final de tu regexp para lograr tal efecto. Ojo con el “\.”, este valor de escape te permitirá usar el “.” en tu expresión regular.
hay otra manera de hacer urls amigables sin el uso de .htaccess? mi servidor no me deja subir dicho archivo ya me lo dijo, es yahoo hosting
Hola, felicidades por el tutorial. Sólo quería añadir dos cosas:
1. Para que el .htaccess funcione correctamente hay que añadir el flag [L] al final de cada línea o sino la primera variable despues del nombre del archivo siempre tendrá el valor de la última ya que seguirá cambiando los valores línea por línea.
2. No es necesario especificar las rutas absolutas en cada enlace interno. Se puede solucionar facilmente añadiendo la línea al header.
Un saludo.
Vaya, no salió el código html para el head… es el siguiente:
(head)
(base href=”dominio.com” /)
(/head)
Hay que cambiar los parentesis por los sígnos de abrir y cerrar comando.
Este tutorial es lo que exactamente estaba buscando, lo he entendido en un 50%, la parte que no entiendo es como instalar o como llamar al script que convierte las URL largas en amigables. Es decir, en el archivo que descargue esta un index.php, pero tengo que sustituir este archivo por el index de mi sitio?.. espero haberme dado a entender… gracias.
Hola,estoy haciendo un sito de busqueda de videos. Ya tengo cambiado el htaccess, pero lo que quiero es que cuando alguien escribe su busqueda y pulsa buscar en un formulario, la pagina que devuelva los resultados no sea por ejemplo : http://www.isinvideo.com/buscar.php?busco=“sexo”
sino asi
http://www.isinvideo.com/buscar/sexo.html
Muy buenas. Tengo una pequeña duda.
Tengo implementado el mod_rewrite en mi web:
http://www.alquiberia.es
Pero tengo un problema cuando supero las 10 variables. Todo funciona perfectamente mientras no supere las 10 variables.
Por ejemplo:
Rewriterule ^([^/]+)-([^/]+)/([^/]+)-([^/]+)/([^/]+)-([^/]+)/([^/]+)-([^/]+)\.html$ index.php?$1=$2&$3=$4&$5=$6&$7=$8 [NC,L]
Funciona perfectamente pero si supero las 9 variables falla y mezcla el valor de las variables.
Alguna sugerencia???
Gracias
Maestros del Web es el punto de encuentro para los entusiastas de la red.
© Copyright 1997 - 2008 Maestros del Web. | CMS: Wordpress