HTTP - Definición
HTTP
HTTP es el protocolo de la Web (WWW), usado en cada transacción. Las letras significan Hyper Text Transfer Protocol, es decir, protocolo de transferencia de hipertexto. El hipertexto es el contenido de las páginas web, y el protocolo de transferencia es el sistema mediante el cual se envían las peticiones de acceder a una página web, y la respuesta de esa web, remitiendo la información que se verá en pantalla. También sirve el protocolo para enviar información adicional en ambos sentidos, como formularios con mensajes y otros similares.
HTTP es un protocolo sin estado, es decir, que no guarda ninguna información sobre conexiones anteriores. Al finalizar la transacción todos los datos se pierden. Por esto se popularizaron las cookies, que son pequeños ficheros guardados en el propio ordenador que puede leer un sitio web al establecer conexión con él, y de esta forma reconocer a un visitante que ya estuvo en ese sitio anteriormente. Gracias a esta identificación, el sitio web puede almacenar gran número de información sobre cada visitante, ofreciéndole así un mejor servicio.
La versión actual de HTTP es la 1.1, y su especificación está en el documento RFC-2616.
HTTP dispone de una variante cifrada mediante SSL llamada HTTPS.
Transacciones HTTP
El protocolo HTTP es un protocolo sin estado; está basado en el modelo cliente-servidor: Un cliente HTTP abre una conexión y realiza su solicitud al servidor, el cual responde generalmente el recurso solicitado y la conexión se cierra.
El formato tanto del mensaje como de la respuesta es como sigue:
<Línea inicial> Header-1: value-1 ... Header-n: value-n <Cuerpo del mensaje (Opcional)>
La línea inicial es diferente en las solicitudes y en las respuestas. En las solicitudes van tres campos separados por un espacio en blanco: "Método recurso versiónDelProtocolo". Por ejemplo: "GET /path/to/file/index.html HTTP/1.0". La línea inicial de una respuesta tiene tres campos separados por un espacio: "versiónDelProtocolo códigoRespuesta Mensaje". Por ejemplo: "HTTP/1.0 200 OK" o bien "HTTP/1.0 404 Not Found".
Los encabezados están normados en el protocolo, e incluyen, en el caso de una solicitud, información del navegador y eventualmente del usuario cliente; En el caso de una respuesta, información sobre el servidor y sobre el recurso. El cuerpo del mensaje contiene el recurso a transferir o el texto de un error en el caso de una respuesta. En el caso de una solicitud, puede contener parámetros de la llamada archivos enviados al servidor.
Ejemplo de un dialogo HTTP
Para obtener un recurso con el URL http://www.tuhost.com/index.html
- Se abre un socket con el host www.tuHost.com, puerto 80 que ese el puerto por defecto para HTTP.
- Se envía un mensaje en el estilo siguiente :
GET /index.html HTTP/1.0 From: yo@miHost.com User-Agent: HTTPTool/1.0 [Línea en blanco]
La respuesta del servidor está formada por encabezados seguidos del recurso solicitado, en el caso de una página web:
HTTP/1.0 200 OK Date: Fri, 31 Dec 2003 23:59:59 GMT Content-Type: text/html Content-Length: 1221 <html> <body> <h1>Página principal de tuHost</h1> (Contenido) . . . </body> </html>
Al recibirse la respuesta, el servidor cierra la comunicación. Cabe señalar que los principales navegadores web no muestran al usuario los encabezados HTTP del recurso. Para visualizar tales encabezados pueden utilizarse herramientas conocidas genéricamente como "visores HTTP". Son especialmente cómodos de utilizar los visores HTTP on-line. Se puede acceder a gran variedad de estas herramientas buscando "http viewer" en cualquier buscador automático. En español no existe tanta abundancia de visores HTTP on line: podemos señalar, por ejemplo, el visor sencillo que ofrece www.cibernetia.com.
Herramientas de Software libre
- Apache httpd server Apache ha sido el servidor web más difundido desde 1996. La encuesta de Netcraft de abril de 2005, muestra que alrededor del 70% de los servidores web utilizan Apache, y la parte de mercado crece de año en año.
- Jigsaw - W3C's Server
- Roxen
- Zope : Un poderoso servidor web implementado en python con soporte para conexiones a bases de datos, extensibilidad sencilla y administración vía web.
Primeros Servidores
Glosario
Sockets
Son puntos de comunicación. Se clasifican en físicos (asociados a un recurso) o lógicos (manejados por el sistema de operación). Tres elementos caracterizan a un socket: El nombre del servicio (telnet, ftp, etc.), el protocolo (TCP, UDP, etc.) y el número de puerto. En linux, el archivo /etc/protocols contiene la lista de protocolos disponibles y /etc/services contiene la lista de servicios disponibles. Por ejemplo, en la configuración inicial de la mayoría de los sistemas Linux se tiene que:
- el servicio telnet utiliza el protocolo TCP/IP y se comunica por el puerto 23
- el servicio ftp utiliza el protocolo TCP/IP y se comunica por los puertos 20 y 21
- el servicio WWW utiliza el protocolo HTTP y se comunica por el puerto 80.
- el servicio WebDAV para desarrollo en colaboración utiliza el protocolo HTTP como transporte.
- CORBA, el marco para compartir objetos y servicios en la red puede utilizar el protocolo HTTP como transporte.
Recursos
HTTP se utiliza para transmitir recursos, que incluyen además de archivos, el resultado de la ejecución de un programa, una consulta a una base de datos, la traducción automática de un documento, etc. Para un servidor HTTP, los recursos son o bien archivos, o bien el resultado de la ejecución de un programa.
URL
Los recursos se identifican con un URL o "Universal Resource Locator" que es un identificador único en el mundo que se asocia con el recurso dado.
Códigos de respuesta
Son códigos de tres dígitos:
- 1xx Mensajes de información
-
N° Tipo de error 100 Continua 101 Cambio de protocolo
- 2xx Operación exitosa
-
N° Tipo de error 200 OK 201 Creado 202 Aceptado 203 Información no oficial 204 Sin Contenido 205 Contenido para reset 206 Contenido parcial
- 3xx Redirección hacia otro URL
-
N° Tipo de error 300 Múlpiples posibilidades 301 Mudado permanentemente 302 Encontrado 303 Véa otros 304 No modificado 305 Utilice un proxy 307 REdirección temporal
- 4xx Error por parte del cliente
-
N° Tipo de error 400 Solicitud incorrecta 401 No autorizado 402 Pago requerido 403 Prohibido 404 No encontrado 405 Método no permitido 406 No aceptable 407 Proxy requerido 408 Tiempo de espera agotado 409 Conflicto 410 No mpas disponible 411 Requiere logitud 412 Falló precondición 413 Entidad de solicitud demasiado larga 414 URI de solicitud demasiado largo 415 Tipo de medio no soportado 416 Rango solicitado no disponible 417 Falló expectativa
- 5xx Error por parte del servidor
-
N° Tipo de error 500 Error interno 501 No implementado 502 Pasarela incorrecta 503 Servicio no disponible 504 Tiempo de espera de la pasarela agotado 505 Versión de HTTP no soportada
Comentarios
Publicar un comentario