Introducción a XML


Comenzaremos por una dato necesario :

XML = eXtensible Mark-up Language

La traducción del acrónimo XML sería Lenguaje de Marcado Extensible, pero esto no nos dice mucho… ni sobre el lenguaje ni su utilización .  XML es un lenguaje, esto es, un código, un conjunto acordado de signos para la comunicación. Pero es un lenguaje de marcado, lo que significa que sirve para modificar el significado de otros símbolos que se envían, para dotarlos de mayor significado. Y por último, es extensible, de modo que el conjunto de símbolos no es fijo, sino que puede ampliarse para que pueda abarcar prácticamente cualquier ámbito en el que sea preciso identificar —marcar— cualquier otro tipo de información.

Vamos a empezar con un ejemplo:

<documento>
<libro>
<titulo>Fahrenheit 451</titulo>
<autor>Ray Bradbury</autor>
</libro>
</documento>

En este ejemplo, podemos ver varias de las características de XML:

  • Se utilizan etiquetas, entre llaves angulares < >, para _marcar_, esto es, calificar, la información a la que rodean
  • Hay tres tipos de etiquetas, las de apertura, < >, y las de cierre, </ >, pero también están aquellas de  autocierre, que no rodean a ninguna otra información, y que son, por ejemplo, así: <br />
  • Las etiquetas no se entrecruzan, esto es, la última en abrirse siempre ha de ser la primera en cerrarse
  • El archivo XML es fácil de leer, no sólo para una computadora, sino también para una persona; en efecto, cualquiera puede entender que la información anterior se refiere a un libro.

El archivo anterior, en realidad, no es un documento XML válido, porque faltan un par de cosas: una etiqueta que lo identificase como archivo XML, y un modelo de datos que permitiera a otros programas comprobar la información.

Como se relaciona con el HMTL

Quien haya utilizado alguna vez  un editor web, pensará que existe un gran parecido entre XML y HTML(HyperText Mark-up Language, Lenguaje de Marcado para Hipertexto), y tendrá razón.

En realidad, tanto XML como HTML provienen de un lenguaje más antiguo, llamado SGML(Standard Generalized Mark-up Language), o Lenguaje Generalizado de Marcado Estándar. SGML es, en realidad, un meta-lenguaje, o lenguaje para describir lenguajes. Se utilizó en los años 60-70 para crear sistemas de gestión documental, y descripción de datos, pero la especificación era tan enorme, y había tantas sutilezas en su uso, que al final no ha tenido más utilización práctica que describir un par de lenguajes, HTML y XML.

En primer lugar se creo HTML, que era un conjunto de etiquetas para controlar la presentación de información en la entonces incipiente WWW (World Wide Web).

Posteriormente se creo el XML como subconjunto de SGML, de modo que XML también permite describir otros lenguajes, a través de ese modelo de datos, pero normalmente se utiliza para marcar, describir información que puede existir en muy diferentes formatos.

Como heredero de SGML que era, el lenguaje HTML estaba pensado fundamentalmente para “calificar” diferentes elementos de una página. Con ese archivo, el navegador creaba una presentación en pantalla de esos elementos, que podía variar enormemente de navegador a navegador.

Cuando la Web pasó de simple herramienta de acceso a la información a un medio de comercio, HTML pasó de ser un lenguaje de marcado de contenido a ser un lenguaje de presentación, y la guerra entre Netscape y Microsoft hizo que cada una de las empresas ampliara el HTML para facilitar la tarea de los diseñadores gráficos, cada una a su manera, y muchas veces de forma incompatible entre ellas.

Esto llevó a modificaciones tremendas en el HTML, que aparte de vincularlo con una implementación concreta, hacían que las páginas fueran otro formato de archivo, no una representación de la información que contenían. Además, HTML no obligaba a que las páginas estuviesen bien formadas, lo que permitía a los diseñadores crear páginas erróneas que podían ser interpretadas de diferente forma por diferentes navegadores. XHTML(eXtensible HyperText Mark-up Languaje) surge precisamente como una reformulación del HTML en base a XML, con las siguientes ventajas:

  • Al ser XHTML un lenguaje basado en XML, dispone de un modelo de datos, con el que es posible validar el archivo: es posible que un programa de ordenador te indique si tu página web en XHTML está bien o mal escrita
  • XHTML tiene un conjunto de etiquetas más reducido que HTML: esto permite describir el contenido, y luego utilizar hojas de estilo CSS(Cascading Style Sheets) para darle formato. Esto permite la separación entre contenido y presentación, de modo que es posible, a partir de un único archivo XHTML, crear diferentes presentaciones, cambiando la hoja de estilos.
  • La separación entre descripción (XHTML) y formato (CSS) permite que sea más sencillo montar herramientas de gestión de contenidos en base de datos, utilizar XHTML (XML) para describir los datos, y utilizar CSS para aplicar el formato que se desee a esos datos. De esta forma, aislamos al diseñador de la programación de los accesos a la base de datos

Así que XML ya es importante para la web, ya que ha permitido una reformulación del HTML para dar lugar al XHTML, independiente del navegador, y que separa contenido de formato. Si vas a desarrollar tu sitio web en XML, podés obtener tu web hosting en Neolo.com :-)

  1. No hay Comentarios
(No será publicado)