Disponible la nueva versión "donationware" 7.3 de OrganiZATOR
Descubre un nuevo concepto en el manejo de la información.
La mejor ayuda para sobrevivir en la moderna jungla de datos la tienes aquí.

Notas sobre Internet

[Home]  [Inicio]  [Índice]


5.2  Ideas básicas: hipervínculo e hipertexto

§1  Hipervínculos e hipertexto

La idea de hipervínculo es muy sencilla. Se trata de la referencia a una información que no está en el texto sino fuera de él.  En un escrito normal, una llamada a pié de página; la referencia a una nota al final de texto, o una cita a cierto pasaje de otra obra, son "vínculos". Es decir, son sencillamente direcciones o que conducen a sitios donde podemos encontrar información adicional relacionada (o debería serlo) con el tema que tenemos a la vista.  Lo que hizo Berners-Lee, fue aplicar este concepto a documentos electrónicos, aprovechando las capacidades de la informática, y más concretamente de Internet. Como se trataba de documentos electrónicos, y además los tales vínculos tienen en este caso una enorme ubicuidad, y desde luego gran potencia, a la palabra normal se le ha antepuesto el prefijo "Hiper" y ya tenemos la palabreja hipervínculo (que suena más impresionante).

Parece existir universal consenso en atribuir la paternidad de la idea de hipervínculo a Vannevar Bush.  Ingeniero Norteamericano que fue pionero y precursor de la idea.  Director de la Oficina de Desarrollo e Investigación Científica durante la II Guerra Mundial, asesor del presidente Roosevelt para temas científicos y posteriormente vicepresidente del MIT y Director de la Carnegie Institution.  En Julio de 1945, en su famoso artículo "As we may think" en el Atlantic Montly, desarrolló estas ideas (aunque el término hipertexto fue acuñado mas tarde) concretándolas en una máquina, Memex con la que pretendía resolver el creciente problema de la información científica y técnica que comenzaba a ser desbordante (en su calidad de director de la Oficina de Desarrollo e Investigación Científica, tenía que dirigir y coordinar la actividad de unos 600 investigadores de élite).  Desafortunadamente su ingenio no tuvo éxito, pues adelantado a su época, carecía de los instrumentos electrónicos adecuados para llegar a ser práctico (Memex era una especie de pupitre electromecánico que almacenaba la información en microfichas).


La tecnología informática de red (que por entonces ya estaba planamente operativa), permite que una llamada a pié de página, a otro punto del texto (no importa que esté mil páginas mas adelante), e incluso a un punto concreto de un documento en un ordenador al otro lado del mundo, puedan ser accedidos casi instantáneamente.  Para dar forma a esta idea, Berners-Lee estableció una forma estandarizada para que en determinados pasajes de cualquier documento electrónico de un tipo especial (que se llamaría hipertexto) [2], se pudieran insertar unas etiquetas especiales (hipervínculos o hiper enlaces) que contuvieran la dirección electrónica de la información que se quiere referenciar.  Apuntando sobre dicha etiqueta, el sistema se encarga de reclamar para nosotros la información de forma automática y de presentárnosla directamente en pantalla.

Fácilmente se comprende que la estructura de referencias así creada, puede crecer exponencialmente en complejidad, cuando el documento referenciado por un hipervínculo contiene a su vez hipervínculos que "apuntan" a documentos que a su vez contienen hipervínculos que a su vez...[3].  Es por esto que eligió el nombre de "Telaraña mundial" para su proyecto.  En palabras del propio Berners-Lee: "El mundo de la Web es por tanto un mundo de información y parte de esa información es información sobre información" (¿Será alguna vez el verdadero "cerebro" del planeta?).

§2  Concretando la idea

Para dar forma concreta a su idea, Berners-Lee se inventó un sistema especial de escritura de páginas mediante un lenguaje ad-hoc, al que denominó Lenguaje de Marcas de Hipertexto HTML ("Hyper Text Markup Languaje").  Esta escritura está orientada a la presentación de datos en la pantalla del ordenador [4], y en ella, junto con el texto e imágenes que se quieren mostrar, se incluyen una serie de órdenes y comandos que indican "como" debe representarse la información, así como la forma en que deben embeberse en el documento las etiquetas de hipertexto a que antes nos referíamos.  En 1990 escribió el primer editor+visor de HTML, un programa denominado  "WorlDwidEweb", que corría en un ordenador NeXT Step.

Una vez escritos los documentos, quedaban cuatro cuestiones que resolver:  Poder localizarlos fácilmente; poder transmitirlos por la red; poder visualizarlos en las pantallas de los receptores, y desde luego, hacerlos accesibles a todo el que quisiera consultarlos.

En cuanto a la primera cuestión, para referirse a los documentos concretos dentro de la inmensidad de la Red, Berners-Lee ideó un sistema de direcciones al que denominó Localizador de Recursos Unificado URL ("Unified Resource Locator"). El concepto está estrechamente relacionado con el de URI ("Unified Resource Identifier").  Una "dirección" URL tiene un aspecto como:

http://www.cerberus-sys.com/belleisl/tune.htp

Por supuesto, contiene toda la información necesaria para saber en que dirección IP está el ordenador que contiene el documento; la posición del fichero dentro del ordenador; su nombre, y datos que indican que se trata de un documento de hipertexto y que protocolo utilizar para accederlo [6].  En el Apéndice G ( Ap. G) se amplían detalles sobre este concepto y sus diversas formas.

La distinción entre URL y URI, ("Locator" y "Identifier"), es meramente semántica y académica;  con frecuencia se suelen confundir ambos términos aunque no son estrictamente equivalentes.  El primero referencia un contenido de "Dirección" en Internet; algo que puede ser mutable con el tiempo, dado que se refiere a la localización del contenido en la Red y puede cambiar cada vez que el contenido es pasado de un sitio a otro o es clonado en un nuevo lugar.  El segundo es mucho más amplio; se refiere a un contenido de "Nombre", algo que una vez asignado, sigue (o debería seguir) al contenido durante toda su vida.  A este respecto, Brian D. Eubanks, en su libro "Wicked Cool Java" (Starch Press, ISBN: 1593270615) escribe: "Everything has a Uniform Resource Identifier (URI), and by this I mean everything: not only documents but also generic concepts and relationships between them. Even though you are not a document (or are you?), there could be a URI assigned to represent you as an entity. This URI can then be used to make connections to other things. For the “you” URI, these connections might represent related organizations, addresses, and phone numbers. URIs do not have to return an actual document! This is what sometimes confuses developers when they see a URI referenced somewhere and find that there is nothing at the location. These addresses are often used as markers or unique identifiers to represent concepts. We make links between URIs to represent relationships between things".

§3  Herramientas auxiliares

Para el segundo problema, Berners estableció las bases del protocolo HTTP ("Hyper Text Transfer Protocol") que se utiliza para transmitir los documentos HTML (documentos Web) de un punto a otro [7].  En cuanto al tercero (la visualización), escribió un programa especial para "ver" los documentos HTML.  Este programa, que después se ha llamado Browser o Navegador, es en realidad un visor de documentos HTML.  Puede deducirse fácilmente que lo de "Navegador" viene de que al mirar documentos HTML, debido a su enorme facilidad para pasar de un documento a otro mediante hipervínculos, el resultado es muy parecido a "navegar" por la red dando saltos de un punto a otro.

Nota:  Es esta es una característica distintiva de la Web;  el hecho de poder saltar de un documento a otro, nos permite estar viendo un documento y un instante después, mediante un clic de ratón, estar viendo otro que está en la otra parte del mundo.  Decimos que "navegamos", pero en realidad solo vemos documentos que no están demasiado lejos; han sido transmitidos a nuestro ordenador por el protocolo HTTP; el "Browser" se encarga de mostrárnoslos.  Los que navegan son realmente los documentos, o mejor "copias" de ellos, que nos envían los servidores Web.

§4  El primer sitio Web

Por último, para poner en marcha la idea, para hacer accesibles los documentos a toda la comunidad Internet, necesitaba desde luego un servidor de páginas HTML, que el mismo Berners-Lee alojó en los ordenadores del CERN en el verano de 1991.  Con gran visión, colocó en este servidor primigenio las especificaciones sobre HTTP, URL y HTML, a fin de que pudieran ser accedidas por todos y pudiera establecerse un foro de discusión sobre ellas [8].  Así pues, la primera Web incluyó básicamente información sobre la Web (datos sobre datos).  La primera información accesible como tal, fue un listín de teléfonos del CERN, de forma que la primera impresión sobre ella era la de ser una agenda telefónica con una apariencia extraña.  Siguieron informaciones sobre las materias concernientes al CERN, de forma que sus primeros usuarios pertenecían al círculo de la física teórica [9].

  Inicio.


[2]  Los términos Hipertexto e Hypermedia fueron acuñados por Ted Nelson en un documento de la 20 conferencia nacional de la ACM.  "By 'hypertext' mean nonsequential writing-text that branches and allows choice to the reader, best read at an interactive screen".  Ver en el Apéndice H más información relativa a este precursor ( Ap. H).

[3]  Como puede verse, el sistema resuelve en parte un viejo problema que ya había preocupado a Vannevar Bush:  El hecho de que normalmente la información está organizada en índices jerárquicos (libros y bibliotecas). Cuando se encuentra cierto material y se quiere seguir la búsqueda de otro material relacionado, hay que salir del sistema y volver a entrar por un nuevo camino (nuevo índice); la mente humana en cambio parece funcionar por asociaciones muy dinámicas, mas que por índices.

[4]  Esta concepción es rigurosamente historicista;  en el capítulo 11 veremos que HTML ha devenido rápidamente en un vehículo para contenidos de tipo muy amplio y general.

[6]  Como veremos en los ejemplo siguientes, la URL no solo sirve para apuntar a páginas Web, en realidad es un comando que tiene varios significados (puede solicitar varios servicios distintos al navegador).

[7]  Por supuesto, que HTTP es una capa de software que usa a su vez los servicios de los protocolos estándar TCP/IP ( 3.1).  No solo puede transferir ficheros HTML, también de otros tipos.  Una característica (poco utilizada) de este protocolo, la "Negociación de Formato", permite al cliente negociar con el servidor ciertas características de la transmisión referentes al lenguaje y formato de los datos a enviar .

[8]  La primera "dirección" de la Web fue: info.cern.ch.

[9]  Así pues, tanto la concepción (la idea), como las primeras realizaciones de la Web son genuinamente Europeas.