Depto. Informática - UVA
Talleres de Técnica Docente para el Profesorado Universitario
Centro Buendia de cultura, formación contínua y extensión universitaria

Introducción a las posibilidades de Internet desde la perspectiva docente

Jesús Vegas. Dpto. de Informática - Universidad de Valladolid
Universidad de Valladolid


Índice





Redes de ordenadores

Usos de las redes

Clasificación

Internet

Un poco de historia


Introducción a las Redes de Ordenadores

Redes de Ordenadores

  • Aunque la industria de la computación es joven comparada con otras industrias, las computadoras han logrado un progreso espectacular en un tiempo corto.
  • Durante las dos primeras décadas de su existencia, los sistemas de cómputo estaban muy centralizados, por lo general, dentro de un cuarto grande.
  • La fusión de las computadoras y las comunicaciones ha modificado el modelo de cálculo por uno en el cual un gran número de computadoras separadas pero interconectadas hacen el trabajo.
  • Se entiende por red de computadoras a una colección interconectada de computadoras autónomas. 

Usos de las Redes de Ordenadores

  • La cuestión es compartir los recursos y la meta es hacer que todos los programas, el equipo y especialmente los datos estén disponibles para cualquiera en la red.
  • Alta confiabilidad a contar con fuentes alternativas de suministro, tanto de datos como de procesadores. 
  • Otro objetivo es ahorrar dinero. Las computadoras pequeñas tienen una relación precio/rendimiento mucho mejor que las grandes.
  • La escalabilidad: la capacidad para incrementar el rendimiento del sistema gradualmente, cuando la carga de trabajo crece, añadiendo más computadores.
  • Potente medio de comunicación entre personas que permite entre otras las siguientes actividades:
    • Acceso a información remota.
    • Comunicación de persona a persona.
    • Entretenimiento interactivo.

Clasificación de las Redes

  • Las redes de área local, LANs (local area networks):
    • Son redes de propiedad privada dentro de un solo edificio o campus de hasta unos cuantos kilómetros de extensión.
    • Se usan ampliamente para conectar computadoras personales y estaciones de trabajo en oficinas de compañías y fábricas con objeto de compartir recursos (ej. impresoras) e intercambiar información.
    • Las LAN operan a velocidades de 10 a 100 Mbps, tienen bajo retardo (décimas de segundo) y experimentan pocos errores.
  • Una red de área metropolitana, o MAN (Metropolitan Area Network)
    • Es básicamente una versión más grande de una LAN.
    • Puede manejar datos y voz, e incluso podría estar relacionada con la red de televisión por cable local.
  • Una red de área ámplia, o WAN (Wide Area Network)
    • se extiende sobre una área geográfica extensa, a veces un país o un continente.
  • Interredes
    • Existen muchas redes en el mundo y los usuarios de una quieren conectarse a otras distintas. 
    • Esto requiere conectar dos redes diferentes y con frecuencia incompatibles en software y hardware.
    • Internet es una conexión de redes.

Internet

descipcion de Internet
  • Internet es una red de computadores que vamos a utilizar como entorno de trabajo y estudio. Pero, ¿qué es Internet? 
  • Los componentes hardware y software que componen Internet:
    • Internet es una red de computadores que interconecta millones de dispositivos de cómputo a lo largo del mundo (PCs, WSs, TVs, etc.). A todos estos dispositivos se les llama hosts o sistemas finales, end systems.
    • Los hosts ejecutan protocolos que controlan el envio y la recepción de información dentro de Internet. Los protocolos utilizados en Internet se conocen colectivamente como protocolos TCP/IP.
    • Los hosts están conectados entre sí mediante enlaces de distinto tipo: cable coaxial, par trenzado, fibra óptica, ondas de radio, etc. Los diferentes enlaces transmiten datos a diferentes velocidades, llamadas ancho de banda, que se miden en bits/segundo.
    • Los hosts no están conectados a todos los demas directamente, sino que son conectados a través de dispositivos intermedios llamados routers.
  • Los servicios que presta a las aplicaciones distribuidas.
    • Internet permite que aplicaciones distribuidas se ejecuten en los hosts para intercambiar datos entre ellos.
    • Estas aplicaciones incluyen acceso remoto a equipos, transferencia de ficheros, correo electrónico, videoconferencia, juegos distribuidos, WWW y muchas más.
    • El Web no es más que una aplicación distribuida que se ejecuta en Internet, pero que podría hacerlo sobre otra red.

Un Poco de Historia

  • 1960, guerra fría, el DoD norteamericano quiere una red estratégica de control que pudiera sobrevivir a una guerra nuclear. Por ello acude a su rama de investigación, ARPA, Advanced Research Projects Agency.
  • ARPA no tenía científicos, sino que contrataba con departamentos de Universidades sus proyectos.
  • La red ARPANET entró en funcionamiento en 1969 entre cuatro universidades UCLA, UCSB, SRI y Utah.
  • La red creció rápidamente hasta cubrir todos los EEUU.
  • Finales de los 70, la NSF, National Science Fundation, vió el impacto que tenía ARPANET en las universidades que estaban conectadas, ya que permitía a los científicos el intercambio de datos y la colaboración entre ellos.
  • Como para participar en ARPANET había que tener un contrato con el DoD y no todas las universidades lo tenían, se creo la NSFNET.
  • A mediados de los 80, se interconectaron ARPANET y NSFNET, y fue creciendo el número de redes conectadas a ambas, componiendo poco a poco Internet.
  • Tradicionalmente Internet ha tenido cuatro aplicaciones principales:
    • Correo electrónico.
    • Grupos de noticias.
    • Sesión remota.
    • Transferencia de Ficheros.
  • Hasta casi finales de la década de los 90 Internet estaba poblada mayormente por investigadores de centros oficiales e industriales. Una aplicación nueva, WWW World Wide Web, ha cambiado todo esto y ha atraido al público general y al comercio a la red.





Email/Snail

SMTP

Webmail


Correo Electrónico

  • usuario@servidor.correo.electronico

Email y Snailmail

  • Coincidencias:
    • Ambos son asíncronos.
    • Permiten enviar distintos tipos de información.
  • Diferencias:
    • Velocidad.
    • Facilidad de distribución.
    • Coste económico.

SMTP: Simple Mail Transfer Protocol

funcionamiento SMTP
  • SMTP: transfiere los mensajes desde el servidor de correo del emisor al servidor de correo del receptor.
    • servidor de correo: gestiona los mensajes entrantes (buzón) y salientes (cola).
    • agente de correo: programas que permiten leer, responder, reenviar, almacenar, y componen mensajes.
  • Problema: los mensajes sólo pueden contener caracteres ASCII.
  • Solución: MIME (Multipurpose Internet Mail Extensions).

WebMail






Pricipios WWW

HTTP

URL

HTML


World Wide Web

Principios WWW

  • El primer precedente del WWW se puede encontrar en un tratado escrito por Vannevar Bush titulado ``As We May Think'', de 1945, en el que básicamente animaba a los científicos a hacer más accesible a todo el mundo sus conocimientos y experiencia. En este tratado surgieron las nociones de hipertexto e hipermedia.
  • '60: Ted Nelson introduce el término hipertexto en su sistema Xanadu.
  • 87: Bill Atkinson en Apple crea las HyperCards, tarjetas que pueden contener texto, sonido, video o figuras con botones que el usuario podía utilizar para navegar por ellas (HyperTalk).
  • Tim Berners-Lee, en el CERN (Laboratorio Europeo de Partículas Físicas en Ginebra, Suiza) desarrollo el WWW como una base de datos distribuida en la que se utiliza el hipertexto como mecanismo de consulta en la que cada usuario se encarga de administrar su parte de la BD (protocolos URL, HTTP y HTML).
  • WWW se asienta sobre el protocolo HTTP (Hyper Text Transfer Protocol), URI (Universal Resource Identifier) y sobre el lenguaje de definición de documentos hipermedia HTML (HyperText Markup Language).
  • 1993: se propone crear un consorcio que trate los problemas de establecimiento de estándares para HTML y HTTP: WWW Consortium.

HTTP

Descripcion de HTTP
  • Arquitectura Cliente-Servidor: HTTP se asienta en el paradigma solicitud/respuesta. La comunicación se asienta sobre TCP/IP.
  • Es un protocolo sin conexión y sin estado. Después de que el servidor ha respondido la petición del cliente, se rompe la conexión entre ambos. Además no se guarda memoria del contexto de la conexión para siguientes conexiones. 
  • Durante una sesión normal de trabajo en WWW, un cliente (navegador) solicita un documento de un servidor Web y una vez obtenido se muestra al usuario que hizo la solicitud. Si este documento contiene un enlace a otro documento (en el mismo o en distinto servidor), y el usuario activa el enlace; el cliente Web efectuará otra petición y mostrará el nuevo documento. 

URL

  • Un Uniform Resource Locator, URL, especifíca la localización exacta de un recurso en Internet. 
  • Es como la extensión del concepto de nombre de fichero para que abarque la red: se puede identificar un fichero en un directorio en una máquina de la red, que puede ser servido por diferentes métodos.
  • URLs absolutos [ protocolo://servidor/camino/fichero ]
    • Utiliza una dirección Internet completa para dar la localización de un recurso.
    • También se puede utilizar la dirección IP para especificar el servidor.
  • URLs relativos [ pathRelativo/fichero ]
    • Se utilizan para acceder a ficheros que están en el mismo servidor.
    • Se llama relativo porque su dirección se da en función de la URL del documento donde se utiliza.
    • El browser quita todo lo que esté a la derecha de la última barra, /, de la URL del fichero actual y le añade el URL relativo.
    • Los URLs relativos son imprescindibles si queremos que un conjunto de páginas Web sea portable.
  • Fragmentos de URL [ protocolo://servidor/path/fichero#fragmento ]
    • Permite direccionar un fragmento de un fichero.
    • El identificador del fragmento es el nombre o identificador del ancla referenciada.
    • El URL puede ser absoluto o relativo.

HTML

  • HTML trata de definir la estructura de los documentos, aunque también tenga alguna posibilidad de modificar su apariencia.
  • Se puede definir la estructura de un documento como la relación que mantienen las partes del mismo entre ellas.
  • Esto contrasta con el uso de los procesadores de texto que consideran sólo la apariencia de los documentos, y casi nunca su estructura.
  • Terminología
  • DTD
    reglas escritas en SGML que define la sintaxis y la estructura de un tipo de documento dado, como por ejemplo HTML.
    elemento
    cada componente de la estructura de un documento. Está asociado a una etiqueta.
    etiqueta
    un código que se inserta en el contenido del documento para determinar la estructura del mismo <etiqueta> y </etiqueta>.
    atributo
    aporta información adicional que modifica el comportamiento de las etiquetas atributo="valor".
    browser
    se basa en un analizador sintáctico que evalúa las etiquetas y el contenido de un documento HTML y lo muestra conforme a las posibilidades del sistema. También se encarga de solicitar nuevos documentos según HTTP.
  • Etiquetado: <etiqueta> contenido </etiqueta>





URL: Direcciones Web

Utilizar un Navegador


Navegando en el Web

En este apartado vamos a conocer las técnicas de navegación básica en el Web. Esto incluye el modo de direccionar los sitios Web, el acceso a los mismos mediante el uso de un navegador, etc.

URL: Direcciones Web

  • Lo primero que hay que saber para ir a algún sitio es conocer su dirección: http://www.sitio.dominio/camino/fichero.html
    http://
    http es el protolo de comunicaciones utilizado en el Web, y es uno más de los considerados en Internet (mailto, ftp, etc.)
    www
    indica el nombre del servicio que se quiere utilizar y resulta redundante ya que éste se especifíca en el procoloto (partícula anterior). Es opcional, aunque se incluye por motivos de imagen.
    sitio
    es el nombre del sitio en sí y suele coincidir con la marca comercial de la empresa u organización a la que se refiere. También está de moda colocar palabras muy conocidas que faciliten acordarse de el.
    dominio
    es como la calle, el número, la ciudad, provincia y pais en una dirección postal normal. Suele estar compuesto por varios campos separados por puntos. Dominios usuales son:
    • es para España (fr, uk, ge, cl, br, ...),
    • com para empresas,
    • edu instituciones educativas,
    • gov organizaciones gubernamentales de USA,
    • mil organizaciones militales de USA,
    • net organizaciones encargadas de la gestión de la red,
    • org otras organizaciones,
    camino
    especifica el camino en el árbol de directorios o carpetas que hay que seguir para llegar al fichero que contiene la páquina deseada.
    fichero
    indica el fichero que contiene la páquina web que se desea ver. Esto es optional, ya que todos los sitios tienen una página principal que no es necesario buscar (index, inicio, welcome, etc). Las extensiones normales suelen ser html, htm, asp y cgi, aunque también existen otras.

Utilizar un Navegador

  • Los navegadores (o browsers) son las aplicaciones informáticas que nos permiten acceder a una página web dada.
  • Se encargan de los detalles de protocolo de comunicación (HTTP) y de los detalles de presentación de la información (HTML).
  • Suelen incluir servicios añadidos que completan sus posibilidades y los destacan de la competencia.
  • Los más utilizados son el Internet Explorer de Microsoft y el Netscape Navigator; ambos gratuitos. Existen otros navegadores de uso menos generalizado, como el Opera, que aunque tiene buenas prestaciones y ocupa menos espacio que los dos principales, no es gratuito.
  • También existen navegadores para dispositivos especiales, como teléfonos móviles (WAP).
  • Distintos navegadores pueden presentar la misma información de distinta forma, aunque esto no es lo ideal.
  • Los usuarios pueden determinar la página que se presenta cada vez que se inicia el navegador. Esta página se conoce como home page.
  • Cuando se accede a una página Web, lo que ocurre es que el navegador ha obtenido una copia de la misma, que almacena en el disco, y esta copia se puede:
    • ver en su formato interno HTML (Nav: Ver: Origen de Página, IE: Ver: Código Fuente),
    • almacenar como un fichero en el disco (Nav: Archivo: Guardar Como, IE: Archivo: Guardar Como),
    • editar para obtener una copia local de la misma (Nav: Archivo: Editar Página, IE: ???) ,
    • imprimir (Nav: Archivo: Imprimir, IE: Archivo: Imprimir),
    • enviar asociada a un correo electrónico (Nav: Archivo: Enviar Página, IE: Archivo: Enviar: Página por Correo Electrónico).
  • Los navegadores almacenan la secuencia de páginas visitadas recientemente de modo que podemos:
    • regresar a la página anterior,
    • si hemos retrocedido, avanzar a la página siguiente,
  • Además, se pueden almacenar las páginas más interesantes en un registro de favoritas para poder volver a visitarlas en otra ocasión.
  • Otra opción del navegador es la de recargar la página actual. Esto puede ser interesante si el contenido de la página ha variado desde que accedimos a ella.
  • Los navegadores no siempre buscan en el Web la página pedida. Si la página requerida se encuentra en el almacén de páginas visitadas recientemente, la toma de ahí, sin ir a la red. Esto hace que la carga de páginas sea más rápida. A veces nos puede interesar que se vaya a la red a por la página, por lo que habrá que recargar la página, o configurar el navegador para que guarde un cache más pequeño. La carga de páginas se acelera si disponemos de un servidor proxy que almacena las páginas más solicitadas en una red y sirve las copias en lugar de ir a por las originales.
  • Las cookies no son más que pequeños ficheros que los sitios Web escriben en nuestro disco que sirven para personalizar las páginas que nos muestran, como llevar la cuenta de si hemos estado anteriormente en un sitio, lo último que hicimos, etc. Podemos denegar el permiso para que los sitios escriban en nuestro disco.
  • Por defecto, todas las comunicaciones entre el navegador y los sitios Web son planas, esto es, se pueden seguir en la red. Para que las comunicaciones sean secretas, se debe entrar en un modo seguro que depende del sitio concreto. Esto se suele indicar con una ventana de aviso que conviene no desactivar.





Práctica 1

Una página Web

Práctica 2

Elementos HTML

Conjuntos de caracteres

Práctica 3

Publicar una página

Herramientas de Edición HTML


Publicación de Páginas Web

En este apartado vamos a describir los pasos necesarios para publicar páginas Web. Primero vamos a describir la estructura de una página y los distintos elementos que se pueden incluir en ella. Despues vamos a estudiar la colocación de las páginas en un servidor Web.

Práctica 1: Escribir la primera página Web

  1. Abrir un editor de texto.
  2. Escribir lo siguiente:
    <html>
    <head><title>Primera Página </title></head>
    <body>
    <h1>Esta es la primera página</h1>
    <p>Hola Mundo!!</p>
    </body>
    </html>
    
  3. Guardar el fichero como C:\micarpeta\primera.html
  4. Abrir el navegador.
  5. En el menu Fichero abrir el fichero C:\micarpeta\primera.html
  6. Ya tenemos la primera página Web.

Una página Web

  • Una página Web no es más que un fichero en el que colocamos información según el formato HTML.
  • Estará compuesto de:
    Cabecera: <head>
    donde se indica el título de la página (<title>) y otras informaciones interesantes.
    Cuerpo: <body>
    donde se incluye el contenido de la página en sí.
  • Los elementos imprescindibles a incluir en una página Web son:
    Encabezados: <hn>
    donde n puede ser un valor entre 1 y 6, de modo que los encabezados de nivel 1 son presentados de forma más relevante que los del nivel 2, y estos que los del nivel 3, etc. Los encabezados representan el papel de los títulos de documento, capítulo, sección, etc.
    Párrafos: <p>
    se escriben los párrafos. HTML ya se encarga de incluir un salto de línea al final de los mismos.
    Hiperenlaces: <a href="URL destino">origen</a>
    permiten enlazar documentos entre ellos, a partir de un elemento del documento original. Cualquier elemento de una páquina Web puede ser el origen de un hiperenlace.
    Figuras: <img src="URL de la figura" alt="texto alternarivo">
    Figuras e imágenes en formatos gif, jpeg, etc, con sólo indicar su localización. Resulta conveniente indicar la descripción alternativa de la imagen, para evitar esperas en redes lentas, de modo que el usuario no espere por ella si estima que la imagen no le interesa.
  • Un ejemplo de página básica se puede ver si pinchas aquí.
  • Además, se pueden utilizar listas, tablas, modificadores de apariencia, etc.

Práctica 2: Escribir la segunda página Web

  1. Abrir el block de notas.
  2. Escribir lo siguiente:
    <html>
    <head><title>Página Segunda</title></head>
    <body>
    <h1>Esta es la segunda página</h1>
    <p>
    Para ir a la primera página pincha <a href="primera.html">aquí</a>
    </p>
    </body>
    </html>
    
  3. Guardar el fichero como C:\micarpeta\segunda.html
  4. Abrir el navegador.
  5. En el menu Fichero abrir el fichero C:\micarpeta\segunda.html
  6. Pinchar para ir a la página primera.
  7. Ya hemos construido un hiperenlace.

Elementos HTML

Listas

Listas sin orden <ul>
<li>elemento 1</li>
<li>elemento 2</li>
<li>elemento 3</li>
</ul>
  • elemento 1
  • elemento 2
  • elemento 3
Listas con orden <ol>
<li>elemento 1</li>
<li>elemento 2</li>
<li>elemento 3</li>
</ol>
  1. elemento 1
  2. elemento 2
  3. elemento 3
Glosarios <dl>
<dt>término 1</dt>
<dd>definición 1</dd>
<dt>término 2</dt>
<dd>definición 2</dd>
<dt>término 3</dt>
<dd>definición 3</dd>
</dl>
término 1
definición 1
término 2
definición 2
término 3
definición 3

Tablas

<table border="1">
<tr><th>col1</th><th>col2</th></tr>
<tr><td>celda 1,1</td><td>celda 1,2</td></tr>
<tr><td>celda 2,1</td><td>celda 2,2</td></tr>
<tr><td>celda 3,1</td><td>celda 3,2</td></tr>
</table>
col1col2
celda 1,1celda 1,2
celda 2,1celda 2,2
celda 3,1celda 3,2

Alineamiento y Formateo de Texto

Cursiva <em>palabra</em> palabra
<i>palabra</i> palabra
Negrita <strong>palabra</strong> palabra
<b>palabra</b> palabra
Subrayado <u>palabra</u> palabra
Fuente Fija <tt>palabra</tt> palabra
Tamaño <font size="+2">palabra</font> palabra
<font size="-2">palabra</font> palabra
Salto de Línea pala<br>bra pala
bra
Preformateo
<pre>
a
 b
  c
</pre>
a
 b
  c
Superíndice palabra<sup>2</sup> palabra2
Subíndice palabra<sub>2</sub> palabra2
Líneas <hr>
<hr width="50%" size="4">

Conjunto de Caracteres

  • HTMLv2.0 utilizaba el conjunto de caracteres ISO 8859-1 (ISO Latin 1), una extensión del ASCII.
  • HTMLv4.0 utiliza el conjunto ISO 10646 (Unicode), que contiene a su vez al ISO Latin 1.
  • Unicode es un sistema de codificar caracteres standard diseñado para soportar el intercambio, procesamiento y visualización de textos escritos en las diversas lenguas del mundo moderno. Además, soporta textos clásicos escritos en varias lenguas.
    • La version 3.0 contiene 49.194 caracteres distintos.
    • Los caracteres se expresan como &#9999, siendo el 9 cualquier dígito hexadecimal.
  • Toda transferencia HTML debe ser enviada en Unicode.
  • HTML utiliza la definición de entidades para hacer más fácil el manejo de los caracteres comunes que no tienen asignadas teclas, de modo que no haya que aprenderse su código numérico.
  • También para expresar los caracteres que tienen significado especial en HTML: &, <, > y ".
    & &amp; < &lt; > &gt; " &quot;
    ¨ &uml; ´ &acute; ® &reg; © &copy;
    À &Agrave; Á &Aacute; Â &Acirc; Ä &Auml;
    Å &Aring; Æ &AElig; Ç &Ccedil; Ñ &Ntilde;
    à &agrave; á &aacute; â &acirc; ä &auml;
    å &aring; æ &aelig; ç &ccedil; ñ &ntilde;
  • Tendremos que tener cuidado al escribir caracteres del castellano que puede que no se puedan ver en otros navegadores no castellanizados.
  • La visualización de un carácter concreto depende de las posibilidades de visualización del navegador concreto que utilicemos.

Práctica 3: Escribe tu página Web

  1. Abrir el block de notas.
  2. Escribir tu página Web incluyendo los elementos HTML que consideres oportunos.
  3. Guardar el fichero como C:\micarpeta\mipagina.html
  4. Abrir el navegador.
  5. En el menu Fichero abrir el fichero C:\micarpeta\mipagina.html
  6. Ya tenemos nuestra própia página Web.

Publicar la página en el Web

  • Localizar una máquina con un servidor Web instalado
    • Los proveedores de acceso a Internet suelen prestar un sitio a sus usuarios para que depositen sus páginas.
    • Cualquier máquina de la UVA conectada a Internet puede albergar un servidor web y las páginas de información pertinentes.
    • Servidores Web más populares: web compare.
  • El servidor web nos asignará un directorio a partir del cual podremos crear nuestro sitio web.
  • Para colocar las página sólo tenemos que depositarlas en el directorio adecuado:
    • Si tenemos acceso directo al ordenador puede hacerse transfiriendo los ficheros almacenados previamente en un disquete.
    • Si el servidor web que nos alberga es remoto, podremos transferir los ficheros utilizando la herramienta FTP (File Transfer Protocol).
  • Todo esto está coordinado por el administrador del sitio Web, llamado webmaster, y suele proporcionar los consejos necesarios.
  • Un aspecto que hay que tener en cuenta es el nombre de la página inicial, que suele estar predefinido: preguntar al administrador.
    • index.html
    • default.html
    • welcome.html
    • inicio.html

Herramientas de Edición HTML

  • Aunque en este caso hemos construido las páginas web insertando las etiquetas a mano, existen herramientas que asisten en la creación de páginas y sitios web.
  • Los navegadores tienen incluida una herramienta de edición de páginas, que aunque no es muy sofisticada, puede servir para la creación de las páginas.
  • Existen herramientas más sofisticadas para la creación de sitios web, que se ocupan:
    • de escribir las páginas web.
    • enlazar páginas dentro de un sitio.
    • analizar las páginas buscando enlaces rotos, páginas aisladas, etc.
    • publicar las páginas en el servidor web.
  • Ventajas:
    • Facilitan la tarea a usuarios no iniciados.
    • Prototipado rápido.
    • Enlace con otras aplicaciones como bases de datos.
  • Inconvenientes:
    • Apariencia estándard.
    • Pocas posibilidades de ajuste fino en ciertas características.
    • No siguen el estándard HTML demasiado fielmente, dependencia del navegador.
    • Coste de aprendizaje.
  • Editores y Herramientas de Asistencia:





¿Quién me ayuda?

Buscando la aguja

Cómo pregutar

Metabuscadores


Recursos en la Red

  • El Web ha revolucionado el modo en que la gente accede a la información.
  • Nuevas posibilidades como bibliotecas digitales, comercio electrónico, divulgación, etc. (15.000 Mill. de palabras)
  • El Web está creciendo a razón de 20 Mill. pags/mes, dobla su tamaño en 9 meses (Marzo 1998).
  • El acceso a la información no está limitado por su disponibilidad, sino por la capacidad de encontrarla.

¿Quién me ayuda a encontrar algo que hable de ...?

  • Directorios.
    • Es un catálogo de sitios Web creado a mano.
    • Se crean categorías y los sitios se asignan a ellas.
    • Cubren una porción muy pequeña del Web.
    • Yahoo [www.yahoo.es]
  • Buscadores.
  • Actualmente, se mezcla el concepto de buscador y de directorio, ofreciéndose ambos servicios juntos.
  • Para encontrar algo
    • Si se busca algo concreto bien documentado normalmente, ir a una enciclopedia como la Encyclopædia Britannica Online [www.eb.com].
    • Si se busca algo concreto, buscarlo en un directorio.
    • Si no se tiene ni idea de lo que se está buscando, ir a un buscador.
  • Intimidad e Intereses comerciales.
    • Detrás de los servicios gratis existen intereses comerciales que los soportan.
    • Cada vez que nos movemos por el Web dejamos un rastro muy fácil de seguir.
    • La pieza más codiciada: nuestro perfil de consumidor.
    • Se puede conseguir cierta intimidad: [www.idcide.com].

Buscando la Aguja en el Pajar

  • La información en el Web es dinámica y no está organizada.
  • Los buscadores cubren una pequeña porción del Web (<30%).
  • Los algoritmos para buscar en el Web no están homogeneizados.
  • Los algoritmos que utilizan los buscadores varían en el tiempo y su sintaxis no es homogénea.
cobertura


invalidos

Cómo Preguntar

  • Escribir las palabras que mejor definan la búsqueda.
  • Restringir el campo de búsqueda: web, news, compras, etc.
  • Determinar el idioma de las páginas.
  • El buscador consultará sus índices y devolverá los documentos que las contengan, ordenados según su relevancia.
  • Diferentes buscadores interpretan las consultas de diferentes formas.
  • Buscando información sobre la Universidad de Valladolid (altavista):
    buscamosencontramos
    universidad 1.643.960 pág.
    valladolid 142.540 pág.
    universidad valladolid 1.755.730 pág.
    universidad AND valladolid 15.312 pág.
    universidad NEAR valladolid 8.121 pág.
    ``universidad valladolid'' 142 pág.
  • Hay que utilizar las búsquedas avanzadas para restringir el número de documentos a revisar.
  • Utilizar frases en lugar de conjuntos de palabras: "universidad valladolid".
  • Las mayúsculas recuperan sólo mayúsculas.
  • Incluir (+) o excluir (-) palabras: +valladolid -mexico.
  • Utilizar comodines: *.
  • Especificar la parte de la página donde se busca: anchor:texto, image:fichero, text:texto, title:título, url:texto, etc.
  • Utilizar expresiones booleanas
    operadorsímbolosignificado
    AND&Encuentra las pags que contengan ambos términos.
    OR | Encuentra las pags que contengan al menos uno de los términos.
    AND NOT!Excluye las pags que contengan el término.
    NEAR Encuentra las pags con los términos a no más de 10 palabras de distancia.
    () Se pueden agrupar expresiones.

Metabuscadores

  • Idea: combinar los resultados de las búsquedas realizadas en varios buscadores.
  • Combinando los 6 buscadores presentados se pueden localizar 3.5 veces más información que con uno sólo de ellos.
  • Se gana en alcance de la búsqueda pero se pierde en poder de especificación de la misma.




© Jesús Vegas Hernández
Dpto. Informática
Universidad de Valladolid
jvegas@infor.uva.es
Febrero 2003