Partes del Buscador


Mirador  del El Salvador, al igual que la mayoría de buscadores y motores de búsqueda que existen en la actualidad consta de diferentes componentes cuya ejecución es distribuida de tal forma que se obtengan los mejores resultados exactos en el menor tiempo posible con un uso mínimo de recursos. Los componentes de Mirador se detallan a continuación:
 
Se escogió e instaló la distribución Biltmore de Red Hat Linux en su versión 4.2. Como parte del análisis del proyecto, fue necesario evaluar diferentes opciones para cada uno de los componentes del Buscador, para el caso particular del sistema operativo, se evaluaron los dos sistemas operativos más populares en el ambiente de Internet, Windows NT y Unix.
Por un lado se tomó Windows NT, el cual muestra una presencia cada vez mayor en el mercado de sistemas operativos orientados al servicio de información a través de Internet; cuenta, además con un respaldo excelente de parte de Microsoft y de sus distribuidores en todo el mundo.
Por el lado de Unix, se escogió Linux, debido a que es uno de los sistemas operativos más utilizados en el ambiente de Proveedores de Servicios de Internet(ISP) gracias a que sus diferentes distribuciones proveen todos las librerías necesarias para proveer servicios como ftp, telnet, noticias, correo, http, etc. Otra de las ventajas que tiene Linux sobre cualquier otro sistema operativo es que se encuentra en constante desarrollo por una gran cantidad de programadores alrededor del mundo comunicados entre sí a través de Internet y que pueden ser consultados directamente a través del correo electrónico.
Linux es distribuido de forma gratuita a través de la licencia GNU.  Linux provee todo el poder de cualquier implementación comercial de Unix y además permite realizar modificaciones personalizadas al núcleo o kernel del sistema operativo con la única restricción de proveer de la documentación apropiada relativa a tales cambios en caso de que vaya a ser redistribuido.Otra de las ventajas que provee Linux la contituye sus bajos requerimientos de harware, ya que puede ejecutarse en una computadora de baja capacidad con un desempeño muy superior al de sus competidores comerciales.

 
Dentro del componente de Servidor Web, se incluyó al Apache Web Server. Apache es un conjunto de programas desarrollado por Apache Project, el cual es una institución sin fines de lucro formada por programadores alrededor del mundo y orientada a promover el uso del Web a través de diferentes plataformas y sistemas operativos, así como brindar una solución al diseño e implementación de Servidores Web de alto rendimiento que se adecúen a los estándares del protocolo HTTP.Apache es distribuido de forma gratuita a través de la licencia GNU en diferentes plataformas como Linux, Windows 95 y Windows NT. La distribución de Red Hat Linux incluye al servidor web de Apache Project y su configuración resulta bastante sencilla a través de un conjunto de archivos.

 

Para el almacenamiento de los datos se optó por combinar dos tipos diferentes de arquitectura de bases de datos:- El sistema de archivos  de Linux. Debido a que Combine System, utiliza dicho sistema para simular una base de datos a través de una estructura de dos niveles de subdirectorios, en la que los registros corresponden a archivos cuyo nombre es el resultado de la codificación MD5 del URL.- Para publicar los resultados de la búsqueda se utilizó la herramienta WWWIsis,  la cual requiere, como se explicará más delante de un archivo maestro en formato ISIS, además de un archivo de especificaciones de índice. CDS/ISIS es un esquema de bases de datos que inicialmente fue utilizado por la UNESCO para proveer de sistemas de información relacionados al área de salud en América Latina a un bajo costo y con un desempeño aceptable. CDS/ISIS se caracteriza por manejar eficientemente información basada en texto a través de registros de longitud variable
La información que extrae Combine System es procesada a través de una rutina escrita en Perl especialmente para tal efecto y que crea un archivo en formato de transferencia ISO-2709, en cual es luego enviado como parámetro a una rutina de conversión a formato CDS/ISIS y otra rutina de indexamiento, a partit de la cual, estará disponible para ser consultada desde el Web.

 

WWWIsis es una herramienta diseñada para funcionar como un servidor de bases de datos ISIS en un ambiente cliente/servidor y para operar a través del CGI, desarrollada y distribuida por Bireme.

Bireme - Reseña Histórica.

Bireme, actualmente denominada Centro Latinoamericano y del Caribe de Información en Ciencias para la Salud, fue creada en 1967 mediante un convenio de la Organización Panamericana de la Salud y el gobierno brasileño a través de ministerios de Salud y Educación, la secretaría de Salud de Estado de Sao Paulo y la Escuela Paulista de Medicina, donde está localizada.
 
Para llevar a cabo el Sistema Regional de Información y Documentación en Ciencias de la Salud, BIREME creó una metodología de trabajo normalizada, con definiciones claras de cobertura temática, criterios de selección, vocabulario controlado, normas para la descripción bibliográfica, procedimientos para análisis de contenido y su indización.
WWWIsis surgió entonces como parte de este esfuerzo de colaboración en el área de salud impulsado por Bireme. Es parte del conjunto de utilidades CISIS para manejar y administrar bases de datos ISIS. Su desarrollo se basa en las principales funciones de dichas utilidades CISIS, especialmente MX para la recuperación y edición de registros y MZ para la consulta al fichero ordenado.Con WWWIsis es posible desarrollar una interfaz cliente/servidor completamente gráfica para interactuar con bases de datos ISIS en ambientes Internet e Intranet.
Aprovechando las facilidades de uso y desarrollo de aplicaciones de consulta a través de Internet que permite WWWIsis, y la experiencia que se ha obtenido en la publicación de bases de datos correspondientes a la Biblioteca "Florentino Idoate", como la Librería de la UCA, y de los Trabajos de Graduación en Ciencia y Tecnología todos de la Universidad Centroamericana "José Simeón Cañas", se decidió utilizar dicha herramienta, obteniéndose un rendimiento acorde a lo esperado a cambio de un mínimo y eficiente consumo de recursos.

 

Anterior    Contenido    Siguiente