04 diciembre 2008

Seguimos hablando de la tecnología GRID y sus aplicaciones

En este blog tratamos de explorar las posibilidades de crear comunidades virtuales específicamente centradas en la mejora de la productividad. Ya hemos tratado este tema en dos artículos: “La tecnología Grid en Comunidades Virtuales” y “Aplicaciones de la tecnología Grid en la gestión de organizaciones complejas”. En esta ocasión seguimos avanzando en la descripción de la tecnología GRID y especialmente en sus aplicaciones en software libre.
Buceando en la tecnología GRID
La tecnología GRID, es aplicable a la implementación de proyectos complejos, y sus ideas esenciales pueden ser utilizadas en el desarrollo de una plataforma electrónica en código abierto. Entre las definiciones aplicables podemos hablar también de “Grid Computing”, un modelo de computación emergente que proporciona la capacidad para realizar actividades de computación de alto rendimiento a partir de computadores trabajando en red a través de una arquitectura computerizada virtual, y que es capaz de ejecutar procesos distribuidos a través de una infraestructura paralela. Grids usa los recursos de muchas estructuras separadas conectadas en una red (a través de internet). La definición más interesante es la de Plaszczak/Wellner, que define la tecnología Grid, como “la tecnología que permite la virtualizar recursos, proveer recursos bajo demanda, procesar energía, capacidad de almacenamiento y una amplia cantidad de recursos de computación en internet”. La descripción de esta tecnología podemos encontrarla también en Knobloch & Robertson 2005, así como su aplicación para un sistema GRID complejo. Uno de los proyectos más destacables de la tecnología GRID es “Worldwide LHC Computing Grid”, en el que participan más de 140 centros de computación de más de 33 países. El WLCG se ha construido y diseñado para almacenar y analizar datos de toda la comunidad de físicos de alta energía que usan el gran colisionador de hadrones, en CERN. La descripción completa de este proyecto puede consultarse aquí. Este sistema GRID está pensado para conectar al mismo entre 5 y 8 mil nodos (servicios de CPU, discos y cintas).
La tecnología GRID en la Unión Europea
Como no podía ser de otra forma, en el conglomerado de países que forman la UE el desarrollo de la tecnología GRID es crítico. El objetivo fundamental es conseguir acceso fácil en cualquier parte para trabajar a nivel de supercomputación, con lo cual su impacto en la sociedad puede ser profundo, llegando a revolucionar el internet del mañana. Europa trabaja en una “Computational Grid”, cuya finalidad sea la obtención sencilla de recursos de internet independientemente del lugar donde estemos en cada momento. Con la tecnología GRID, el PC puede convertirse en una puerta a un supercomputador, realmente es posible conectar entre sí una gran variedad de computadores, almacenes de datos, programas de software, instrumentación científica y mucho más. La diferencia de la tecnología GRID respecto a internet es que no sólo puedes mirar contenidos, sino que puedes aprovecharte de los recursos de ordenadores mucho más potentes que el tuyo. Pero puedes obtener mucho más que eso – ahora tienes acceso a cantidades masivas de datos, ya estén almacenados en dispositivos de almacenaje o estén fluyendo en tiempo real de instrumentos científicos o sensores. Asimismo, con el denominado semantic analysis software, todo ese conocimiento puede analizarse y manipularse, obteniendo acceso instantáneo a respuestas independientemente del lugar donde nos encontremos.
Del laboratorio a la industria
Grids fue inicialmente concebida para los grandes proyectos de ciencias, que requerían grandes cantidades de datos y cálculos altamente intensivos. De hecho, la aplicación pionera de Grid fue el proyecto CERN. Pero ahora mismos, esta tecnología se está desarrollando en todo el mundo, y permitirá un acceso al conocimiento y recursos científicos a un nivel sin precedentes. Pero más recientemente aún, las Grids iniciaron su camino por nuevas aguas, y su impacto en la ingeniería y los negocios será masivo, de hecho ya se está sintiendo. También sectores tan diversos como la medicina, cultura y entretenimiento se enfrentan a cambios radicales. Pues bien, imaginemos lo que pueden dar de sí las Grids si las aplicamos a las pequeñas industrias. En una pequeña y mediana industria pueden ser necesarias actuaciones puntuales que requieran altos niveles de computación, y que ahora no se realizan por el coste que ello conlleva. Pero las Grids solucionan este problema, permitiendo incluso que compañías diferentes trabajen juntas con facilidad en proyectos de ingeniería complejos que requieran alta intensidad de diseño.
Arquitectura Grid
La arquitectura general puede basarse en unidades funcionales que proporcionen recursos de microprocesador y almacenamiento. Cada una de estas unidades contiene muchos nodos independientes conectados en la capa física con un network ethernet, estructurado en niveles, y jerárquico. La aplicación consigue el acceso a los recursos vía interfaces de software a los paquetes principales que proporcionan conexión lógica de todos los nodos y unidades funcionales en el sistema. Se requiere asimismo:
  • Un sistema batch para distribuir y equilibrar los recursos de las CPU.
  • Un sistema de archivos compartido, global, distribuido, de tamaño medio.
  • Un “disk pool manager” emulando un sistema de archivos compartidos, global y distribuido para los datos principales y un sistema de almacenamiento grande asociado.
  • El sistema es gestionado por un sistema de gestión de nodos de bajo nivel y un pequeño grupo de componentes de software sofisticado (sistema batch, sistema de almacenamiento en masa, sistema de management).

Interoperabilidad

Son los servicios básicos que deben proporcionarse para la implementación del GRID. La mayoría son interfaces básicas desde los servicios del GRID hasta los computadores locales, y los mecanismos entre los que actúan. Está claro que deben proporcionarse de tal modo que la aplicación no origine problemas cuando la infraestructura GRID esté funcionando.

Desafíos técnicos

Las Grids son hoy complejas de crear, requiriendo expertos en sistemas operativos y redes. Hay también dificultades de programación, ya que aún hay numerosas plataformas y protocolos, difíciles de mantener. La visión de la siguiente generación de Grids es que estas dificultades vayan desapareciendo y su uso sea cada vez más fácil.

Links de la tecnología GRID

Por último una serie de enlaces seleccionados sobre la tecnología GRID, algunos de los cuales iremos explorando en próximos artículos.

Palabras clave: Source Grid Operation System, supercomputer-level processing power

Publicar un comentario