User Tools

Site Tools


tara

TARÁ- Cluster HPC PRIS-Lab

El cluster del laboratorio de Reconocimiento de Patrones y Sistemas Inteligentes (PRIS-Lab por sus siglas en inglés), es el núcleo central de procesamiento del laboratorio, con el cuál se utilizan diversas herramientas para el desarrollo de nuevo conocimiento, que implican cálculos computacionales, de un procesamiento exhaustivo, denominados computación de alto rendimiento (HPC por sus síglas en inglés).

Historia

El cluster fue obtenido en el año 2015, que para entonces se instaló en el edificio de informática de la Universidad de Costa Rica. Pronto después se migró hacia el edificio de eléctrica, a finales del año 2016.

Su nombre se debe a una tradicion histórica dentro de la Universidad de Costa Rica, al seleccionar nombres de dioses antiguos segun tradiciones de aborigenes costarricenses. Tara, en este caso, se refiere al dios del trueno de la tradición Bribri.

Infraestructura

Hardware

El clúster HPC Tára posee:

  • Cuatro nodos de procesamiento, cada uno con 32 núcleos y con dos tarjetas Nvidia Tesla K20m, en racks R720.
  • Cuatro nodos de almacenamiento, cada uno con 12 unidades de almacenamiento Constellation ES.3, de 4 TB de almacenamiento para un total de 192 TB, montados en racks R720xd.
  • Un nodo maestro como proxy, gestor de tareas y calendarización. El nodo maestro del cluster debe ser usado solamente para editar archivos, compilar programas y para realizar pequeñas tareas. Si se realiza un cálculo de gran magnitud, afectaria a otros usuarios, además de estar limitado a los recursos de ese nodo.
  • Un Switch Dell Powerconnect 8164.
  • Una UPS Eaton de 5-60 KVA, Trifásica.
  • Nodos JAM.

Jerarquía del Software

Para realizar calculos o procesos, se deben ejecutar en uno o mas de los nodos de procesamiento. Estos nodos solo pueden ser utilizados a través del sistema de administración de tareas. La función del sistema de administración de tareas es reservar recursos (procesadores y memoria) a la tarea del usuario. Solo una tarea, puede hacer uso de los procesadores asignados y a una parte de la memoria en un momento dado. No se puede ejecutar ninguna tarea cuando todos los núcleos estan ocupados, la tarea quedaría en la cola. El sistema de administración de tareas realiza funciones como el monitoreo de los nodos de procesamiento, controlar las tareas (inicio y finalización) y el monitoreo del estado de las tareas en ejecución.

Sistema Operativo

Utilizando CentOS (Community Enterprise Operating System), el cuál es compatible con Red Hat, y el cual ofrece soporte cada 6 meses aproximadamente, para programas más recientes.

Compiladores

GCC: GNU Compiler Collection, es el compilador creado para GNU, de licencia general publica. Inicialmente solo daba soporte a lenguajes como C, y posteriormente se extendio para C++, Fortran y otros. En el cluster se manejan las versiones de GCC 4.9.4, 6.4.0 y 7.3.0. Esto debido que al instalar el entorno, se utilizara uno o el otro según las depedencias respectivas que se deban construir.

Gestores de Paquetes

RPM: RedHat Package Manager forma parte del entorno predeterminado dentro de los sistemas operativos RedHat. Esta es una herramienta intrínseca en el manejo de paquetes en Red Hat.

Yum: Yellow Dog Updater. Esta herramienta manejador de paquetes es la herramienta que viene incluida en sistemas basados en RPM, la cual fue adoptada por CentOS. Este puede alcanzar paquetes mediante manejo de repositorios, dependencias y versiones apropiadas para el sistema. Mediante este se instalan los paquetes rpm creados dentro del cluster.

O.S.C.A.R.

Open Source Cluster Application Resources, conjunto de software dedicado al manejo de datos dentro de sistemas cluster.

  • Torque: Terascale Open-source Resource and Queue Manager es el manejador de distribución de recursos utilizado en el clúster.
  • Maui: Catalogador de tareas utilizado en conjunto con torque, para el soporte de politicas múltiples, que mejora la eficiencia dentro de los clúster.
  • Moab: Administrador de cargas de procesamiento para cluster. Este es software privativo.
tara.txt · Last modified: 2018/09/24 05:22 by lbenavidesa