Cloud y High-Performance Computing: en qué trabajamos en el OT3

Autor:
CTIC
Fecha:
01/06/2023
Compartir
3D illustration of blocks
Autor
CTIC
CTIC
Newsletter

Suscríbete al newsletter para recibir todas las novedades de Inndromeda.

En el Objetivo Tecnológico 3 (OT3) estamos explorando el impacto de tecnologías basadas en Cloud Computing y técnicas de High-Performance Computing (HPC) en el ciclo de vida de los modelos de aprendizaje automático. Este objetivo tecnológico es un poco más diverso en comparación con los demás y adopta un punto de vista amplio. Concretamente, tenemos cuatro líneas de investigación en activo:

3.1. La primera línea está enfocada en Quantum Machine Learning (QML). Por un lado, se está trabajando en identificar las mejores prácticas para el despliegue y la ejecución de cargas de simulación de modelos basados en QML dentro de plataformas de altas prestaciones. Por ejemplo, la manera en la que los trabajos escalan con el número de CPUs y la definición de guías claras para la asignación de trabajos a GPU o CPU. Además, se están desarrollando pruebas de concepto concretas para la demostración de técnicas QML. De esta manera, se persigue ilustrar el impacto esperable que la computación cuántica podría tener en el futuro de la inteligencia artificial.

3.2. Esta segunda línea se aproxima al dominio del alto rendimiento desde otro punto de vista. Más específicamente, se centra en el impacto que las redes neuronales basadas en aleatorización pueden tener en el dominio del Internet de las cosas (IoT) y los ordenadores embebidos de bajas prestaciones. Por ejemplo, estudiando redes neuronales como las denominadas Random Vector Functional Link (RVFL). Los resultados en la literatura apuntan a que es razonable implementar procesos de entrenamiento continuo sobre CPUs poco potentes si se utilizan estas técnicas, a costa de un impacto asumible en la precisión del modelo.

3.3. La tercera línea tiene como objetivo acometer algunos de los numerosos retos que surgen de la implementación del Cloud Continuum en la realidad. Este paradigma persigue la interoperabilidad de servicios e infraestructura en la nube, ya sea de manera horizontal entre diferentes plataformas públicas, híbridas o privadas, como de manera vertical desde la nube hasta los servicios edge. Ejemplos concretos de retos son la monitorización de los recursos y de la provisión de los servicios, el re-despliegue automático, y la adaptación de los recursos de computación de manera dinámica en función de las demandas.

3.4. Finalmente, la cuarta línea se centra en el estudio y la implementación de pruebas de concepto de esquemas de compartición de datos conformes a las especificaciones Gaia-X. Esto hace que tenga una relación muy estrecha con el OT4, que está enfocado en los Espacios de Datos. Gaia-X es una de las iniciativas principales dentro de Europa para la federación de infraestructuras de datos y servicios. AI4ES persigue aportar al estado de la técnica a través de la implementación de casos de uso concretos y reales para validar la tecnología y servir como demostrador de posibles vías de adopción de Gaia-X en la industria.

Imágen ilustrativa: (C)  Shubham Dhage vía Unsplash