Desarrollo de una plataforma para la administración de ejecuciones de workflows en un entorno de trabajo en bioinformática.
 

Gustavo A. Salazar O.
ParqueSoft, Laboratorio de Bioinformática,
Santiago de Cali, Colombia, 057
gasalazar@parquesoft.com

Oscar E. Restrepo V.
ParqueSoft, Laboratorio de Bioinformática,
Santiago de Cali, Colombia, 057
orestrepo@parquesoft.com

Yesid Cuesta A.
ParqueSoft, Laboratorio de Bioinformática,
Santiago de Cali, Colombia, 057
ycuesta@parquesoft.com

and

Fernando Barraza A.
ParqueSoft, Laboratorio de Bioinformática,
Santiago de Cali, Colombia, 057
fbarraza@parquesoft.com

 
Abstract
 
With the incoming of the massive data generation Technologies, used in projects such as the human genome sequencing, the need to automates and simplify the routine processes to obtain, integrate and analyze great amount of data has emerged, in order for it to be constituted in true support information within the applications in bioscience. Possible solutions have been met through platforms implantation in bioinformatics where one of the most important elements to handle it is the workflows systems. Relative this matter, this document analyzes the particular characteristics of these platforms and as a result it presents an architectural proposal inspired in the reference model of the WfMC (Workflow Management Coalition) which was adapted with the necessaries considerations about bioinformatics. Also it is described its implementation in a real case, where a web interface stands out which allows the execution and functional extension of workflow engines applied to bioinformatics.
 
Keywords: Bioinformatics, Software Engineering, Software Architectures, Workflows.
Resumen
 
Con el advenimiento de las tecnologías de generación masiva de datos, utilizadas en proyectos como el secuenciamiento del genoma humano, ha surgido la necesidad de automatizar y simplificar los procesos rutinarios de obtener, integrar y analizar grandes cantidades de datos, para que se constituyan en información de soporte verdadero en las aplicaciones realizadas para el área de las biociencias. Las posibles soluciones se están abordando con la implementación de plataformas de análisis bioinformáticas donde uno de los elementos determinantes son los sistemas para manejo de flujos de trabajo (workflows). Al respecto, este escrito analiza las características particulares de dichas plataformas y como resultado presenta una propuesta de arquitectura inspirada en el modelo de referencia de la WfMC (Workflow Management Coalition) que ha sido adaptada según las consideraciones necesarias de la bioinformática. También se describe su implementación en un caso real, donde se destaca una interfaz Web que permite la ejecución y extensión funcional de los motores de workflows aplicados a la bioinformática.
 
Palabras Clave: Bioinformática, Ingeniería de Software, Arquitecturas de Software, Workflows.