Use this identifier to quote or link this document: http://hdl.handle.net/2072/12811

Applying RADIC in Open MPI: the methodology used to implement RADIC over a Message Passing Library
Fialho Queiroz, Leonardo
Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius; Rexachs del Rosario, Dolores Isabel
Fault tolerance has become a major issue for computer and software engineers because the occurrence of faults increases the cost of using a parallel computer. RADIC is the fault tolerance architecture for message passing systems which is transparent, decentralized, flexible and scalable. This master thesis presents the methodology used to implement the RADIC architecture over Open MPI, a well-know large-used message passing library. This implementation kept the RADIC architecture characteristics. In order to validate the implementation we have executed a synthetic ping program, besides, to evaluate the implementation performance we have used the NAS Parallel Benchmarks. The results prove that the RADIC architecture performance depends on the communication pattern of the parallel application which is running. Furthermore, our implementation proves that the RADIC architecture could be implemented over an existent message passing library.
La tolerància a fallades s'ha convertit en un requeriment important pels enginyers informàtics i els desenvolupadors de programari, degut a que l'aparició de fallades augmenta el cost d'explotació d'un ordinador paral•lel. RADIC és una arquitectura de tolerància a fallades per sistemes de pas de missatges transparent, descentralitzada, flexible i escalable. Aquest treball d’investigació de final de màster presenta la metodologia utilitzada per implementar l'arquitectura RADIC per a Open MPI, una llibreria ben coneguda i molt utilitzada de pas de missatges. Aquesta implementació manté les característiques originals de RADIC. Per validar la implementació executem una aplicació sintètica de ping. A més, per avaluar les prestacions de la implementació utilitzem els benchmarks paral•lels NAS. Els resultats han provat que les prestacions de l'arquitectura RADIC depenen de l'aplicació que s'estigui executant. A més, la nostra implementació prova que l'arquitectura RADIC pot ser implentada en una llibreria de pas de missatges ja existent.
2008
68 - Indústries, oficis i comerç d'articles acabats. Tecnologia cibernètica i automàtica
Tolerància als errors (Informàtica)
Ordinadors paral·lels
Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i el departament i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/)
Research/Master Thesis
         

Full text files in this document

Files Size Format
TR Leonardo Fialho.pdf 1.736 MB PDF

Show full item record

 

Coordination

 

Supporters