Please use this identifier to cite or link to this item: http://hdl.handle.net/10201/49988

Title: Análisis y evaluación de arquitecturas heterogéneas basadas en Intel Xeon Phi para problemas científicos basados en patrones de cómputo stencil
Issue Date: 1-Jun-2016
Date of creation: 29-Apr-2016
Related subjects: 004.2 - Arquitectura informática
Keywords: Programación paralela
Arquitectura de ordenador
Abstract: El auge de los campos de investigación basados en la simulación y el modelado,junto con el aumento de las necesidades del sector servicios (web y bases de datos),están poniendo a prueba las capacidades de cómputo de las arquitecturas dealto rendimiento. La tendencia actual es que los supercomputadores basen su diseñoen arquitecturas heterogéneas, donde se unen los tradicionales procesadoresde altas prestaciones con un número importante de aceleradores/coprocesadores.Entre los patrones de cómputo más utilizados por los grandes centros de datosse encuentran los métodos de las diferencias finitas, también conocidos comopatrones Stencil, comúnmente utilizados para resolver ecuaciones en derivadasparciales. Esta Tesis doctoral se centra en el diseño, análisis y evaluación de aplicacionescientíficas sobre plataformas de computación de altas prestaciones basadas enarquitecturas heterogéneas. En concreto, abordamos el desarrollo de códigoscientíficos basados en patrones Stencil sobre una arquitectura heterogénea x86,donde conviven procesadores orientados a latencia y procesadores orientadosa rendimiento (throughput), es decir, procesadores Intel Xeonmultinúcleo contarjetas coprocesadoras Intel Xeon Phi. Hemos evaluado los dos modos de trabajomás importantes que tiene Xeon Phi, el nativo y el de descarga (offload). Para elmodo nativo ofrecemos una guías que permiten optimizar el rendimiento y laeficiencia energética de códigos basados en patrones Stencil a través de tres kernelsde ejemplo (difusión acústica, sísmica y de calor), mostrando cómo vectorizary paralelizar el código, además de otras técnicas sencillas que aumenten elrendimiento. En el modo offload hemos mostrado como ejecutar el código usandodos tarjetas Xeon Phi, lo cual nos ha permitido mejorar las prestaciones delcódigo así como manejar tamaños más grandes de problemas. Para paliar lasobrecarga de las comunicaciones de datos entre las tarjetas y el procesador Xeon,hemos propuesto relajar la precisión de los resultados obtenidos. Finalmente, a lo largo de toda la Tesis hemos tenido como objetivo compararnuestros resultados con los obtenidos en otras dos arquitecturas de altas prestaciones:el Xeonmultinúcleo y la arquitectura CUDA de las tarjetas GPUs deNvidia. Dicha comparación la hemos realizado tanto en tiempo de ejecucióncomo en rendimiento energético.   Abstract The growth in research fields based on simulation and modelling, along withthe ever increasing needs of the services sector (web services and databases),is pushing the capability limits of high performance architectures. To addressthis issue, most supercomputers are moving to heterogeneous designs, wheretraditional latency-oriented processors are packed together with a substantialnumber of throughput-oriented accelerators. There is a vast sea of applicationsfound running in supercomputers, and some of them share specific computationpatterns. Finite difference methods are among the most common computationalpatterns in many fields of Science and Engineering. This pattern, also known asStencil, is commonly used to solve partial differential equations (PDEs). This Thesis focuses on the design, analysis and evaluation of scientific applicationsfor high performance computing based on heterogeneous architectures.More specifically, we have focused on the development of scientific codes basedon Stencilpatterns for an x86 heterogeneous architecture. This architecture packtogether both latency-oriented and throughput-oriented processors, namely IntelXeon chips and Intel Xeon Phi cards. Our evaluation has covered the most importantworking modes of Xeon Phi, native and offload. For the native mode wehave proposed a series of guidelines to optimize both performance and energy efficiencyfor applications based on Stencilpatterns, showing three example kernels(acoustic, seismic and heat diffusion) as a case study. The guidelines cover thevectorization and parallelization processes, as well as other simple but powerfuloptimization techniques. In the offload mode we have shown how to run thecode using two Xeon Phi cards, which allowed to improve both performance andhandle larger dataset sizes. We have proposed to relax the accuracy of the coderesults to alleviate the overhead of data communications between acceleratorsand the Xeon processor. Finally, throughout the Thesis, we have aimed to compare our results withthose obtained in two other high-performance architectures: the Intel Xeonmulticore and the Nvidia CUDA architecture. We have done this comparisonboth in runtime and energy efficiency.
Primary author: Hernández Hernández, Mario
Director: Cecilia Canales, José Mª
Cebrián González, Juan Manuel
García Carrasco, José Manuel
Faculty / Departments / Services: Facultad de Informática
Published in: Proyecto de investigación:
URI: http://hdl.handle.net/10201/49988
Document type: info:eu-repo/semantics/doctoralThesis
Number of pages / Extensions: 231
Rights: info:eu-repo/semantics/openAccess
Appears in Collections:Ingeniería

Files in This Item:
File Description SizeFormat 
MARIO HERNANDEZ TESIS DOCTORAL.pdf10,03 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons