Accélération d'algorithmes bio-informatiques sur une architecture Processing-in-Memory

Version imprimable

Accélération d'algorithmes bio-informatiques sur une architecture Processing-in-Memory
(Acceleration of bioinformatics algorithms on a Processing-in-Memory architecture)

Mognol, Meven - (2025-07-02) / Université de Rennes - Accélération d'algorithmes bio-informatiques sur une architecture Processing-in-Memory

Langue : Anglais
Directeur de thèse: Lavenier, Dominique
Laboratoire : IRISA
Ecole Doctorale : MATISSE

Thématique : Informatique

Accès à la ressource :

https://ged.univ-rennes1.fr/nuxeo/site/esupversion...

Mots-clés : Processing-in-Memory, Parallèlisme, Tri, Alignement de séquences, Mappage de read, Parallélisme (informatique), Bioinformatique

Résumé : La bio-informatique est un domaine où les besoins en calcul sont extrêmement importants. En particulier, en génomique, la dernière décennie a vu l’émergence de nouvelles technologies de séquençage de l’ADN, entraînant une explosion de la quantité de données à traiter. Les algorithmes de traitement de ces données ont évolué, mais se heurtent de plus en plus aux limites matérielles liées à l’accès mémoire sur des architectures traditionnelles telles que les CPU et les GPU. Bien que certains composants, tels que les FPGA, permettent de créer des circuits très spécialisés, ces derniers restent coûteux et nécessitent une grande expertise pour leur mise en œuvre. Parallèlement, le processing-in-memory (PiM), une technologie envisagée dès les années 1970, attire un intérêt croissant dans l’industrie. Dans ce manuscrit, nous analysons trois algorithmes liés à la génomique sur l’accélérateur PiM généraliste et programmable de la société UPMEM. Nous étudions d’abord le comportement des algorithmes sur une architecture CPU traditionnelle, implémentons leur équivalent sur le PiM UPMEM, et comparons les performances en termes de temps d’exécution et de consommation énergétique. Enfin, nous formulons des recommandations, fondées sur nos études, pour les futures architectures PiM généralistes.

Résumé (anglais) : Bioinformatics is a field where computational requirements are extremely high. In particular, in genomics, the past decade has witnessed the emergence of new DNA sequencing technologies, leading to an explosion in the amount of data to be processed. The algorithms designed to process this data have evolved, yet they increasingly encounter hardware limitations related to memory access on traditional architectures such as CPUs and GPUs. Although certain components, such as FPGAs, enable the creation of highly specialized circuits, they remain expensive and require significant expertise to implement. At the same time, processing-in-memory (PiM), a technology envisioned as early as the 1970s, is attracting growing interest in the industry. In this manuscript, we analyze three genomics-related algorithms on the general-purpose, programmable PiM accelerator from UPMEM. We first study the behavior of these algorithms on a traditional CPU architecture, implement their counterparts on the UPMEM PiM, and compare performance in terms of execution time and energy consumption. Finally, we provide recommendations based on our studies for future general-purpose PiM architectures.

Identifiant : rennes1-ori-wf-1-20965

Exporter au format XML