Comment utiliser la commande pmap sous Linux

Publié: 2022-06-25
Ordinateur portable Linux affichant une invite bash
fatmawati achmad zaenuri/Shutterstock.com

Connaître la quantité de RAM utilisée par un processus Linux n'est pas une mince affaire, en particulier lorsque la mémoire partagée doit être prise en compte. Heureusement, la commande pmap vous aide à comprendre tout cela.

Cartographie de la mémoire

Sur les systèmes d'exploitation modernes, chaque processus vit dans sa propre région allouée de mémoire ou d'espace d'allocation . Les limites de la région allouée ne sont pas mappées directement sur les adresses matérielles physiques. Le système d'exploitation crée un espace de mémoire virtuelle pour chaque processus et agit comme une couche d'abstraction mappant la mémoire virtuelle à la mémoire physique.

Le noyau maintient une table de traduction pour chaque processus, accessible par le CPU. Lorsque le noyau modifie le processus exécuté sur un cœur de processeur particulier, il met à jour la table de traduction qui relie les processus et les cœurs de processeur.

Les avantages de l'abstraction

Il y a des avantages à ce régime. L'utilisation de la mémoire est quelque peu encapsulée et mise en bac à sable pour chaque processus dans le userland. Un processus ne "voit" la mémoire qu'en termes d'adresses de mémoire virtuelle. Cela signifie qu'il ne peut fonctionner qu'avec la mémoire qui lui a été attribuée par le système d'exploitation. À moins qu'il n'ait accès à une mémoire partagée, il ne connaît ni n'a accès à la mémoire allouée aux autres processus.

Qu'est-ce que Swappiness sous Linux ? (et comment le changer)
CONNEXION Qu'est-ce que Swappiness sous Linux? (et comment le changer)

L'abstraction de la mémoire physique matérielle en adresses de mémoire virtuelle permet au noyau de modifier l'adresse physique à laquelle une mémoire virtuelle est mappée. Il peut échanger la mémoire sur le disque en modifiant l'adresse réelle vers laquelle pointe une région de mémoire virtuelle. Il peut également différer la fourniture de mémoire physique jusqu'à ce qu'elle soit réellement requise.

Tant que les demandes de lecture ou d'écriture de la mémoire sont traitées comme elles sont demandées, le noyau est libre de jongler avec la table de mappage comme bon lui semble.

RAM à la demande

La table de mappage et le concept de "RAM à la demande" ouvrent la possibilité d' une mémoire partagée . Le noyau essaiera d'éviter de charger plusieurs fois la même chose en mémoire. Par exemple, il chargera une fois une bibliothèque partagée en mémoire et la mappera aux différents processus qui doivent l'utiliser. Chacun des processus aura sa propre adresse unique pour la bibliothèque partagée, mais ils pointeront tous vers le même emplacement réel.

Si la zone de mémoire partagée est accessible en écriture, le noyau utilise un schéma appelé copie sur écriture. Si un processus écrit dans la mémoire partagée et que les autres processus partageant cette mémoire ne sont pas censés voir les modifications, une copie de la mémoire partagée est créée au moment de la demande d'écriture.

Geek débutant : comment créer et utiliser des machines virtuelles
CONNEXION Débutant Geek : Comment créer et utiliser des machines virtuelles

Le noyau Linux 2.6.32, sorti en décembre 2009, a donné à Linux une fonctionnalité appelée "Kernel SamePage Merging". Cela signifie que Linux peut détecter des régions de données identiques dans différents espaces d'adressage. Imaginez une série de machines virtuelles s'exécutant sur un seul ordinateur, et les machines virtuelles exécutent toutes le même système d'exploitation. En utilisant un modèle de mémoire partagée et la copie sur écriture, la charge sur l'ordinateur hôte peut être considérablement réduite.

Tout cela rend la gestion de la mémoire sous Linux sophistiquée et aussi optimale que possible. Mais cette sophistication rend difficile l'examen d'un processus et la connaissance de son utilisation réelle de la mémoire.

L'utilitaire pmap

Le noyau expose une grande partie de ce qu'il fait avec la RAM via deux pseudo-fichiers dans le pseudo-système de fichiers d'informations système "/ proc". Il y a deux fichiers par processus, nommés d'après l'ID ou le PID de chaque processus : "/proc/maps" et "/proc//smaps".

L'outil pmap lit les informations de ces fichiers et affiche les résultats dans la fenêtre du terminal. Il sera évident que nous devons fournir le PID du processus qui nous intéresse chaque fois que nous utilisons pmap .

Recherche de l'ID de processus

Il existe plusieurs façons de trouver le PID d'un processus. Voici le code source d'un programme trivial que nous utiliserons dans nos exemples. Il est écrit en C. Tout ce qu'il fait est d'imprimer un message dans la fenêtre du terminal et d'attendre que l'utilisateur appuie sur la touche "Entrée".

 #include <stdio.h>

int main(int argc, char *argv[])
{
  printf("Programme de test How-To Geek.");
  getc(stdin);
} // fin de main

Le programme a été compilé dans un exécutable appelé pm à l'aide du compilateur gcc :

 gcc -o pm pm.c 

Compilation du programme exemple

Parce que le programme attendra que l'utilisateur appuie sur "Entrée", il continuera à fonctionner aussi longtemps que nous le souhaitons.

 ./h 

Exécution du programme d'exemple

Le programme se lance, imprime le message et attend la frappe. Nous pouvons maintenant rechercher son PID. La commande ps répertorie les processus en cours d'exécution. L'option -e (afficher tous les processus) permet à ps de lister tous les processus. Nous allons diriger la sortie via grep et filtrer les entrées qui ont "pm" dans leur nom.

 ps-e | grep pm 

Trouver l'ID de processus avec grep

Cela répertorie toutes les entrées avec "pm" n'importe où dans leurs noms.

Nous pouvons être plus précis en utilisant la commande pidof . Nous donnons à pidof le nom du processus qui nous intéresse sur la ligne de commande, et il essaie de trouver une correspondance. Si une correspondance est trouvée, pidof imprime le PID du processus correspondant.

 pidof pm 

Utilisation de pidof pour trouver l'ID de processus

La méthode pidof est plus soignée lorsque vous connaissez le nom du processus, mais la méthode ps fonctionnera même si vous ne connaissez qu'une partie du nom du processus.

Utilisation de pmap

Avec notre programme de test en cours d'exécution, et une fois que nous avons identifié son PID, nous pouvons utiliser pmap comme ceci :

 pmap 40919 

Exécution de pmap sur le programme d'exemple

Les mappages de mémoire pour le processus sont répertoriés pour nous.

La sortie pmap standard

Voici le résultat complet de la commande :

 40919 : ./h
000056059f06c000 4K r---- pm
000056059f06d000 4K rx--pm
000056059f06e000 4K r---- pm
000056059f06f000 4K r---- pm
000056059f070000 4K le--- pm
000056059fc39000 132K rw--- [ anon ]
00007f97a3edb000 8K rw--- [ anon ]
00007f97a3edd000 160K r---- libc.so.6
00007f97a3f05000 1616K rx-- libc.so.6
00007f97a4099000 352K r---- libc.so.6
00007f97a40f1000 4K ----- libc.so.6
00007f97a40f2000 16K r---- libc.so.6
00007f97a40f6000 8K rw --- libc.so.6
00007f97a40f8000 60K rw--- [ anon ]
00007f97a4116000 4K r---- ld-linux-x86-64.so.2
00007f97a4117000 160K rx-- ld-linux-x86-64.so.2
00007f97a413f000 40K r---- ld-linux-x86-64.so.2
00007f97a4149000 8K r---- ld-linux-x86-64.so.2
00007f97a414b000 8K rw --- ld-linux-x86-64.so.2
00007ffca0e7e000 132K rw--- [ pile ]
00007ffca0fe1000 16K r---- [ anon ]
00007ffca0fe5000 8K rx-- [ anon ]
ffffffffff600000 4K --x-- [ anon ]
total 2756K

La première ligne est le nom du processus et son PID. Chacune des autres lignes affiche une adresse mémoire mappée et la quantité de mémoire à cette adresse, exprimée en kilo-octets. Les cinq caractères suivants de chaque ligne sont appelés autorisations de mémoire virtuelle . Les autorisations valides sont :

  • r : La mémoire mappée peut être lue par le processus.
  • w : La mémoire mappée peut être écrite par le processus.
  • x : Le processus peut exécuter toutes les instructions contenues dans la mémoire mappée.
  • s : La mémoire mappée est partagée et les modifications apportées à la mémoire partagée sont visibles par tous les processus partageant la mémoire.
  • R : Il n'y a pas de réservation d'espace de swap pour cette mémoire mappée.

L'information finale sur chaque ligne est le nom de la source du mappage. Il peut s'agir d'un nom de processus, d'un nom de bibliothèque ou d'un nom de système tel que stack ou heap.

L'affichage étendu

L'option -x (étendue) fournit deux colonnes supplémentaires.

 pmap-x 40919 

Utilisation de l'option étendue -X avec pmap

Les colonnes sont titrées. Nous avons déjà vu les colonnes "Address", "Kbytes", "Mode", et "Mapping". Les nouvelles colonnes sont appelées "RSS" et "Dirty".

La sortie étendue pmap

Voici la sortie complète :

 40919 : ./h
Adresse Ko RSS Cartographie en mode sale
000056059f06c000 4 4 0 r---- pm
000056059f06d000 4 4 0 rx-- pm
000056059f06e000 4 4 0 r---- pm
000056059f06f000 4 4 4 r---- pm
000056059f070000 4 4 4 rw--- pm
000056059fc39000 132 4 4 rw--- [ anon ]
00007f97a3edb000 8 4 4 rw--- [ anon ]
00007f97a3edd000 160 160 0 r---- libc.so.6
00007f97a3f05000 1616 788 0 rx-- libc.so.6
00007f97a4099000 352 64 0 r---- libc.so.6
00007f97a40f1000 4 0 0 ----- libc.so.6
00007f97a40f2000 16 16 16 r---- libc.so.6
00007f97a40f6000 8 8 8 rw--- libc.so.6
00007f97a40f8000 60 28 28 rw--- [ anon ]
00007f97a4116000 4 4 0 r---- ld-linux-x86-64.so.2
00007f97a4117000 160 160 0 rx-- ld-linux-x86-64.so.2
00007f97a413f000 40 40 0 ​​r---- ld-linux-x86-64.so.2
00007f97a4149000 8 8 8 r---- ld-linux-x86-64.so.2
00007f97a414b000 8 8 8 rw --- ld-linux-x86-64.so.2
00007ffca0e7e000 132 12 12 rw--- [ pile ]
00007ffca0fe1000 16 0 0 r---- [ anon ]
00007ffca0fe5000 8 4 0 rx-- [ anon ]
ffffffffff600000 4 0 0 --x-- [ anon ]
---------------- ------- ------- ------- 
total Ko 2756 1328 96
  • RSS : Il s'agit de la taille de l'ensemble résident . C'est-à-dire la quantité de mémoire actuellement dans la RAM et non échangée.
  • Dirty : la mémoire "sale" a été modifiée depuis le début du processus et du mappage.

Montre-moi tout

Le -X (encore plus qu'étendu) ajoute des colonnes supplémentaires à la sortie. Notez le "X" majuscule. Une autre option appelée -XX (encore plus que -X ) vous montre tout ce que pmap peut obtenir du noyau. Comme -X est un sous-ensemble de -XX , nous décrirons la sortie de -XX .

 pmap-XX 40919 

Utilisation de l'option -XX montre-moi tout avec pmap

La sortie s'enroule horriblement dans une fenêtre de terminal et est pratiquement indéchiffrable. Voici la sortie complète :

 40919 : ./h
         Adresse Décalage permanent Taille d'inode du périphérique KernelPageSize MMUPageSize Rss Pss Shared_Clean Shared_Dirty Private_Clean Private_Dirty Référencé Anonyme LazyFree AnonHugePages ShmemPmdMapped FilePmdMapped Shared_Hugetlb Private_Hugetlb Swap SwapPss Locked THPeligible VmFlags Mapping
    56059f06c000 r--p 00000000 08:03 393304 4 4 4 4 4 0 0 4 0 4 0 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw sd pm
    56059f06d000 r-xp 00001000 08:03 393304 4 4 4 4 4 0 0 4 0 4 0 0 0 0 0 0 0 0 0 0 0 rd ex mr mw me dw sd pm
    56059f06e000 r--p 00002000 08:03 393304 4 4 4 4 4 0 0 4 0 4 0 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw sd pm
    56059f06f000 r--p 00002000 08:03 393304 4 4 4 4 4 0 0 0 4 4 4 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw ac sd pm
    56059f070000 rw-p 00003000 08:03 393304 4 4 4 4 4 0 0 0 4 4 4 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me dw ac sd pm
    56059fc39000 rw-p 00000000 00:00 0 132 4 4 4 4 0 0 0 4 4 4 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me ac sd [tas]
    7f97a3edb000 rw-p 00000000 00:00 0 8 4 4 4 4 0 0 0 4 4 4 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me ac sd 
    7f97a3edd000 r--p 00000000 08:03 264328 160 4 4 160 4 160 0 0 0 160 0 0 0 0 0 0 0 0 0 0 0 rd mr mw moi sd libc.so.6
    7f97a3f05000 r-xp 00028000 08:03 264328 1616 4 4 788 32 788 0 0 0 788 0 0 0 0 0 0 0 0 0 0 0 rd ex mr mw me sd libc.so.6
    7f97a4099000 r--p 001bc000 08:03 264328 352 4 4 64 1 64 0 0 0 64 0 0 0 0 0 0 0 0 0 0 0 rd mr mw moi sd libc.so.6
    7f97a40f1000 ---p 00214000 08:03 264328 4 4 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 mr mw moi sd libc.so.6
    7f97a40f2000 r--p 00214000 08:03 264328 16 4 4 16 16 0 0 0 16 16 16 0 0 0 0 0 0 0 0 0 0 rd mr mw me ac sd libc.so.6
    7f97a40f6000 rw-p 00218000 08:03 264328 8 4 4 8 8 0 0 0 8 8 8 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me ac sd libc.so.6
    7f97a40f8000 rw-p 00000000 00:00 0 60 4 4 28 28 0 0 0 28 28 28 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me ac sd 
    7f97a4116000 r--p 00000000 08:03 264305 4 4 4 4 0 4 0 0 0 4 0 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw sd ld-linux-x86-64.so.2
    7f97a4117000 r-xp 00001000 08:03 264305 160 4 4 160 11 160 0 0 0 160 0 0 0 0 0 0 0 0 0 0 0 rd ex mr mw me dw sd ld-linux-x86-64.so.2
    7f97a413f000 r--p 00029000 08:03 264305 40 4 4 40 1 40 0 ​​0 0 40 0 ​​0 0 0 0 0 0 0 0 0 0 rd mr mw me dw sd ld-linux-x86-64.so.2
    7f97a4149000 r--p 00032000 08:03 264305 8 4 4 8 8 0 0 0 8 8 8 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw ac sd ld-linux-x86-64.so.2
    7f97a414b000 rw-p 00034000 08:03 264305 8 4 4 8 8 0 0 0 8 8 8 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me dw ac sd ld-linux-x86-64.so.2
    7ffca0e7e000 rw-p 00000000 00:00 0 132 4 4 12 12 0 0 0 12 12 12 0 0 0 0 0 0 0 0 0 0 rd wr mr mw moi gd ac [pile]
    7ffca0fe1000 r--p 00000000 00:00 0 16 4 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 rd mr pf io de dd sd [vvar]
    7ffca0fe5000 r-xp 00000000 00:00 0 8 4 4 4 0 4 0 0 0 4 0 0 0 0 0 0 0 0 0 0 0 rd ex mr mw me de sd [vdso]
ffffffffff600000 --xp 00000000 00:00 0 4 4 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ex [vsyscall]
                                             ==== ============== =========== ==== === ============ == ========== ============= ============= ========== ==== ===== ======== ============= ============== ========== === ============== =============== ==== ======= ====== = ========== 
                                             2756 92 92 1328 157 1220 0 12 96 1328 96 0 0 0 0 0 0 0 0 0 0 Ko 

Il y a beaucoup d'informations ici. Voici ce que contiennent les colonnes :

  • Adresse : L'adresse de début de ce mappage. Cela utilise l'adressage de la mémoire virtuelle.
  • Perm : Les permissions de la mémoire.
  • Décalage : Si la mémoire est basée sur un fichier, le décalage de ce mappage à l'intérieur du fichier.
  • Périphérique : Le numéro de périphérique Linux, donné en nombres majeurs et mineurs. Vous pouvez voir les numéros de périphérique sur votre ordinateur en exécutant la commande lsblk .
  • Inode : L'inode du fichier auquel le mappage est associé. Par exemple, dans notre exemple, il pourrait s'agir de l'inode contenant des informations sur le programme pm.
  • Size : La taille de la région mappée en mémoire.
  • KernelPageSize : La taille de page utilisée par le noyau.
  • MMUPageSize : La taille de page utilisée par l'unité de gestion de la mémoire.
  • Rss : Il s'agit de la taille de l'ensemble résident . C'est-à-dire la quantité de mémoire actuellement dans la RAM et non échangée.
  • Pss : C'est la taille de part proportionnelle . Il s'agit de la taille partagée privée ajoutée à la (taille partagée divisée par le nombre de partages).
  • Shared_Clean : la quantité de mémoire partagée avec d'autres processus qui n'a pas été modifiée depuis la création du mappage. Notez que même si la mémoire est partageable, si elle n'a pas été réellement partagée, elle est toujours considérée comme une mémoire privée.
  • Shared_Dirty : la quantité de mémoire partagée avec d'autres processus qui a été modifiée depuis la création du mappage.
  • Private_Clean : la quantité de mémoire privée (non partagée avec d'autres processus) qui n'a pas été modifiée depuis la création du mappage.
  • Private_Dirty : La quantité de mémoire privée qui a été modifiée depuis la création du mappage.
  • Référencé : La quantité de mémoire actuellement marquée comme référencée ou accédée.
  • Anonyme : Mémoire qui n'a pas de périphérique vers lequel permuter. C'est-à-dire qu'il n'est pas sauvegardé sur fichier.
  • LazyFree : Pages qui ont été marquées comme MADV_FREE . Ces pages ont été marquées comme disponibles pour être libérées et récupérées, même si elles peuvent contenir des modifications non écrites. Toutefois, si des modifications ultérieures se produisent après que MADV_FREE a été défini sur le mappage de mémoire, l'indicateur MADV_FREE est supprimé et les pages ne seront pas récupérées tant que les modifications ne seront pas écrites.
  • AnonHugePages : il s'agit de pages de mémoire "énormes" sans fichier (plus de 4 Ko).
  • ShmemPmdMapped : Mémoire partagée associée aux pages volumineuses. Ils peuvent également être utilisés par des systèmes de fichiers qui résident entièrement en mémoire.
  • FilePmdMapped : Le Page Middle Directory est l'un des schémas de pagination disponibles pour le noyau. Il s'agit du nombre de pages sauvegardées sur fichier pointées par les entrées PMD.
  • Shared_Hugetlb : Les tables de recherche de traduction, ou TLB, sont des caches mémoire utilisés pour optimiser le temps nécessaire pour accéder aux emplacements mémoire de l'espace utilisateur. Ce chiffre correspond à la quantité de RAM utilisée dans les TLB associés à d'énormes pages de mémoire partagées.
  • Private_Hugetlb : Ce chiffre correspond à la quantité de RAM utilisée dans les TLB associés à des pages de mémoire énormes privées.
  • Swap : Le montant du swap utilisé.
  • SwapPss : La taille de la part proportionnelle du swap . Il s'agit de la quantité d'échange composée de pages de mémoire privées échangées ajoutées au (taille partagée divisée par le nombre de partages.)
  • Verrouillé : les mappages de mémoire peuvent être verrouillés pour empêcher le système d'exploitation de paginer la mémoire du tas ou hors tas.
  • THPeligible : Il s'agit d'un indicateur indiquant si le mappage est éligible pour l'allocation de grandes pages transparentes . 1 signifie vrai, 0 signifie faux. Les pages énormes transparentes sont un système de gestion de la mémoire qui réduit la surcharge des recherches de pages TLB sur les ordinateurs dotés d'une grande quantité de RAM.
  • VmFlags : Voir la liste des drapeaux ci-dessous.
  • Mapping : Le nom de la source du mapping. Il peut s'agir d'un nom de processus, d'un nom de bibliothèque ou de noms de système tels que pile ou tas.

Les VmFlags (indicateurs de mémoire virtuelle) seront un sous-ensemble de la liste suivante.

  • rd : Lisible.
  • wr : Inscriptible.
  • ex : Exécutable.
  • sh : Partagé.
  • mr : Peut lire.
  • mw : Peut écrire.
  • moi : peut exécuter.
  • ms : Peut partager.
  • gd : le segment de la pile grandit.
  • pf : plage de numéros de cadre de page pure. Les numéros de cadre de page sont une liste des pages de mémoire physique.
  • dw : écriture désactivée dans le fichier mappé.
  • lo : Les pages sont verrouillées en mémoire.
  • io : zone d'E/S mappées en mémoire.
  • sr : Conseil de lecture séquentielle fourni (par la fonction madvise() .)
  • rr : Conseil de lecture aléatoire fourni.
  • dc : Ne copiez pas cette région de mémoire si le processus est dupliqué.
  • de : N'étendez pas cette zone de mémoire lors du remappage.
  • ac : La zone est responsable.
  • nr : L'espace d'échange n'est pas réservé à la zone.
  • ht : Area utilise d'énormes pages TLB.
  • sf : Défaut de page synchrone.
  • ar : indicateur spécifique à l'architecture.
  • wf : efface cette zone mémoire si le processus est forké.
  • dd : n'incluez pas cette région de mémoire dans les vidages mémoire.
  • sd : Drapeau sale doux.
  • mm : Zone de carte mixte.
  • hg : Drapeau de conseil de page énorme.
  • nh : Pas d'indicateur d'avertissement de page énorme.
  • mg : indicateur de conseil fusionnable.
  • bt : Page gardée d'instabilité de température de polarisation ARM64.
  • mt : ARM64 Les balises d'extension de marquage de mémoire sont activées.
  • um : Userfaultfd suivi manquant.
  • uw : suivi de Userfaultfd wr-protect.

La gestion de la mémoire est compliquée

Et travailler à rebours à partir de tableaux de données pour comprendre ce qui se passe réellement est difficile. Mais au moins pmap vous donne une image complète afin que vous ayez la meilleure chance de comprendre ce que vous devez savoir.

Il est intéressant de noter que notre exemple de programme a été compilé en un exécutable binaire de 16 Ko, et pourtant il utilise (ou partage) quelque 2756 Ko de mémoire, presque entièrement à cause des bibliothèques d'exécution.

Une dernière astuce consiste à utiliser pmap et les commandes pidof , en combinant les actions consistant à trouver le PID du processus et à le transmettre à pmap en une seule commande :

 pmap $(pidof pm)