Come utilizzare il comando pmap su Linux
Pubblicato: 2022-06-25 Scoprire quanta RAM utilizza un processo Linux non è una questione semplice, specialmente quando è necessario considerare la memoria condivisa. Per fortuna, il comando pmap
ti aiuta a dare un senso a tutto.
Mappatura della memoria
Sui moderni sistemi operativi, ogni processo risiede nella propria regione allocata di memoria o spazio di allocazione . I limiti della regione allocata non vengono mappati direttamente agli indirizzi hardware fisici. Il sistema operativo crea uno spazio di memoria virtuale per ogni processo e agisce come un livello di astrazione che mappa la memoria virtuale alla memoria fisica.
Il kernel mantiene una tabella di traduzione per ogni processo, a cui accede la CPU. Quando il kernel cambia il processo in esecuzione su un particolare core della CPU, aggiorna la tabella di traduzione che lega insieme processi e core della CPU.
I vantaggi dell'astrazione
Ci sono vantaggi in questo schema. L'uso della memoria è in qualche modo incapsulato e sandbox per ogni processo nel territorio dell'utente. Un processo "vede" solo la memoria in termini di indirizzi di memoria virtuale. Ciò significa che può funzionare solo con la memoria fornita dal sistema operativo. A meno che non abbia accesso a una memoria condivisa, non conosce né ha accesso alla memoria allocata ad altri processi.
L'astrazione della memoria fisica basata sull'hardware in indirizzi di memoria virtuale consente al kernel di modificare l'indirizzo fisico a cui è mappata una parte della memoria virtuale. Può scambiare la memoria su disco modificando l'indirizzo effettivo a cui punta una regione di memoria virtuale. Può anche differire la fornitura di memoria fisica fino a quando non è effettivamente richiesta.
Finché le richieste di lettura o scrittura della memoria vengono gestite come richiesto, il kernel è libero di destreggiarsi tra la tabella di mappatura come meglio crede.
RAM su richiesta
La tabella di mappatura e il concetto di “RAM on demand” aprono la possibilità della memoria condivisa . Il kernel cercherà di evitare di caricare la stessa cosa in memoria più di una volta. Ad esempio, caricherà una libreria condivisa in memoria una volta e la mapperà ai diversi processi che devono utilizzarla. Ciascuno dei processi avrà il proprio indirizzo univoco per la libreria condivisa, ma punteranno tutti alla stessa posizione effettiva.
Se la regione di memoria condivisa è scrivibile, il kernel usa uno schema chiamato copy-on-write. Se un processo scrive nella memoria condivisa e gli altri processi che condividono quella memoria non dovrebbero vedere le modifiche, viene creata una copia della memoria condivisa al momento della richiesta di scrittura.
Il kernel Linux 2.6.32, rilasciato nel dicembre 2009, ha fornito a Linux una funzionalità chiamata "Kernel SamePage Merging". Ciò significa che Linux può rilevare regioni di dati identiche in spazi di indirizzi diversi. Immagina una serie di macchine virtuali in esecuzione su un singolo computer e le macchine virtuali eseguono tutte lo stesso sistema operativo. Utilizzando un modello di memoria condivisa e la copia su scrittura, è possibile ridurre drasticamente l'overhead sul computer host.
Tutto ciò rende la gestione della memoria in Linux sofisticata e ottimale. Ma quella sofisticatezza rende difficile guardare un processo e sapere qual è realmente il suo utilizzo della memoria.
L'utilità pmap
Il kernel espone molto di ciò che sta facendo con la RAM attraverso due pseudo-file nello pseudo-filesystem delle informazioni di sistema "/proc". Esistono due file per processo, denominati in base all'ID processo o al PID di ciascun processo: "/proc/maps" e "/proc//smaps".
Lo strumento pmap
legge le informazioni da questi file e visualizza i risultati nella finestra del terminale. Sarà ovvio che dobbiamo fornire il PID del processo che ci interessa ogni volta che utilizziamo pmap
.
Trovare l'ID del processo
Esistono diversi modi per trovare il PID di un processo. Ecco il codice sorgente di un banale programma che useremo nei nostri esempi. È scritto in C. Tutto ciò che fa è stampare un messaggio nella finestra del terminale e attendere che l'utente prema il tasto "Invio".
#include <stdio.h> int main(int argc, char *argv[]) { printf("Programma di test How-To Geek."); getc(stdin); } // fine del main
Il programma è stato compilato in un eseguibile chiamato pm
utilizzando il compilatore gcc
:
gcc -o pm pm.c
Poiché il programma attenderà che l'utente prema "Invio", rimarrà in esecuzione per tutto il tempo che desideri.
./pm
Il programma si avvia, stampa il messaggio e attende la sequenza di tasti. Ora possiamo cercare il suo PID. Il comando ps
elenca i processi in esecuzione. L'opzione -e
(mostra tutti i processi) fa in modo che ps
elenchi ogni processo. Invieremo l'output tramite grep
e filtriamo le voci che hanno "pm" nel nome.
ps -e | grep pm
Questo elenca tutte le voci con "pm" ovunque nei loro nomi.
Possiamo essere più specifici usando il comando pidof
. Diamo a pidof
il nome del processo che ci interessa sulla riga di comando e cerca di trovare una corrispondenza. Se viene trovata una corrispondenza, pidof
stampa il PID del processo di corrispondenza.
pidof pm
Il metodo pidof
è più ordinato quando si conosce il nome del processo, ma il metodo ps
funzionerà anche se si conosce solo una parte del nome del processo.
Usando pmap
Con il nostro programma di test in esecuzione e una volta identificato il suo PID, possiamo usare pmap in questo modo:
pmap 40919
Le mappature di memoria per il processo sono elencate per noi.
Ecco l'output completo del comando:
40919: ./pm 000056059f06c000 4K r---- pm 000056059f06d000 4K rx-- pm 000056059f06e000 4K r---- pm 000056059f06f000 4K r---- pm 000056059f070000 4K rw --- pm 000056059fc39000 132K rw--- [ anonimo ] 00007f97a3edb000 8K rw--- [ anon ] 00007f97a3edd000 160K r---- libc.so.6 00007f97a3f05000 1616K rx-- libc.so.6 00007f97a4099000 352K r---- libc.so.6 00007f97a40f1000 4K ----- libc.so.6 00007f97a40f2000 16K r---- libc.so.6 00007f97a40f6000 8K rw--- libc.so.6 00007f97a40f8000 60K rw --- [ anonimo ] 00007f97a4116000 4K r---- ld-linux-x86-64.so.2 00007f97a4117000 160K rx-- ld-linux-x86-64.so.2 00007f97a413f000 40K r---- ld-linux-x86-64.so.2 00007f97a4149000 8K r---- ld-linux-x86-64.so.2 00007f97a414b000 8K rw--- ld-linux-x86-64.so.2 00007ffca0e7e000 132K rw --- [ pila ] 00007ffca0fe1000 16K r---- [ anon ] 00007ffca0fe5000 8K rx-- [ anon ] ffffffffff600000 4K --x-- [ anonimo ] totale 2756K
La prima riga è il nome del processo e il relativo PID. Ciascuna delle altre righe mostra un indirizzo di memoria mappato e la quantità di memoria a quell'indirizzo, espressa in kilobyte. I successivi cinque caratteri di ogni riga sono chiamati autorizzazioni di memoria virtuale . Le autorizzazioni valide sono:
- r : La memoria mappata può essere letta dal processo.
- w : La memoria mappata può essere scritta dal processo.
- x : Il processo può eseguire qualsiasi istruzione contenuta nella memoria mappata.
- s : la memoria mappata è condivisa e le modifiche apportate alla memoria condivisa sono visibili a tutti i processi che condividono la memoria.
- R : Non c'è alcuna prenotazione per lo spazio di scambio per questa memoria mappata.
L'informazione finale su ogni riga è il nome dell'origine della mappatura. Può essere un nome di processo, un nome di libreria o un nome di sistema come stack o heap.
La visualizzazione estesa
L'opzione -x
(estesa) fornisce due colonne aggiuntive.
pmap -x 40919
Alle colonne vengono assegnati titoli. Abbiamo già visto le colonne "Indirizzo", "Kbyte", "Modalità" e "Mappatura". Le nuove colonne si chiamano "RSS" e "Dirty".
Ecco l'output completo:
40919: ./pm Indirizzo Kbyte RSS Mappatura modalità sporca 000056059f06c000 4 4 0 r---- pm 000056059f06d000 4 4 0 rx-- pm 000056059f06e000 4 4 0 r---- pm 000056059f06f000 4 4 4 r---- pm 000056059f070000 4 4 4 rw--- pm 000056059fc39000 132 4 4 rw--- [ anonimo ] 00007f97a3edb000 8 4 4 rw--- [ anonimo ] 00007f97a3edd000 160 160 0 r---- libc.so.6 00007f97a3f05000 1616 788 0 rx-- libc.so.6 00007f97a4099000 352 64 0 r---- libc.so.6 00007f97a40f1000 4 0 0 ----- libc.so.6 00007f97a40f2000 16 16 16 r---- libc.so.6 00007f97a40f6000 8 8 8 rw--- libc.so.6 00007f97a40f8000 60 28 28 rw--- [ anonimo ] 00007f97a4116000 4 4 0 r---- ld-linux-x86-64.so.2 00007f97a4117000 160 160 0 rx-- ld-linux-x86-64.so.2 00007f97a413f000 40 40 0 r---- ld-linux-x86-64.so.2 00007f97a4149000 8 8 8 r---- ld-linux-x86-64.so.2 00007f97a414b000 8 8 8 rw--- ld-linux-x86-64.so.2 00007ffca0e7e000 132 12 12 rw --- [ pila ] 00007ffca0fe1000 16 0 0 r---- [ anonimo ] 00007ffca0fe5000 8 4 0 rx-- [ anon ] ffffffffff600000 4 0 0 --x-- [ anon ] ---------------- ------- ------- ------- totale kB 2756 1328 96
- RSS : questa è la dimensione del set residente . Cioè, la quantità di memoria che è attualmente nella RAM e non è stata sostituita.
- Sporco : la memoria "sporca" è stata modificata dall'avvio del processo e della mappatura.
Mostrami tutto
La -X
(anche più estesa) aggiunge colonne aggiuntive all'output. Nota la "X" maiuscola. Un'altra opzione chiamata -XX
(anche più di -X
) mostra tutto ciò che pmap
può ottenere dal kernel. Poiché -X
è un sottoinsieme di -XX
, descriveremo l'output da -XX
.
pmap -XX 40919
L'output si avvolge orribilmente in una finestra di terminale ed è praticamente indecifrabile. Ecco l'output completo:
40919: ./pm Indirizzo Perm Offset Dispositivo Inode Dimensione KernelPageSize MMUPageSize Rss Pss Shared_Clean Shared_Dirty Private_Clean Private_Dirty Referenziato Anonimo LazyFree AnonHugePages ShmemPmdMapped FilePmdMapped Shared_Hugetlb Private_Hugetlb Swap SwapPss Locked THPeligible VmFlags Mapping 56059f06c000 r--p 00000000 08:03 393304 4 4 4 4 4 0 0 4 0 4 0 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw sd pm 56059f06d000 r-xp 00001000 08:03 393304 4 4 4 4 4 0 0 4 0 4 0 0 0 0 0 0 0 0 0 0 0 rd ex mr mw me dw sd pm 56059f06e000 r--p 00002000 08:03 393304 4 4 4 4 4 0 0 4 0 4 0 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw sd pm 56059f06f000 r--p 00002000 08:03 393304 4 4 4 4 4 0 0 0 4 4 4 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw ac sd pm 56059f070000 rw-p 00003000 08:03 393304 4 4 4 4 4 0 0 0 4 4 4 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me dw ac sd pm 56059fc39000 rw-p 00000000 00:00 0 132 4 4 4 4 0 0 0 4 4 4 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me ac sd [heap] 7f97a3edb000 rw-p 00000000 00:00 0 8 4 4 4 4 0 0 0 4 4 4 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me ac sd 7f97a3edd000 r--p 00000000 08:03 264328 160 4 4 160 4 160 0 0 0 160 0 0 0 0 0 0 0 0 0 0 0 rd mr mw me sd libc.so.6 7f97a3f05000 r-xp 00028000 08:03 264328 1616 4 4 788 32 788 0 0 0 788 0 0 0 0 0 0 0 0 0 0 0 rd ex mr mw me sd libc.so.6 7f97a4099000 r--p 001bc000 08:03 264328 352 4 4 64 1 64 0 0 0 64 0 0 0 0 0 0 0 0 0 0 0 rd mw me sd libc.so.6 7f97a40f1000 ---p 00214000 08:03 264328 4 4 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 mr mw me sd libc.so.6 7f97a40f2000 r--p 00214000 08:03 264328 16 4 4 16 16 0 0 0 16 16 16 0 0 0 0 0 0 0 0 0 0 rd mr mw me ac sd libc.so.6 7f97a40f6000 rw-p 00218000 08:03 264328 8 4 4 8 8 0 0 0 8 8 8 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me ac sd libc.so.6 7f97a40f8000 rw-p 00000000 00:00 0 60 4 4 28 28 0 0 0 28 28 28 0 0 0 0 0 0 0 0 0 0 rd wr mw me ac sd 7f97a4116000 r--p 00000000 08:03 264305 4 4 4 4 0 4 0 0 0 4 0 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw sd ld-linux-x86-64.so.2 7f97a4117000 r-xp 00001000 08:03 264305 160 4 4 160 11 160 0 0 0 160 0 0 0 0 0 0 0 0 0 0 0 rd ex mr mw me dw sd ld-linux-x86-64.so.2 7f97a413f000 r--p 00029000 08:03 264305 40 4 4 40 1 40 0 0 0 40 0 0 0 0 0 0 0 0 0 0 0 rd mw me dw sd ld-linux-x86-64.so.2 7f97a4149000 r--p 00032000 08:03 264305 8 4 4 8 8 0 0 0 8 8 8 0 0 0 0 0 0 0 0 0 0 rd mr mw me dw ac sd ld-linux-x86-64.so.2 7f97a414b000 rw-p 00034000 08:03 264305 8 4 4 8 8 0 0 0 8 8 8 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me dw ac sd ld-linux-x86-64.so.2 7ffca0e7e000 rw-p 00000000 00:00 0 132 4 4 12 12 0 0 0 12 12 12 0 0 0 0 0 0 0 0 0 0 rd wr mr mw me gd ac [stack] 7ffca0fe1000 r--p 00000000 00:00 0 16 4 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 rd mr pf io de dd sd [vvar] 7ffca0fe5000 r-xp 00000000 00:00 0 8 4 4 4 0 4 0 0 0 4 0 0 0 0 0 0 0 0 0 0 0 rd ex mr mw me de sd [vdso] ffffffffff600000 --xp 00000000 00:00 0 4 4 4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ex [vsyscall] ==== ============== =========== ==== === ============ == ========== ============== ============== ========== ==== ===== ======== ============== ========================= === ============== ================ ==== ======= ====== = = =========== 2756 92 92 1328 157 1220 0 12 96 1328 96 0 0 0 0 0 0 0 0 0 0 KB
Ci sono molte informazioni qui. Questo è ciò che contengono le colonne:
- Indirizzo : l'indirizzo iniziale di questa mappatura. Questo utilizza l'indirizzamento della memoria virtuale.
- Perm : I permessi della memoria.
- Offset : se la memoria è basata su file, l'offset di questa mappatura all'interno del file.
- Dispositivo : il numero del dispositivo Linux, indicato in numeri maggiori e minori. Puoi vedere i numeri di dispositivo sul tuo computer eseguendo il comando
lsblk
. - Inode : l'inode del file a cui è associata la mappatura. Ad esempio, nel nostro esempio, questo potrebbe essere l'inode che contiene informazioni sul programma pm.
- Dimensione : la dimensione della regione mappata alla memoria.
- KernelPageSize : la dimensione della pagina utilizzata dal kernel.
- MMUPageSize : La dimensione della pagina utilizzata dall'unità di gestione della memoria.
- Rss : Questa è la dimensione del set residente . Cioè, la quantità di memoria che è attualmente nella RAM e non è stata sostituita.
- Pss : questa è la dimensione proporzionale della condivisione . Questa è la dimensione condivisa privata aggiunta alla (dimensione condivisa divisa per il numero di condivisioni).
- Shared_Clean : la quantità di memoria condivisa con altri processi che non è stata modificata da quando è stata creata la mappatura. Nota che anche se la memoria è condivisibile, se non è stata effettivamente condivisa è comunque considerata memoria privata.
- Shared_Dirty : la quantità di memoria condivisa con altri processi che è stata modificata da quando è stata creata la mappatura.
- Private_Clean : la quantità di memoria privata, non condivisa con altri processi, che non è stata modificata da quando è stata creata la mappatura.
- Private_Dirty : la quantità di memoria privata che è stata modificata da quando è stata creata la mappatura.
- Referenziato : la quantità di memoria attualmente contrassegnata come referenziata o a cui si accede.
- Anonimo : memoria che non ha un dispositivo su cui scambiare. Cioè, non è supportato da file.
- LazyFree : pagine contrassegnate come
MADV_FREE
. Queste pagine sono state contrassegnate come disponibili per essere liberate e recuperate, anche se potrebbero contenere modifiche non scritte. Tuttavia, se si verificano modifiche successive dopoMADV_FREE
è stato impostato sulla mappatura della memoria, il flagMADV_FREE
viene rimosso e le pagine non verranno recuperate finché non vengono scritte le modifiche. - AnonHugePages : queste sono pagine di memoria "enormi" non supportate da file (più grandi di 4 KB).
- ShmemPmdMapped : memoria condivisa associata a pagine enormi. Possono anche essere usati da filesystem che risiedono interamente in memoria.
- FilePmdMapped : La directory centrale della pagina è uno degli schemi di paging disponibili per il kernel. Questo è il numero di pagine supportate da file a cui puntano le voci PMD.
- Shared_Hugetlb : Translation Lookaside Table, o TLB, sono cache di memoria utilizzate per ottimizzare il tempo impiegato per accedere alle posizioni di memoria dello spazio utente. Questa cifra è la quantità di RAM utilizzata nei TLB associati a pagine di memoria di grandi dimensioni condivise.
- Private_Hugetlb : questa cifra è la quantità di RAM utilizzata nei TLB associati a pagine di memoria private di grandi dimensioni.
- Swap : la quantità di swap utilizzata.
- SwapPss : la dimensione proporzionale della quota di scambio . Questa è la quantità di scambio composta dalle pagine di memoria privata scambiate aggiunte alla (dimensione condivisa divisa per il numero di condivisioni).
- Bloccato : le mappature della memoria possono essere bloccate per impedire al sistema operativo di eseguire il paging della memoria heap o fuori heap.
- THPeligible : questo è un flag che indica se la mappatura è idonea per l'allocazione di pagine enormi trasparenti . 1 significa vero, 0 significa falso. Transparent huge pages è un sistema di gestione della memoria che riduce il sovraccarico delle ricerche di pagine TLB su computer con una grande quantità di RAM.
- VmFlags : vedere l'elenco dei flag di seguito.
- Mappatura : il nome dell'origine della mappatura. Può essere un nome di processo, nome di libreria o nomi di sistema come stack o heap.
I VmFlags, flag di memoria virtuale, saranno un sottoinsieme dell'elenco seguente.
- rd : leggibile.
- wr : scrivibile.
- es : eseguibile.
- sh : Condiviso.
- signor : Può leggere.
- mw : Può scrivere.
- io : può eseguire.
- ms : può condividere.
- gd : il segmento dello stack cresce verso il basso.
- pf : Intervallo di numeri di frame di pagina puro. I numeri di frame di pagina sono un elenco delle pagine di memoria fisica.
- dw : disabilitata la scrittura nel file mappato.
- lo : le pagine sono bloccate in memoria.
- io : Area I/O mappata in memoria.
- sr : avviso di lettura sequenziale fornito (dalla funzione
madvise()
.) - rr : Fornito un avviso di lettura casuale.
- dc : non copiare questa regione di memoria se il processo è biforcato.
- de : non espandere questa regione di memoria durante la rimappatura.
- ac : L'area è responsabile.
- nr : Lo spazio Swap non è riservato all'area.
- ht : Area utilizza enormi pagine TLB.
- sf : Errore di pagina sincrona.
- ar : flag specifico dell'architettura.
- wf : cancella questa regione di memoria se il processo è biforcato.
- dd : non include questa regione di memoria nei core dump.
- sd : Bandiera sporca morbida.
- mm : Area mappa mista.
- hg : flag di avviso di pagina enorme.
- nh : Nessun flag di avviso di pagina enorme.
- mg : Flag di avviso unificabile.
- bt : Pagina protetta dall'instabilità della temperatura di polarizzazione ARM64.
- mt : ARM64 I tag di estensione per la codifica della memoria sono abilitati.
- um : Userfaultfd tracciamento mancante.
- uw : Userfaultfd wr-protect tracking.
La gestione della memoria è complicata
E lavorare a ritroso dalle tabelle di dati per capire cosa sta effettivamente succedendo è difficile. Ma almeno pmap
ti dà il quadro completo in modo da avere le migliori possibilità di capire cosa devi sapere.
È interessante notare che il nostro programma di esempio è stato compilato in un eseguibile binario da 16 KB, eppure utilizza (o condivide) circa 2756 KB di memoria, quasi interamente a causa delle librerie di runtime.
Un ultimo trucco è che puoi usare pmap
e i comandi pidof
insieme, combinando le azioni per trovare il PID del processo e passarlo a pmap
in un unico comando:
pmap $(pidof pm)