So manipulieren Sie Zeichenfolgen in Bash unter Linux

Veröffentlicht: 2022-07-28
Linux-Befehlszeile auf dem Laptop-Bildschirm.
fatmawati achmad zaenuri/Shutterstock.com

Wenn es eine Sache gibt, mit der Linux gut ausgestattet ist, dann sind es Dienstprogramme zum Manipulieren von Zeichenfolgen. Aber es gibt auch eine ganze Reihe von Funktionen, die direkt in die Bash-Shell integriert sind. So wird es verwendet.

String-Manipulation

Das Linux-Ökosystem ist vollgepackt mit fantastischen Tools für die Arbeit mit Text und Strings. Dazu gehören awk, grep, sed und cut. Für jede schwere Textgerangel sollten diese Ihre erste Wahl sein.

Manchmal ist es jedoch praktisch, die eingebauten Fähigkeiten der Shell zu verwenden, besonders wenn Sie ein kurzes und einfaches Skript schreiben. Wenn Ihr Skript mit anderen Personen geteilt und auf deren Computern ausgeführt werden soll, bedeutet die Verwendung der Standard-Bash-Funktionalität, dass Sie sich keine Gedanken über das Vorhandensein oder die Version eines der anderen Dienstprogramme machen müssen.

Wenn Sie die Leistung der dedizierten Dienstprogramme benötigen, verwenden Sie sie auf jeden Fall. Dafür sind sie da. Aber oft können Ihr Skript und Bash die Arbeit alleine erledigen.

Da sie in Bash integriert sind, können Sie sie in Skripten oder auf der Befehlszeile verwenden. Die Verwendung in einem Terminalfenster ist eine schnelle und bequeme Möglichkeit, Ihre Befehle zu prototypisieren und die Syntax zu perfektionieren. Es vermeidet den Bearbeitungs-, Speicher-, Ausführungs- und Debug-Zyklus.

Erstellen und Arbeiten mit String-Variablen

Alles, was wir brauchen, um eine Variable zu deklarieren und ihr einen String zuzuweisen, ist, die Variable zu benennen, das Gleichheitszeichen = zu verwenden und den String bereitzustellen. Wenn Ihre Zeichenfolge Leerzeichen enthält, schließen Sie sie in einfache oder doppelte Anführungszeichen ein. Stellen Sie sicher, dass sich auf beiden Seiten des Gleichheitszeichens kein Leerzeichen befindet.

 my_string="Hallo How-To-Geek-Welt."
 echo $my_string 

Erstellen und Schreiben einer String-Variablen

Sobald Sie eine Variable erstellt haben, wird dieser Variablenname zur Liste der Tabulatorvervollständigungswörter der Shell hinzugefügt. In diesem Beispiel geben Sie „my_“ ein und drücken die „Tab“-Taste, um den vollständigen Namen in der Befehlszeile einzugeben.

Nur-Lese-Variablen

Es gibt einen declare , den wir zum Deklarieren von Variablen verwenden können. In einfachen Fällen brauchen Sie es nicht wirklich, aber wenn Sie es verwenden, können Sie einige der Optionen des Befehls verwenden. Wahrscheinlich verwenden Sie am häufigsten die Option -r (schreibgeschützt). Dadurch wird eine schreibgeschützte Variable erstellt, die nicht geändert werden kann.

 Declaration -r read_only_var="Dies ist eine unveränderliche Zeichenkette!"

Wenn wir versuchen, ihm einen neuen Wert zuzuweisen, schlägt dies fehl.

 read_only_var="Ein neuer String..." 

Eine schreibgeschützte Zeichenfolgenvariable konnte nicht geändert werden

Schreiben in das Terminalfenster

Wir können mehrere Strings mit echo oder printf in das Terminalfenster schreiben, sodass sie so aussehen, als wären sie ein String. Und wir sind nicht auf unsere eigenen String-Variablen beschränkt, wir können Umgebungsvariablen in unsere Befehle integrieren.

 user_account="Ihr Benutzerkonto ist:"
 echo $user_account $USER 

Schreiben von zwei Strings in das Terminalfenster, als ob sie ein String wären

Strings verketten

Mit dem Plus-Gleich-Operator += können Sie zwei Zeichenfolgen „addieren“. Das nennt man Verketten.

 user_account="Ihr Benutzerkonto ist:"
 user_account+=$USER
 echo $user_account 

Strings mit += verketten

Beachten Sie, dass zwischen verketteten Zeichenfolgen nicht automatisch ein Leerzeichen hinzugefügt wird. Wenn Sie ein Leerzeichen benötigen, müssen Sie explizit eines am Ende der ersten Zeichenfolge oder am Anfang der zweiten einfügen.

 user_account="Ihr Benutzerkonto ist: "
 user_account+=$USER
 echo $user_account 

Hinzufügen eines zusätzlichen Leerzeichens vor der Verwendung von += zum Verketten zweier Zeichenfolgen

VERWANDT: So setzen Sie Umgebungsvariablen in Bash unter Linux

Lesen von Benutzereingaben

Neben der Erstellung von String-Variablen, deren Inhalt als Teil ihrer Deklaration definiert ist, können wir Benutzereingaben in eine String-Variable einlesen.

Der read liest Benutzereingaben. Die Option -p (Eingabeaufforderung) schreibt eine Eingabeaufforderung in das Terminalfenster. Die Eingabe des Benutzers wird in der String-Variablen gespeichert. In diesem Beispiel heißt die Variable user_file .

 read -p "Welche Datei öffnen?" Benutzerdatei
 echo $user_file 

Lesen der Benutzer-String-Eingabe

Wenn Sie keine String-Variable zum Erfassen der Eingabe bereitstellen, funktioniert es trotzdem. Die Benutzereingabe wird in einer Variablen namens REPLY gespeichert.

 read -p "Welche Datei öffnen?"
 echo $ANTWORT 

Benutzereingaben lesen, ohne eine String-Variable bereitzustellen

Normalerweise ist es bequemer, eine eigene Variable bereitzustellen und ihr einen aussagekräftigen Namen zu geben.

Saiten manipulieren

Jetzt, da wir unsere Strings haben, ob sie zum Zeitpunkt der Erstellung definiert, aus Benutzereingaben gelesen oder durch Verketten von Strings erstellt wurden, können wir anfangen, Dinge mit ihnen zu tun.

Ermitteln der Saitenlänge

Wenn es wichtig oder nützlich ist, die Länge einer Zeichenkette zu kennen, können wir sie erhalten, indem wir dem Variablennamen ein Hash-Symbol „ # “ voranstellen.

 my_string="Es gibt 39 Zeichen in dieser Zeichenfolge."
 echo ${#my_string} 

Abrufen der Länge einer Zeichenfolge

Extrahieren von Teilzeichenfolgen durch Zeichen-Offsets

Wir können einen Teilstring aus einer String-Variablen extrahieren, indem wir einen Startpunkt innerhalb des Strings und eine optionale Länge angeben. Wenn wir keine Länge angeben, enthält der Teilstring alles vom Startpunkt bis zum letzten Zeichen.

Der Startpunkt und die Länge folgen dem Variablennamen mit einem Doppelpunkt „ : “ dazwischen. Beachten Sie, dass die Zeichen in einer String-Variablen beginnend bei Null nummeriert sind.

 long_string="Frankenstein oder der moderne Prometheus"
 substring=${long_string:0:12}
 echo $substring
 echo ${long_string:27} 

Extrahieren von Teilstrings vom Anfang und Ende eines Strings

Bei einer anderen Variante können Sie eine Reihe von Buchstaben vom hinteren Ende der Zeichenfolge weglassen. Effektiv können Sie einen Startpunkt festlegen und eine negative Zahl als Länge verwenden. Die Teilzeichenfolge enthält die Zeichen vom Startpunkt bis zum Ende der Zeichenfolge abzüglich der Anzahl der Zeichen, die Sie in der negativen Zahl angegeben haben.

 my_string="alphabetisch"
 echo ${my_string:5:-4} 

Extrahieren eines Teilstrings aus der Mitte eines Strings

In allen Fällen bleibt die ursprüngliche String-Variable unberührt. Der „extrahierte“ Teilstring wird nicht wirklich aus dem Inhalt der Variablen entfernt.

Extrahieren von Teilzeichenfolgen durch Trennzeichen

Der Nachteil der Verwendung von Zeichen-Offsets besteht darin, dass Sie im Voraus wissen müssen, wo sich die zu extrahierenden Teilzeichenfolgen innerhalb der Zeichenfolge befinden.

Wenn Ihre Zeichenfolge durch ein sich wiederholendes Zeichen begrenzt ist, können Sie Teilzeichenfolgen extrahieren, ohne zu wissen, wo sie sich in der Zeichenfolge befinden oder wie lang sie sind.

Um am Anfang der Zeichenfolge zu suchen, folgen Sie dem Variablennamen mit doppelten Prozentzeichen, %% , dem Trennzeichen und einem Sternchen * . Die Wörter in dieser Zeichenfolge werden durch Leerzeichen getrennt.

 long_string="erster zweiter dritter vierter fünfter"
 echo ${long_string%%' '*} 

Extrahieren einer Teilzeichenfolge aus dem Anfang einer Zeichenfolge durch Trennzeichen

Dies gibt den ersten Teilstring vom Anfang des Strings zurück, der das Trennzeichen nicht enthält. Dies wird als Option für kurze Teilzeichenfolgen bezeichnet.

Die Option langer Teilstring gibt den vorderen Teil des Strings bis zum letzten getrennten Teilstring zurück. Mit anderen Worten, es lässt die letzte begrenzte Teilzeichenfolge weg. Syntaktisch besteht der einzige Unterschied darin, dass im Befehl ein einzelnes Prozentzeichen „ % “ verwendet wird.

 long_string="erster zweiter dritter vierter fünfter"
 echo ${long_string%' '*} 

Extrahieren einer langen Teilzeichenfolge aus dem Anfang einer Zeichenfolge durch Trennzeichen

Wie zu erwarten, können Sie auf die gleiche Weise vom Ende der Zeichenfolge aus suchen. Verwenden Sie anstelle eines Prozentzeichens ein Hash-Zeichen „ # “ und verschieben Sie das Trennzeichen so, dass es im Befehl nach dem Sternchen „ * “ steht.

 long_string="diese.lange.Zeichenfolge.von.Wörtern.ist.begrenzt.durch.Punkte"
 echo ${lange_zeichenfolge##*.} 

Extrahieren einer Teilzeichenfolge vom Ende einer Zeichenfolge durch Trennzeichen

Dies ist die kurze Substring-Option, sie schneidet den ersten gefundenen Substring am Ende des Strings ab, der das Trennzeichen nicht enthält.

 long_string="diese.lange.Zeichenfolge.von.Wörtern.ist.begrenzt.durch.Punkte"
 echo ${lange_zeichenfolge#*.} 

Extrahieren einer langen Teilzeichenfolge vom Ende einer Zeichenfolge durch Trennzeichen

Die Option langer Teilstring gibt den hinteren Teil des Strings bis zum ersten Trennzeichen vom Anfang des Strings zurück. Mit anderen Worten, es wird die erste durch Trennzeichen getrennte Teilzeichenfolge weggelassen.

Substring-Substitution

Das Austauschen von Teilstrings gegen andere Teilstrings ist einfach. Das Format ist der Name der Zeichenfolge, die zu ersetzende Teilzeichenfolge und die einzufügende Teilzeichenfolge, getrennt durch Schrägstriche „ / “.

 string="blaues Schwein kichert"
 echo ${string/schwein/ziege} 

Ersetzen einer Teilzeichenfolge in einer Zeichenfolge

Um die Suche auf das Ende der Zeichenfolge zu beschränken, stellen Sie der Suchzeichenfolge ein Prozentzeichen „ % “ voran.

 string="blaues Schwein kichert"
 echo ${string/%kichert/kichert} 

Ersetzen einer Teilzeichenfolge am Ende einer Zeichenfolge

Um die Suche auf den Anfang der Zeichenfolge zu beschränken, stellen Sie der Suchzeichenfolge ein Hash-Zeichen „ # “ voran.

 string="blaues Schwein kichert"
 echo ${string/#blau/gelb} 

Ersetzen einer Teilzeichenfolge am Anfang einer Zeichenfolge

Ein String ist eine flexible Sache

Wenn ein String nicht so ist, wie Sie ihn möchten oder brauchen, helfen Ihnen diese Tools dabei, ihn so umzuformatieren, dass er Ihren Anforderungen entspricht. Verwenden Sie für komplizierte Transformationen die dedizierten Dienstprogramme, aber für kleinere Optimierungen verwenden Sie die in die Shell integrierten Funktionen und vermeiden Sie den Aufwand für das Laden und Ausführen eines externen Tools.

RELATED: Alles, was Sie schon immer über Inodes unter Linux wissen wollten