So manipulieren Sie Zeichenfolgen in Bash unter Linux
Veröffentlicht: 2022-07-28Wenn es eine Sache gibt, mit der Linux gut ausgestattet ist, dann sind es Dienstprogramme zum Manipulieren von Zeichenfolgen. Aber es gibt auch eine ganze Reihe von Funktionen, die direkt in die Bash-Shell integriert sind. So wird es verwendet.
String-Manipulation
Das Linux-Ökosystem ist vollgepackt mit fantastischen Tools für die Arbeit mit Text und Strings. Dazu gehören awk, grep, sed und cut. Für jede schwere Textgerangel sollten diese Ihre erste Wahl sein.
Manchmal ist es jedoch praktisch, die eingebauten Fähigkeiten der Shell zu verwenden, besonders wenn Sie ein kurzes und einfaches Skript schreiben. Wenn Ihr Skript mit anderen Personen geteilt und auf deren Computern ausgeführt werden soll, bedeutet die Verwendung der Standard-Bash-Funktionalität, dass Sie sich keine Gedanken über das Vorhandensein oder die Version eines der anderen Dienstprogramme machen müssen.
Wenn Sie die Leistung der dedizierten Dienstprogramme benötigen, verwenden Sie sie auf jeden Fall. Dafür sind sie da. Aber oft können Ihr Skript und Bash die Arbeit alleine erledigen.
Da sie in Bash integriert sind, können Sie sie in Skripten oder auf der Befehlszeile verwenden. Die Verwendung in einem Terminalfenster ist eine schnelle und bequeme Möglichkeit, Ihre Befehle zu prototypisieren und die Syntax zu perfektionieren. Es vermeidet den Bearbeitungs-, Speicher-, Ausführungs- und Debug-Zyklus.
Erstellen und Arbeiten mit String-Variablen
Alles, was wir brauchen, um eine Variable zu deklarieren und ihr einen String zuzuweisen, ist, die Variable zu benennen, das Gleichheitszeichen =
zu verwenden und den String bereitzustellen. Wenn Ihre Zeichenfolge Leerzeichen enthält, schließen Sie sie in einfache oder doppelte Anführungszeichen ein. Stellen Sie sicher, dass sich auf beiden Seiten des Gleichheitszeichens kein Leerzeichen befindet.
my_string="Hallo How-To-Geek-Welt."
echo $my_string
Sobald Sie eine Variable erstellt haben, wird dieser Variablenname zur Liste der Tabulatorvervollständigungswörter der Shell hinzugefügt. In diesem Beispiel geben Sie „my_“ ein und drücken die „Tab“-Taste, um den vollständigen Namen in der Befehlszeile einzugeben.
Nur-Lese-Variablen
Es gibt einen declare
, den wir zum Deklarieren von Variablen verwenden können. In einfachen Fällen brauchen Sie es nicht wirklich, aber wenn Sie es verwenden, können Sie einige der Optionen des Befehls verwenden. Wahrscheinlich verwenden Sie am häufigsten die Option -r
(schreibgeschützt). Dadurch wird eine schreibgeschützte Variable erstellt, die nicht geändert werden kann.
Declaration -r read_only_var="Dies ist eine unveränderliche Zeichenkette!"
Wenn wir versuchen, ihm einen neuen Wert zuzuweisen, schlägt dies fehl.
read_only_var="Ein neuer String..."
Schreiben in das Terminalfenster
Wir können mehrere Strings mit echo oder printf in das Terminalfenster schreiben, sodass sie so aussehen, als wären sie ein String. Und wir sind nicht auf unsere eigenen String-Variablen beschränkt, wir können Umgebungsvariablen in unsere Befehle integrieren.
user_account="Ihr Benutzerkonto ist:"
echo $user_account $USER
Strings verketten
Mit dem Plus-Gleich-Operator +=
können Sie zwei Zeichenfolgen „addieren“. Das nennt man Verketten.
user_account="Ihr Benutzerkonto ist:"
user_account+=$USER
echo $user_account
Beachten Sie, dass zwischen verketteten Zeichenfolgen nicht automatisch ein Leerzeichen hinzugefügt wird. Wenn Sie ein Leerzeichen benötigen, müssen Sie explizit eines am Ende der ersten Zeichenfolge oder am Anfang der zweiten einfügen.
user_account="Ihr Benutzerkonto ist: "
user_account+=$USER
echo $user_account
VERWANDT: So setzen Sie Umgebungsvariablen in Bash unter Linux
Lesen von Benutzereingaben
Neben der Erstellung von String-Variablen, deren Inhalt als Teil ihrer Deklaration definiert ist, können wir Benutzereingaben in eine String-Variable einlesen.
Der read
liest Benutzereingaben. Die Option -p
(Eingabeaufforderung) schreibt eine Eingabeaufforderung in das Terminalfenster. Die Eingabe des Benutzers wird in der String-Variablen gespeichert. In diesem Beispiel heißt die Variable user_file
.
read -p "Welche Datei öffnen?" Benutzerdatei
echo $user_file
Wenn Sie keine String-Variable zum Erfassen der Eingabe bereitstellen, funktioniert es trotzdem. Die Benutzereingabe wird in einer Variablen namens REPLY
gespeichert.
read -p "Welche Datei öffnen?"
echo $ANTWORT
Normalerweise ist es bequemer, eine eigene Variable bereitzustellen und ihr einen aussagekräftigen Namen zu geben.
Saiten manipulieren
Jetzt, da wir unsere Strings haben, ob sie zum Zeitpunkt der Erstellung definiert, aus Benutzereingaben gelesen oder durch Verketten von Strings erstellt wurden, können wir anfangen, Dinge mit ihnen zu tun.
Ermitteln der Saitenlänge
Wenn es wichtig oder nützlich ist, die Länge einer Zeichenkette zu kennen, können wir sie erhalten, indem wir dem Variablennamen ein Hash-Symbol „ #
“ voranstellen.
my_string="Es gibt 39 Zeichen in dieser Zeichenfolge."
echo ${#my_string}
Extrahieren von Teilzeichenfolgen durch Zeichen-Offsets
Wir können einen Teilstring aus einer String-Variablen extrahieren, indem wir einen Startpunkt innerhalb des Strings und eine optionale Länge angeben. Wenn wir keine Länge angeben, enthält der Teilstring alles vom Startpunkt bis zum letzten Zeichen.
Der Startpunkt und die Länge folgen dem Variablennamen mit einem Doppelpunkt „ :
“ dazwischen. Beachten Sie, dass die Zeichen in einer String-Variablen beginnend bei Null nummeriert sind.
long_string="Frankenstein oder der moderne Prometheus"
substring=${long_string:0:12}
echo $substring
echo ${long_string:27}
Bei einer anderen Variante können Sie eine Reihe von Buchstaben vom hinteren Ende der Zeichenfolge weglassen. Effektiv können Sie einen Startpunkt festlegen und eine negative Zahl als Länge verwenden. Die Teilzeichenfolge enthält die Zeichen vom Startpunkt bis zum Ende der Zeichenfolge abzüglich der Anzahl der Zeichen, die Sie in der negativen Zahl angegeben haben.
my_string="alphabetisch"
echo ${my_string:5:-4}
In allen Fällen bleibt die ursprüngliche String-Variable unberührt. Der „extrahierte“ Teilstring wird nicht wirklich aus dem Inhalt der Variablen entfernt.
Extrahieren von Teilzeichenfolgen durch Trennzeichen
Der Nachteil der Verwendung von Zeichen-Offsets besteht darin, dass Sie im Voraus wissen müssen, wo sich die zu extrahierenden Teilzeichenfolgen innerhalb der Zeichenfolge befinden.
Wenn Ihre Zeichenfolge durch ein sich wiederholendes Zeichen begrenzt ist, können Sie Teilzeichenfolgen extrahieren, ohne zu wissen, wo sie sich in der Zeichenfolge befinden oder wie lang sie sind.
Um am Anfang der Zeichenfolge zu suchen, folgen Sie dem Variablennamen mit doppelten Prozentzeichen, %%
, dem Trennzeichen und einem Sternchen *
. Die Wörter in dieser Zeichenfolge werden durch Leerzeichen getrennt.
long_string="erster zweiter dritter vierter fünfter"
echo ${long_string%%' '*}
Dies gibt den ersten Teilstring vom Anfang des Strings zurück, der das Trennzeichen nicht enthält. Dies wird als Option für kurze Teilzeichenfolgen bezeichnet.
Die Option langer Teilstring gibt den vorderen Teil des Strings bis zum letzten getrennten Teilstring zurück. Mit anderen Worten, es lässt die letzte begrenzte Teilzeichenfolge weg. Syntaktisch besteht der einzige Unterschied darin, dass im Befehl ein einzelnes Prozentzeichen „ %
“ verwendet wird.
long_string="erster zweiter dritter vierter fünfter"
echo ${long_string%' '*}
Wie zu erwarten, können Sie auf die gleiche Weise vom Ende der Zeichenfolge aus suchen. Verwenden Sie anstelle eines Prozentzeichens ein Hash-Zeichen „ #
“ und verschieben Sie das Trennzeichen so, dass es im Befehl nach dem Sternchen „ *
“ steht.
long_string="diese.lange.Zeichenfolge.von.Wörtern.ist.begrenzt.durch.Punkte"
echo ${lange_zeichenfolge##*.}
Dies ist die kurze Substring-Option, sie schneidet den ersten gefundenen Substring am Ende des Strings ab, der das Trennzeichen nicht enthält.
long_string="diese.lange.Zeichenfolge.von.Wörtern.ist.begrenzt.durch.Punkte"
echo ${lange_zeichenfolge#*.}
Die Option langer Teilstring gibt den hinteren Teil des Strings bis zum ersten Trennzeichen vom Anfang des Strings zurück. Mit anderen Worten, es wird die erste durch Trennzeichen getrennte Teilzeichenfolge weggelassen.
Substring-Substitution
Das Austauschen von Teilstrings gegen andere Teilstrings ist einfach. Das Format ist der Name der Zeichenfolge, die zu ersetzende Teilzeichenfolge und die einzufügende Teilzeichenfolge, getrennt durch Schrägstriche „ /
“.
string="blaues Schwein kichert"
echo ${string/schwein/ziege}
Um die Suche auf das Ende der Zeichenfolge zu beschränken, stellen Sie der Suchzeichenfolge ein Prozentzeichen „ %
“ voran.
string="blaues Schwein kichert"
echo ${string/%kichert/kichert}
Um die Suche auf den Anfang der Zeichenfolge zu beschränken, stellen Sie der Suchzeichenfolge ein Hash-Zeichen „ #
“ voran.
string="blaues Schwein kichert"
echo ${string/#blau/gelb}
Ein String ist eine flexible Sache
Wenn ein String nicht so ist, wie Sie ihn möchten oder brauchen, helfen Ihnen diese Tools dabei, ihn so umzuformatieren, dass er Ihren Anforderungen entspricht. Verwenden Sie für komplizierte Transformationen die dedizierten Dienstprogramme, aber für kleinere Optimierungen verwenden Sie die in die Shell integrierten Funktionen und vermeiden Sie den Aufwand für das Laden und Ausführen eines externen Tools.
RELATED: Alles, was Sie schon immer über Inodes unter Linux wissen wollten