Jak manipulować ciągami znaków w Bash w systemie Linux
Opublikowany: 2022-07-28Jeśli jest jedna rzecz, w którą Linux jest dobrze wyposażony, to narzędzia do manipulowania łańcuchami. Ale jest też cały zestaw funkcji wbudowanych bezpośrednio w powłokę Bash. Oto jak jest używany.
Manipulacja strunami
Ekosystem Linuksa jest pełen fantastycznych narzędzi do pracy z tekstem i ciągami. Należą do nich awk, grep, sed i cut. W przypadku wszelkich sporów dotyczących tekstów o dużej wadze powinny to być twoje główne wybory.
Czasami jednak wygodnie jest skorzystać z wbudowanych możliwości powłoki, zwłaszcza podczas pisania krótkiego i prostego skryptu. Jeśli twój skrypt będzie udostępniany innym osobom i będzie działał na ich komputerach, użycie standardowej funkcjonalności Bash oznacza, że nie musisz się zastanawiać nad obecnością lub wersją żadnego z innych narzędzi.
Jeśli potrzebujesz mocy dedykowanych narzędzi, skorzystaj z nich. Po to tam są. Ale często twój scenariusz i Bash mogą samodzielnie wykonać zadanie.
Ponieważ są wbudowane w Bash, możesz ich używać w skryptach lub w wierszu poleceń. Używanie ich w oknie terminala to szybki i wygodny sposób tworzenia prototypów poleceń i doskonalenia składni. Pozwala uniknąć cyklu edycji, zapisywania, uruchamiania i debugowania.
Tworzenie i praca ze zmiennymi łańcuchowymi
Jedyne, czego potrzebujemy, aby zadeklarować zmienną i przypisać do niej ciąg, to nazwać zmienną, użyć znaku równości =
i podać ciąg. Jeśli w ciągu znajdują się spacje, ujmij go w pojedyncze lub podwójne cudzysłowy. Upewnij się, że po obu stronach znaku równości nie ma spacji.
my_string="Witaj, Świecie How-To Geek."
echo $mój_ciąg
Po utworzeniu zmiennej ta nazwa zmiennej jest dodawana do listy słów uzupełniania tabulacji w powłoce. W tym przykładzie wpisanie „my_” i naciśnięcie klawisza „Tab” wprowadziło pełną nazwę w wierszu poleceń.
Zmienne tylko do odczytu
Istnieje polecenie declare
, którego możemy użyć do deklarowania zmiennych. W prostych przypadkach tak naprawdę nie jest to potrzebne, ale korzystanie z niego umożliwia korzystanie z niektórych opcji polecenia. Prawdopodobnie najczęściej używasz opcji -r
(tylko do odczytu). Tworzy to zmienną tylko do odczytu, której nie można zmienić.
define -r read_only_var="To jest ciąg znaków niezmienny!"
Jeśli spróbujemy przypisać mu nową wartość, to się nie powiedzie.
read_only_var="Nowy ciąg..."
Pisanie do okna terminala
Możemy zapisać kilka łańcuchów w oknie terminala za pomocą echo lub printf, tak aby wyglądały jak jeden łańcuch. I nie jesteśmy ograniczeni do własnych zmiennych łańcuchowych, możemy włączyć zmienne środowiskowe do naszych poleceń.
user_account="Twoje konto użytkownika to:"
echo $user_account $USER
Łączenie ciągów
Operator plus-równa się +=
pozwala „dodać” dwa ciągi razem. Nazywa się to łączeniem.
user_account="Twoje konto użytkownika to:"
user_account+=$USER
echo $user_account
Zwróć uwagę, że spacja nie jest dodawana automatycznie między połączonymi ciągami. Jeśli potrzebujesz spacji, musisz wyraźnie umieścić ją na końcu pierwszego ciągu lub na początku drugiego.
user_account="Twoje konto użytkownika to: "
user_account+=$USER
echo $user_account
POWIĄZANE: Jak ustawić zmienne środowiskowe w Bash w systemie Linux
Odczytywanie danych wprowadzonych przez użytkownika
Oprócz tworzenia zmiennych łańcuchowych, których zawartość jest zdefiniowana jako część deklaracji, możemy wczytać dane wejściowe użytkownika do zmiennej łańcuchowej.
Polecenie read
odczytuje dane wprowadzone przez użytkownika. Opcja -p
(podpowiedź) zapisuje podpowiedź w oknie terminala. Dane wejściowe użytkownika są przechowywane w zmiennej łańcuchowej. W tym przykładzie zmienna nosi nazwę user_file
.
read -p "Otworzyć który plik?" user_file
echo $plik_użytkownika
Jeśli nie podasz zmiennej ciągu do przechwytywania danych wejściowych, nadal będzie działać. Dane wprowadzone przez użytkownika będą przechowywane w zmiennej o nazwie REPLY
.
read -p "Otworzyć który plik? "
echo $ ODPOWIEDZ
Zwykle wygodniej jest podać własną zmienną i nadać jej znaczącą nazwę.
Manipulowanie strunami
Teraz, gdy mamy nasze łańcuchy, zdefiniowane w czasie tworzenia, odczytane z danych wejściowych użytkownika lub utworzone przez łączenie łańcuchów, możemy zacząć z nimi robić różne rzeczy.
Znalezienie długości struny
Jeśli znajomość długości łańcucha jest ważna lub przydatna, możemy ją uzyskać, poprzedzając nazwę zmiennej znakiem hash „ #
”.
my_string="Ten ciąg zawiera 39 znaków."
echo ${#my_string}
Wyodrębnianie podciągów przez przesunięcia znaków
Możemy wyodrębnić podciąg ze zmiennej ciągu, podając punkt początkowy w ciągu i opcjonalną długość. Jeśli nie podamy długości, podciąg będzie zawierał wszystko od punktu początkowego do ostatniego znaku.
Punkt początkowy i długość następują po nazwie zmiennej, z dwukropkiem „ :
” między nimi. Zauważ, że znaki w zmiennej łańcuchowej są numerowane od zera .
long_string="Frankenstein lub współczesny Prometeusz"
substring=${long_string:0:12}
echo $substring
echo ${long_string:27}
Inna odmiana pozwala odrzucić pewną liczbę liter z końca łańcucha. Skutecznie pozwala ustawić punkt początkowy i użyć liczby ujemnej jako długości. Podciąg będzie zawierał znaki od punktu początkowego do końca ciągu minus liczba znaków określona w liczbie ujemnej.
my_string="alfabetycznie"
echo ${my_string:5:-4}
We wszystkich przypadkach oryginalna zmienna łańcuchowa pozostaje nietknięta. „Wyodrębniony” podciąg nie jest w rzeczywistości usuwany z zawartości zmiennej.
Wyodrębnianie podciągów przez ogranicznik
Wadą używania przesunięć znaków jest to, że musisz wiedzieć z góry, gdzie podciągi, które chcesz wyodrębnić, znajdują się w ciągu.
Jeśli twój ciąg jest ograniczony powtarzającym się znakiem, możesz wyodrębnić podciągi, nie wiedząc, gdzie się znajdują w ciągu ani jak długie są.
Aby wyszukiwać od początku ciągu, postępuj zgodnie z nazwą zmiennej za pomocą podwójnych znaków procentu, %%
, znaku ograniczającego i gwiazdki *
. Słowa w tym ciągu są oddzielone spacjami.
long_string="pierwsza druga trzecia czwarta piąta"
echo ${long_string%%' '*}
Zwraca pierwszy podciąg z początku ciągu, który nie zawiera znaku ogranicznika. Nazywa się to opcją krótkiego podciągu.
Opcja long substring zwraca przednią część ciągu aż do ostatniego oddzielonego podciągu. Innymi słowy, pomija ostatni rozdzielany podciąg. Syntaktycznie jedyną różnicą jest użycie w poleceniu pojedynczego znaku procentu „ %
”.
long_string="pierwsza druga trzecia czwarta piąta"
echo ${long_string%' '*}
Jak można się spodziewać, możesz wyszukiwać w ten sam sposób od końca ciągu. Zamiast znaku procenta użyj znaku hash „ #
” i przesuń ogranicznik tak, aby znajdował się po gwiazdki „ *
” w poleceniu.
long_string="ten.długi.ciąg.słów.jest.oddzielony.okresami"
echo ${długi_ciąg##*.}
Jest to opcja krótkiego podciągu, która odcina pierwszy znaleziony podciąg z tyłu ciągu, który nie zawiera ogranicznika.
long_string="ten.długi.ciąg.słów.jest.oddzielony.okresami"
echo ${long_string#*.}
Opcja long substring zwraca tylną część ciągu do pierwszego ogranicznika od początku ciągu. Innymi słowy, pomija pierwszy rozdzielony podciąg.
Podstawianie podciągów
Zamiana podciągów na inne podciągi jest łatwa. Format to nazwa ciągu, podciąg, który zostanie zastąpiony, i podciąg, który zostanie wstawiony, oddzielone znakami ukośnika „ /
”.
string="Niebieska świnia chichocze"
echo ${ciąg/świnia/koza}
Aby ograniczyć wyszukiwanie do końca ciągu, poprzedź szukany ciąg znakiem procentu „ %
”.
string="Niebieska świnia chichocze"
echo ${string/%chiggles/chichots}
Aby ograniczyć wyszukiwanie do początku ciągu, poprzedź szukany ciąg znakiem hash „ #
”.
string="Niebieska świnia chichocze"
echo ${ciąg/#niebieski/żółty}
Sznurek to elastyczna rzecz
Jeśli ciąg nie jest taki, jaki chcesz lub potrzebujesz, te narzędzia pomogą Ci go sformatować tak, aby odpowiadał Twoim potrzebom. W przypadku skomplikowanych transformacji użyj dedykowanych narzędzi, ale w przypadku drobnych poprawek użyj wbudowanych powłok i unikaj narzutu związanego z ładowaniem i uruchamianiem zewnętrznego narzędzia.
POWIĄZANE: Wszystko, co kiedykolwiek chciałeś wiedzieć o i-węzłach w systemie Linux