Jak manipulować ciągami znaków w Bash w systemie Linux

Opublikowany: 2022-07-28
Wiersz poleceń Linuksa na ekranie laptopa.
fatmawati achmad zaenuri/Shutterstock.com

Jeśli jest jedna rzecz, w którą Linux jest dobrze wyposażony, to narzędzia do manipulowania łańcuchami. Ale jest też cały zestaw funkcji wbudowanych bezpośrednio w powłokę Bash. Oto jak jest używany.

Manipulacja strunami

Ekosystem Linuksa jest pełen fantastycznych narzędzi do pracy z tekstem i ciągami. Należą do nich awk, grep, sed i cut. W przypadku wszelkich sporów dotyczących tekstów o dużej wadze powinny to być twoje główne wybory.

Czasami jednak wygodnie jest skorzystać z wbudowanych możliwości powłoki, zwłaszcza podczas pisania krótkiego i prostego skryptu. Jeśli twój skrypt będzie udostępniany innym osobom i będzie działał na ich komputerach, użycie standardowej funkcjonalności Bash oznacza, że ​​nie musisz się zastanawiać nad obecnością lub wersją żadnego z innych narzędzi.

Jeśli potrzebujesz mocy dedykowanych narzędzi, skorzystaj z nich. Po to tam są. Ale często twój scenariusz i Bash mogą samodzielnie wykonać zadanie.

Ponieważ są wbudowane w Bash, możesz ich używać w skryptach lub w wierszu poleceń. Używanie ich w oknie terminala to szybki i wygodny sposób tworzenia prototypów poleceń i doskonalenia składni. Pozwala uniknąć cyklu edycji, zapisywania, uruchamiania i debugowania.

Tworzenie i praca ze zmiennymi łańcuchowymi

Jedyne, czego potrzebujemy, aby zadeklarować zmienną i przypisać do niej ciąg, to nazwać zmienną, użyć znaku równości = i podać ciąg. Jeśli w ciągu znajdują się spacje, ujmij go w pojedyncze lub podwójne cudzysłowy. Upewnij się, że po obu stronach znaku równości nie ma spacji.

 my_string="Witaj, Świecie How-To Geek."
 echo $mój_ciąg 

Tworzenie i pisanie zmiennej łańcuchowej

Po utworzeniu zmiennej ta nazwa zmiennej jest dodawana do listy słów uzupełniania tabulacji w powłoce. W tym przykładzie wpisanie „my_” i naciśnięcie klawisza „Tab” wprowadziło pełną nazwę w wierszu poleceń.

Zmienne tylko do odczytu

Istnieje polecenie declare , którego możemy użyć do deklarowania zmiennych. W prostych przypadkach tak naprawdę nie jest to potrzebne, ale korzystanie z niego umożliwia korzystanie z niektórych opcji polecenia. Prawdopodobnie najczęściej używasz opcji -r (tylko do odczytu). Tworzy to zmienną tylko do odczytu, której nie można zmienić.

 define -r read_only_var="To jest ciąg znaków niezmienny!"

Jeśli spróbujemy przypisać mu nową wartość, to się nie powiedzie.

 read_only_var="Nowy ciąg..." 

Nie można zmienić zmiennej ciągu tylko do odczytu

Pisanie do okna terminala

Możemy zapisać kilka łańcuchów w oknie terminala za pomocą echo lub printf, tak aby wyglądały jak jeden łańcuch. I nie jesteśmy ograniczeni do własnych zmiennych łańcuchowych, możemy włączyć zmienne środowiskowe do naszych poleceń.

 user_account="Twoje konto użytkownika to:"
 echo $user_account $USER 

Zapisanie dwóch ciągów w oknie terminala tak, jakby były jednym ciągiem

Łączenie ciągów

Operator plus-równa się += pozwala „dodać” dwa ciągi razem. Nazywa się to łączeniem.

 user_account="Twoje konto użytkownika to:"
 user_account+=$USER
 echo $user_account 

Łączenie ciągów za pomocą +=

Zwróć uwagę, że spacja nie jest dodawana automatycznie między połączonymi ciągami. Jeśli potrzebujesz spacji, musisz wyraźnie umieścić ją na końcu pierwszego ciągu lub na początku drugiego.

 user_account="Twoje konto użytkownika to: "
 user_account+=$USER
 echo $user_account 

Dodanie dodatkowej spacji przed użyciem += do połączenia dwóch ciągów

POWIĄZANE: Jak ustawić zmienne środowiskowe w Bash w systemie Linux

Odczytywanie danych wprowadzonych przez użytkownika

Oprócz tworzenia zmiennych łańcuchowych, których zawartość jest zdefiniowana jako część deklaracji, możemy wczytać dane wejściowe użytkownika do zmiennej łańcuchowej.

Polecenie read odczytuje dane wprowadzone przez użytkownika. Opcja -p (podpowiedź) zapisuje podpowiedź w oknie terminala. Dane wejściowe użytkownika są przechowywane w zmiennej łańcuchowej. W tym przykładzie zmienna nosi nazwę user_file .

 read -p "Otworzyć który plik?" user_file
 echo $plik_użytkownika 

Odczytywanie wpisanego ciągu użytkownika

Jeśli nie podasz zmiennej ciągu do przechwytywania danych wejściowych, nadal będzie działać. Dane wprowadzone przez użytkownika będą przechowywane w zmiennej o nazwie REPLY .

 read -p "Otworzyć który plik? "
 echo $ ODPOWIEDZ 

Odczytywanie danych wejściowych użytkownika bez podawania zmiennej łańcuchowej

Zwykle wygodniej jest podać własną zmienną i nadać jej znaczącą nazwę.

Manipulowanie strunami

Teraz, gdy mamy nasze łańcuchy, zdefiniowane w czasie tworzenia, odczytane z danych wejściowych użytkownika lub utworzone przez łączenie łańcuchów, możemy zacząć z nimi robić różne rzeczy.

Znalezienie długości struny

Jeśli znajomość długości łańcucha jest ważna lub przydatna, możemy ją uzyskać, poprzedzając nazwę zmiennej znakiem hash „ # ”.

 my_string="Ten ciąg zawiera 39 znaków."
 echo ${#my_string} 

Uzyskiwanie długości sznurka

Wyodrębnianie podciągów przez przesunięcia znaków

Możemy wyodrębnić podciąg ze zmiennej ciągu, podając punkt początkowy w ciągu i opcjonalną długość. Jeśli nie podamy długości, podciąg będzie zawierał wszystko od punktu początkowego do ostatniego znaku.

Punkt początkowy i długość następują po nazwie zmiennej, z dwukropkiem „ : ” między nimi. Zauważ, że znaki w zmiennej łańcuchowej są numerowane od zera .

 long_string="Frankenstein lub współczesny Prometeusz"
 substring=${long_string:0:12}
 echo $substring
 echo ${long_string:27} 

Wyodrębnianie podciągów z początku i końca ciągu

Inna odmiana pozwala odrzucić pewną liczbę liter z końca łańcucha. Skutecznie pozwala ustawić punkt początkowy i użyć liczby ujemnej jako długości. Podciąg będzie zawierał znaki od punktu początkowego do końca ciągu minus liczba znaków określona w liczbie ujemnej.

 my_string="alfabetycznie"
 echo ${my_string:5:-4} 

Wyodrębnianie podciągu ze środka ciągu

We wszystkich przypadkach oryginalna zmienna łańcuchowa pozostaje nietknięta. „Wyodrębniony” podciąg nie jest w rzeczywistości usuwany z zawartości zmiennej.

Wyodrębnianie podciągów przez ogranicznik

Wadą używania przesunięć znaków jest to, że musisz wiedzieć z góry, gdzie podciągi, które chcesz wyodrębnić, znajdują się w ciągu.

Jeśli twój ciąg jest ograniczony powtarzającym się znakiem, możesz wyodrębnić podciągi, nie wiedząc, gdzie się znajdują w ciągu ani jak długie są.

Aby wyszukiwać od początku ciągu, postępuj zgodnie z nazwą zmiennej za pomocą podwójnych znaków procentu, %% , znaku ograniczającego i gwiazdki * . Słowa w tym ciągu są oddzielone spacjami.

 long_string="pierwsza druga trzecia czwarta piąta"
 echo ${long_string%%' '*} 

Wyodrębnianie podciągu z początku ciągu za pomocą separatora

Zwraca pierwszy podciąg z początku ciągu, który nie zawiera znaku ogranicznika. Nazywa się to opcją krótkiego podciągu.

Opcja long substring zwraca przednią część ciągu aż do ostatniego oddzielonego podciągu. Innymi słowy, pomija ostatni rozdzielany podciąg. Syntaktycznie jedyną różnicą jest użycie w poleceniu pojedynczego znaku procentu „ % ”.

 long_string="pierwsza druga trzecia czwarta piąta"
 echo ${long_string%' '*} 

Wyodrębnianie długiego podciągu z początku ciągu za pomocą ogranicznika

Jak można się spodziewać, możesz wyszukiwać w ten sam sposób od końca ciągu. Zamiast znaku procenta użyj znaku hash „ # ” i przesuń ogranicznik tak, aby znajdował się po gwiazdki „ * ” w poleceniu.

 long_string="ten.długi.ciąg.słów.jest.oddzielony.okresami"
 echo ${długi_ciąg##*.} 

Wyodrębnianie podciągu z końca ciągu przez delimiter

Jest to opcja krótkiego podciągu, która odcina pierwszy znaleziony podciąg z tyłu ciągu, który nie zawiera ogranicznika.

 long_string="ten.długi.ciąg.słów.jest.oddzielony.okresami"
 echo ${long_string#*.} 

Wyodrębnianie długiego podciągu z końca ciągu przez separator

Opcja long substring zwraca tylną część ciągu do pierwszego ogranicznika od początku ciągu. Innymi słowy, pomija pierwszy rozdzielony podciąg.

Podstawianie podciągów

Zamiana podciągów na inne podciągi jest łatwa. Format to nazwa ciągu, podciąg, który zostanie zastąpiony, i podciąg, który zostanie wstawiony, oddzielone znakami ukośnika „ / ”.

 string="Niebieska świnia chichocze"
 echo ${ciąg/świnia/koza} 

Podstawianie podciągu w ciągu

Aby ograniczyć wyszukiwanie do końca ciągu, poprzedź szukany ciąg znakiem procentu „ % ”.

 string="Niebieska świnia chichocze"
 echo ${string/%chiggles/chichots} 

Podstawianie podciągu na końcu ciągu

Aby ograniczyć wyszukiwanie do początku ciągu, poprzedź szukany ciąg znakiem hash „ # ”.

 string="Niebieska świnia chichocze"
 echo ${ciąg/#niebieski/żółty} 

Podstawianie podciągu na początku ciągu

Sznurek to elastyczna rzecz

Jeśli ciąg nie jest taki, jaki chcesz lub potrzebujesz, te narzędzia pomogą Ci go sformatować tak, aby odpowiadał Twoim potrzebom. W przypadku skomplikowanych transformacji użyj dedykowanych narzędzi, ale w przypadku drobnych poprawek użyj wbudowanych powłok i unikaj narzutu związanego z ładowaniem i uruchamianiem zewnętrznego narzędzia.

POWIĄZANE: Wszystko, co kiedykolwiek chciałeś wiedzieć o i-węzłach w systemie Linux