Como manipular strings no Bash no Linux

Publicados: 2022-07-28
Linha de comando do Linux na tela do laptop.
fatmawati achmad zaenuri/Shutterstock.com

Se há uma coisa que o Linux está bem equipado, são utilitários para manipular strings. Mas há todo um conjunto de funcionalidades embutido no shell Bash também. Aqui está como ele é usado.

Manipulação de String

O ecossistema Linux está repleto de ferramentas fantásticas para trabalhar com texto e strings. Estes incluem awk, grep, sed e cut. Para qualquer disputa de texto pesado, essas devem ser suas escolhas.

Às vezes, porém, é conveniente usar os recursos internos do shell, especialmente quando você está escrevendo um script curto e simples. Se o seu script for compartilhado com outras pessoas e for executado em seus computadores, usar a funcionalidade padrão do Bash significa que você não precisa se preocupar com a presença ou versão de nenhum dos outros utilitários.

Se você precisar do poder dos utilitários dedicados, use-os por todos os meios. É para isso que eles estão lá. Mas muitas vezes seu script e Bash podem fazer o trabalho por conta própria.

Como eles são internos do Bash, você pode usá-los em scripts ou na linha de comando. Usá-los em uma janela de terminal é uma maneira rápida e conveniente de prototipar seus comandos e aperfeiçoar a sintaxe. Evita o ciclo de edição, salvamento, execução e depuração.

Criando e trabalhando com variáveis ​​de string

Tudo o que precisamos para declarar uma variável e atribuir uma string a ela é nomear a variável, usar o sinal de igual = e fornecer a string. Se houver espaços em sua string, coloque-a entre aspas simples ou duplas. Certifique-se de que não haja espaços em branco em nenhum dos lados do sinal de igual.

 my_string="Olá, How-To Geek World."
 echo $my_string 

Criando e escrevendo uma variável de string

Depois de criar uma variável, esse nome de variável é adicionado à lista de palavras de conclusão de tabulação do shell. Neste exemplo, digitar “my_” e pressionar a tecla “Tab” inseriu o nome completo na linha de comando.

Variáveis ​​somente leitura

Existe um comando declare que podemos usar para declarar variáveis. Em casos simples, você realmente não precisa dele, mas usá-lo permite que você use algumas das opções do comando. Provavelmente a que você mais usaria é a opção -r (somente leitura). Isso cria uma variável somente leitura que não pode ser alterada.

 declare -r read_only_var="Esta é uma string imutável!"

Se tentarmos atribuir um novo valor a ele, ele falhará.

 read_only_var="Uma nova string..." 

Falha ao alterar uma variável de string somente leitura

Escrevendo na janela do terminal

Podemos escrever várias strings na janela do terminal usando echo ou printf para que apareçam como se fossem uma string. E não estamos limitados às nossas próprias variáveis ​​de strings, podemos incorporar variáveis ​​de ambiente em nossos comandos.

 user_account="Sua conta de usuário é:"
 echo $user_account $USER 

Escrevendo duas strings na janela do terminal como se fossem uma string

Concatenando Strings

O operador mais-igual, += , permite “adicionar” duas strings. Chama-se concatenar.

 user_account="Sua conta de usuário é:"
 user_account+=$USER
 echo $user_account 

Concatenar strings com +=

Observe que você não obtém um espaço adicionado automaticamente entre strings concatenadas. Se você precisa ter um espaço, você precisa colocar um explicitamente no final da primeira string ou no início da segunda.

 user_account="Sua conta de usuário é: "
 user_account+=$USER
 echo $user_account 

Adicionando um espaço extra antes de usar += para concatenar duas strings

RELACIONADO: Como definir variáveis ​​​​de ambiente no Bash no Linux

Lendo a entrada do usuário

Além de criar variáveis ​​de string que têm seu conteúdo definido como parte de sua declaração, podemos ler a entrada do usuário em uma variável de string.

O comando read lê a entrada do usuário. A opção -p (prompt) grava um prompt na janela do terminal. A entrada do usuário é armazenada na variável string. Neste exemplo, a variável é chamada user_file .

 read -p "Abrir qual arquivo?" user_file
 echo $user_file 

Lendo a entrada de string do usuário

Se você não fornecer uma variável de string para capturar a entrada, ela ainda funcionará. A entrada do usuário será armazenada em uma variável chamada REPLY .

 read -p "Abrir qual arquivo?"
 echo $REPLY 

Lendo a entrada do usuário sem fornecer uma variável de string

Geralmente é mais conveniente fornecer sua própria variável e dar a ela um nome significativo.

Manipulando Strings

Agora que temos nossas strings, sejam elas definidas no momento da criação, lidas a partir da entrada do usuário ou criadas pela concatenação de strings, podemos começar a fazer coisas com elas.

Encontrando o comprimento da string

Se for importante ou útil conhecer o comprimento de uma string, podemos obtê-lo precedendo o nome da variável com um símbolo de hash “ # ”.

 my_string="Existem 39 caracteres nesta string."
 echo ${#my_string} 

Obtendo o comprimento de uma string

Extraindo Substrings por Deslocamentos de Caracteres

Podemos extrair uma substring de uma variável string fornecendo um ponto inicial dentro da string e um comprimento opcional. Se não fornecermos um comprimento, a substring conterá tudo, desde o ponto inicial até o último caractere.

O ponto inicial e o comprimento seguem o nome da variável, com dois pontos “ : ” entre eles. Observe que os caracteres em uma variável de string são numerados começando em zero .

 long_string="Frankenstein ou o Prometeu Moderno"
 substring=${long_string:0:12}
 echo $substring
 echo ${long_string:27} 

Extraindo substrings do início e do fim de uma string

Outra variação permite descartar um número de letras do final da string. Efetivamente, ele permite definir um ponto inicial e usar um número negativo como comprimento. A substring conterá os caracteres do ponto inicial até o final da string, menos o número de caracteres que você especificou no número negativo.

 minha_string="alfabética"
 echo ${my_string:5:-4} 

Extraindo uma substring do meio de uma string

Em todos os casos, a variável de string original permanece intocada. A substring “extraída” não é realmente removida do conteúdo da variável.

Extraindo Substrings por Delimitador

A desvantagem de usar deslocamentos de caracteres é que você precisa saber com antecedência onde as substrings que deseja extrair estão localizadas na string.

Se sua string for delimitada por um caractere repetido, você poderá extrair substrings sem saber onde elas estão na string, nem quanto tempo elas são.

Para pesquisar na frente da string, siga o nome da variável com sinais de porcentagem duplos, %% , o caractere delimitador e um asterisco, * . As palavras nesta string são delimitadas por espaços.

 long_string="primeiro segundo terceiro quarto quinto"
 echo ${long_string%%' '*} 

Extraindo uma substring da frente de uma string por delimitador

Isso retorna a primeira substring da frente da string que não contém o caractere delimitador. Isso é chamado de opção de substring curta.

A opção de substring longa retorna a parte frontal da string até a última substring delimitada. Em outras palavras, ele omite a última substring delimitada. Sintaticamente, a única diferença é que ele usa um único sinal de porcentagem “ % ” no comando.

 long_string="primeiro segundo terceiro quarto quinto"
 echo ${long_string%' '*} 

Extraindo uma substring longa da frente de uma string por delimitador

Como seria de esperar, você pode pesquisar da mesma maneira a partir do final da string. Em vez de um sinal de porcentagem, use um sinal de hash “ # ” e mova o delimitador para vir após o asterisco “ * ” no comando.

 long_string="this.long.string.of.words.is.delimited.by.periods"
 echo ${long_string##*.} 

Extraindo uma substring do final de uma string por delimitador

Esta é a opção de substring curta, ela corta a primeira substring encontrada na parte de trás da string que não contém o delimitador.

 long_string="this.long.string.of.words.is.delimited.by.periods"
 echo ${long_string#*.} 

Extraindo uma substring longa do final de uma string por delimitador

A opção de substring longa retorna a parte traseira da string até o primeiro delimitador da frente da string. Em outras palavras, ele omite a primeira substring delimitada.

Substituição de Substring

Trocar substrings por outras substrings é fácil. O formato é o nome da string, a substring que será substituída e a substring que será inserida, separadas por caracteres de barra “ / ”.

 string="risadas do porco azul"
 echo ${string/porco/cabra} 

Substituindo uma substring em uma string

Para limitar a pesquisa ao final da string, preceda a string de pesquisa com um caractere de sinal de porcentagem “ % ”.

 string="risadas do porco azul"
 echo ${string/%giggles/chuckles} 

Substituindo uma substring no final de uma string

Para limitar a pesquisa ao início da string, preceda a string de pesquisa com um caractere hash “ # ”.

 string="risadas do porco azul"
 echo ${string/#blue/yellow} 

Substituindo uma substring no início de uma string

Uma corda é uma coisa flexível

Se uma string não for exatamente como você gostaria ou precisa, essas ferramentas ajudarão você a reformatá-la para que atenda às suas necessidades. Para transformações complicadas, use os utilitários dedicados, mas para os pequenos ajustes, use os embutidos do shell e evite a sobrecarga de carregar e executar uma ferramenta externa.

RELACIONADO: Tudo o que você sempre quis saber sobre inodes no Linux