Como manipular strings no Bash no Linux
Publicados: 2022-07-28Se há uma coisa que o Linux está bem equipado, são utilitários para manipular strings. Mas há todo um conjunto de funcionalidades embutido no shell Bash também. Aqui está como ele é usado.
Manipulação de String
O ecossistema Linux está repleto de ferramentas fantásticas para trabalhar com texto e strings. Estes incluem awk, grep, sed e cut. Para qualquer disputa de texto pesado, essas devem ser suas escolhas.
Às vezes, porém, é conveniente usar os recursos internos do shell, especialmente quando você está escrevendo um script curto e simples. Se o seu script for compartilhado com outras pessoas e for executado em seus computadores, usar a funcionalidade padrão do Bash significa que você não precisa se preocupar com a presença ou versão de nenhum dos outros utilitários.
Se você precisar do poder dos utilitários dedicados, use-os por todos os meios. É para isso que eles estão lá. Mas muitas vezes seu script e Bash podem fazer o trabalho por conta própria.
Como eles são internos do Bash, você pode usá-los em scripts ou na linha de comando. Usá-los em uma janela de terminal é uma maneira rápida e conveniente de prototipar seus comandos e aperfeiçoar a sintaxe. Evita o ciclo de edição, salvamento, execução e depuração.
Criando e trabalhando com variáveis de string
Tudo o que precisamos para declarar uma variável e atribuir uma string a ela é nomear a variável, usar o sinal de igual =
e fornecer a string. Se houver espaços em sua string, coloque-a entre aspas simples ou duplas. Certifique-se de que não haja espaços em branco em nenhum dos lados do sinal de igual.
my_string="Olá, How-To Geek World."
echo $my_string
Depois de criar uma variável, esse nome de variável é adicionado à lista de palavras de conclusão de tabulação do shell. Neste exemplo, digitar “my_” e pressionar a tecla “Tab” inseriu o nome completo na linha de comando.
Variáveis somente leitura
Existe um comando declare
que podemos usar para declarar variáveis. Em casos simples, você realmente não precisa dele, mas usá-lo permite que você use algumas das opções do comando. Provavelmente a que você mais usaria é a opção -r
(somente leitura). Isso cria uma variável somente leitura que não pode ser alterada.
declare -r read_only_var="Esta é uma string imutável!"
Se tentarmos atribuir um novo valor a ele, ele falhará.
read_only_var="Uma nova string..."
Escrevendo na janela do terminal
Podemos escrever várias strings na janela do terminal usando echo ou printf para que apareçam como se fossem uma string. E não estamos limitados às nossas próprias variáveis de strings, podemos incorporar variáveis de ambiente em nossos comandos.
user_account="Sua conta de usuário é:"
echo $user_account $USER
Concatenando Strings
O operador mais-igual, +=
, permite “adicionar” duas strings. Chama-se concatenar.
user_account="Sua conta de usuário é:"
user_account+=$USER
echo $user_account
Observe que você não obtém um espaço adicionado automaticamente entre strings concatenadas. Se você precisa ter um espaço, você precisa colocar um explicitamente no final da primeira string ou no início da segunda.
user_account="Sua conta de usuário é: "
user_account+=$USER
echo $user_account
RELACIONADO: Como definir variáveis de ambiente no Bash no Linux
Lendo a entrada do usuário
Além de criar variáveis de string que têm seu conteúdo definido como parte de sua declaração, podemos ler a entrada do usuário em uma variável de string.
O comando read
lê a entrada do usuário. A opção -p
(prompt) grava um prompt na janela do terminal. A entrada do usuário é armazenada na variável string. Neste exemplo, a variável é chamada user_file
.
read -p "Abrir qual arquivo?" user_file
echo $user_file
Se você não fornecer uma variável de string para capturar a entrada, ela ainda funcionará. A entrada do usuário será armazenada em uma variável chamada REPLY
.
read -p "Abrir qual arquivo?"
echo $REPLY
Geralmente é mais conveniente fornecer sua própria variável e dar a ela um nome significativo.
Manipulando Strings
Agora que temos nossas strings, sejam elas definidas no momento da criação, lidas a partir da entrada do usuário ou criadas pela concatenação de strings, podemos começar a fazer coisas com elas.
Encontrando o comprimento da string
Se for importante ou útil conhecer o comprimento de uma string, podemos obtê-lo precedendo o nome da variável com um símbolo de hash “ #
”.
my_string="Existem 39 caracteres nesta string."
echo ${#my_string}
Extraindo Substrings por Deslocamentos de Caracteres
Podemos extrair uma substring de uma variável string fornecendo um ponto inicial dentro da string e um comprimento opcional. Se não fornecermos um comprimento, a substring conterá tudo, desde o ponto inicial até o último caractere.
O ponto inicial e o comprimento seguem o nome da variável, com dois pontos “ :
” entre eles. Observe que os caracteres em uma variável de string são numerados começando em zero .
long_string="Frankenstein ou o Prometeu Moderno"
substring=${long_string:0:12}
echo $substring
echo ${long_string:27}
Outra variação permite descartar um número de letras do final da string. Efetivamente, ele permite definir um ponto inicial e usar um número negativo como comprimento. A substring conterá os caracteres do ponto inicial até o final da string, menos o número de caracteres que você especificou no número negativo.
minha_string="alfabética"
echo ${my_string:5:-4}
Em todos os casos, a variável de string original permanece intocada. A substring “extraída” não é realmente removida do conteúdo da variável.
Extraindo Substrings por Delimitador
A desvantagem de usar deslocamentos de caracteres é que você precisa saber com antecedência onde as substrings que deseja extrair estão localizadas na string.
Se sua string for delimitada por um caractere repetido, você poderá extrair substrings sem saber onde elas estão na string, nem quanto tempo elas são.
Para pesquisar na frente da string, siga o nome da variável com sinais de porcentagem duplos, %%
, o caractere delimitador e um asterisco, *
. As palavras nesta string são delimitadas por espaços.
long_string="primeiro segundo terceiro quarto quinto"
echo ${long_string%%' '*}
Isso retorna a primeira substring da frente da string que não contém o caractere delimitador. Isso é chamado de opção de substring curta.
A opção de substring longa retorna a parte frontal da string até a última substring delimitada. Em outras palavras, ele omite a última substring delimitada. Sintaticamente, a única diferença é que ele usa um único sinal de porcentagem “ %
” no comando.
long_string="primeiro segundo terceiro quarto quinto"
echo ${long_string%' '*}
Como seria de esperar, você pode pesquisar da mesma maneira a partir do final da string. Em vez de um sinal de porcentagem, use um sinal de hash “ #
” e mova o delimitador para vir após o asterisco “ *
” no comando.
long_string="this.long.string.of.words.is.delimited.by.periods"
echo ${long_string##*.}
Esta é a opção de substring curta, ela corta a primeira substring encontrada na parte de trás da string que não contém o delimitador.
long_string="this.long.string.of.words.is.delimited.by.periods"
echo ${long_string#*.}
A opção de substring longa retorna a parte traseira da string até o primeiro delimitador da frente da string. Em outras palavras, ele omite a primeira substring delimitada.
Substituição de Substring
Trocar substrings por outras substrings é fácil. O formato é o nome da string, a substring que será substituída e a substring que será inserida, separadas por caracteres de barra “ /
”.
string="risadas do porco azul"
echo ${string/porco/cabra}
Para limitar a pesquisa ao final da string, preceda a string de pesquisa com um caractere de sinal de porcentagem “ %
”.
string="risadas do porco azul"
echo ${string/%giggles/chuckles}
Para limitar a pesquisa ao início da string, preceda a string de pesquisa com um caractere hash “ #
”.
string="risadas do porco azul"
echo ${string/#blue/yellow}
Uma corda é uma coisa flexível
Se uma string não for exatamente como você gostaria ou precisa, essas ferramentas ajudarão você a reformatá-la para que atenda às suas necessidades. Para transformações complicadas, use os utilitários dedicados, mas para os pequenos ajustes, use os embutidos do shell e evite a sobrecarga de carregar e executar uma ferramenta externa.
RELACIONADO: Tudo o que você sempre quis saber sobre inodes no Linux