Cómo manipular cadenas en Bash en Linux
Publicado: 2022-07-28Si hay algo con lo que Linux está bien equipado, son las utilidades para manipular cadenas. Pero también hay un conjunto completo de funciones integradas directamente en el shell de Bash. Así es como se usa.
Manipulación de cadenas
El ecosistema Linux está repleto de fantásticas herramientas para trabajar con texto y cadenas. Estos incluyen awk, grep, sed y cut. Para cualquier disputa de texto pesado, estas deberían ser sus opciones de acceso.
A veces, sin embargo, es conveniente usar las capacidades integradas del shell, especialmente cuando está escribiendo un script corto y simple. Si su secuencia de comandos se va a compartir con otras personas y se ejecutará en sus computadoras, el uso de la funcionalidad estándar de Bash significa que no tiene que preguntarse sobre la presencia o la versión de ninguna de las otras utilidades.
Si necesita el poder de las utilidades dedicadas, utilícelas por todos los medios. Para eso están. Pero a menudo, su script y Bash pueden hacer el trabajo por sí solos.
Debido a que son elementos integrados de Bash, puede usarlos en secuencias de comandos o en la línea de comandos. Usarlos en una ventana de terminal es una forma rápida y conveniente de crear prototipos de sus comandos y perfeccionar la sintaxis. Evita el ciclo de edición, guardado, ejecución y depuración.
Crear y trabajar con variables de cadena
Todo lo que necesitamos para declarar una variable y asignarle una cadena es nombrar la variable, usar el signo igual =
y proporcionar la cadena. Si hay espacios en su cadena, enciérrelo entre comillas simples o dobles. Asegúrese de que no haya espacios en blanco a ambos lados del signo igual.
my_string="Hola, mundo geek de procedimientos".
echo $mi_cadena
Una vez que haya creado una variable, ese nombre de variable se agrega a la lista de palabras de finalización de tabulación del shell. En este ejemplo, al escribir "my_" y presionar la tecla "Tab" se ingresa el nombre completo en la línea de comando.
Variables de solo lectura
Hay un comando de declare
que podemos usar para declarar variables. En casos simples, realmente no lo necesita, pero usarlo le permite usar algunas de las opciones del comando. Probablemente, la que más usaría es la opción -r
(solo lectura). Esto crea una variable de solo lectura que no se puede cambiar.
declare -r read_only_var="¡Esta es una cadena inmutable!"
Si intentamos asignarle un nuevo valor, fallará.
read_only_var="Una nueva cadena..."
Escribir en la ventana de terminal
Podemos escribir varias cadenas en la ventana del terminal usando echo o printf para que parezcan una sola cadena. Y no estamos limitados a nuestras propias variables de cadenas, podemos incorporar variables de entorno en nuestros comandos.
user_account="Su cuenta de usuario es:"
echo $cuenta_de_usuario $USUARIO
Cadenas de concatenación
El operador más-igual, +=
, le permite "sumar" dos cadenas juntas. Se llama concatenar.
user_account="Su cuenta de usuario es:"
cuenta_usuario+=$USUARIO
echo $cuenta_de_usuario
Tenga en cuenta que no obtiene un espacio agregado automáticamente entre cadenas concatenadas. Si necesita tener un espacio, debe poner uno explícitamente al final de la primera cadena o al comienzo de la segunda.
user_account="Su cuenta de usuario es: "
cuenta_usuario+=$USUARIO
echo $cuenta_de_usuario
RELACIONADO: Cómo establecer variables de entorno en Bash en Linux
Lectura de la entrada del usuario
Además de crear variables de cadena cuyo contenido se define como parte de su declaración, podemos leer la entrada del usuario en una variable de cadena.
El comando de read
lee la entrada del usuario. La opción -p
(mensaje) escribe un mensaje en la ventana del terminal. La entrada del usuario se almacena en la variable de cadena. En este ejemplo, la variable se llama user_file
.
read -p "¿Abrir qué archivo?" user_file
echo $archivo_de_usuario
Si no proporciona una variable de cadena para capturar la entrada, seguirá funcionando. La entrada del usuario se almacenará en una variable llamada REPLY
.
read -p "¿Abrir qué archivo?"
echo $RESPUESTA
Por lo general, es más conveniente proporcionar su propia variable y darle un nombre significativo.
Manipulación de cadenas
Ahora que tenemos nuestras cadenas, ya sea definidas en el momento de la creación, leídas de la entrada del usuario o creadas mediante la concatenación de cadenas, podemos comenzar a hacer cosas con ellas.
Encontrar la longitud de la cadena
Si es importante o útil conocer la longitud de una cadena, podemos obtenerla precediendo el nombre de la variable con un símbolo de almohadilla " #
".
my_string="Hay 39 caracteres en esta cadena."
echo ${#mi_cadena}
Extracción de subcadenas por desplazamiento de caracteres
Podemos extraer una subcadena de una variable de cadena proporcionando un punto de inicio dentro de la cadena y una longitud opcional. Si no proporcionamos una longitud, la subcadena contendrá todo, desde el punto de inicio hasta el último carácter.
El punto de inicio y la longitud siguen al nombre de la variable, con dos puntos “ :
” entre ellos. Tenga en cuenta que los caracteres de una variable de cadena se numeran a partir de cero .
long_string="Frankenstein o el moderno Prometeo"
subcadena=${cadena_larga:0:12}
echo $subcadena
echo ${long_string:27}
Otra variación le permite descartar una cantidad de letras del final de la cadena. Efectivamente, le permite establecer un punto de inicio y usar un número negativo como longitud. La subcadena contendrá los caracteres desde el punto de inicio hasta el final de la cadena, menos la cantidad de caracteres que especificó en el número negativo.
my_string="alfabético"
echo ${mi_cadena:5:-4}
En todos los casos, la variable de cadena original no se modifica. La subcadena "extraída" en realidad no se elimina del contenido de la variable.
Extracción de subcadenas por delimitador
La desventaja de usar compensaciones de caracteres es que necesita saber de antemano dónde se encuentran dentro de la cadena las subcadenas que desea extraer.
Si su cadena está delimitada por un carácter repetido, puede extraer subcadenas sin saber dónde están en la cadena ni cuánto tiempo tienen.
Para buscar desde el principio de la cadena, siga el nombre de la variable con signos de porcentaje doble, %%
, el carácter delimitador y un asterisco, *
. Las palabras de esta cadena están delimitadas por espacios.
long_string="primero segundo tercero cuarto quinto"
echo ${long_string%%' '*}
Esto devuelve la primera subcadena desde el principio de la cadena que no contiene el carácter delimitador. Esto se llama la opción de subcadena corta.
La opción de subcadena larga devuelve la parte frontal de la cadena hasta la última subcadena delimitada. En otras palabras, omite la última subcadena delimitada. Sintácticamente, la única diferencia es que usa un solo signo de porcentaje " %
" en el comando.
long_string="primero segundo tercero cuarto quinto"
echo ${long_string%' '*}
Como era de esperar, puede buscar de la misma manera desde el final de la cadena. En lugar de un signo de porcentaje, use un signo de almohadilla " #
" y mueva el delimitador para que vaya después del asterisco " *
" en el comando.
long_string="esta.larga.cadena.de.palabras.está.delimitada.por.puntos"
echo ${cadena_larga##*.}
Esta es la opción de subcadena corta, recorta la primera subcadena que encuentra desde la parte posterior de la cadena que no contiene el delimitador.
long_string="esta.larga.cadena.de.palabras.está.delimitada.por.puntos"
echo ${long_string#*.}
La opción de subcadena larga devuelve la parte posterior de la cadena hasta el primer delimitador desde el frente de la cadena. En otras palabras, omite la primera subcadena delimitada.
Sustitución de subcadena
Cambiar subcadenas por otras subcadenas es fácil. El formato es el nombre de la cadena, la subcadena que se reemplazará y la subcadena que se insertará, separados por caracteres de barra inclinada " /
".
string="cerdo azul se ríe"
echo ${cuerda/cerdo/cabra}
Para limitar la búsqueda al final de la cadena, preceda la cadena de búsqueda con un carácter de signo de porcentaje " %
".
string="cerdo azul se ríe"
echo ${cadena/%risitas/risitas}
Para limitar la búsqueda al comienzo de la cadena, preceda la cadena de búsqueda con un carácter de almohadilla " #
".
string="cerdo azul se ríe"
echo ${cadena/#azul/amarillo}
Una cuerda es una cosa flexible
Si una cadena no es exactamente como le gustaría o no la necesita, estas herramientas lo ayudarán a reformatearla para que se adapte a sus necesidades. Para transformaciones complicadas, use las utilidades dedicadas, pero para los ajustes menores use las funciones integradas de shell y evite la sobrecarga de cargar y ejecutar una herramienta externa.
RELACIONADO: Todo lo que siempre quiso saber sobre los inodos en Linux