วิธีจัดการสตริงใน Bash บน Linux
เผยแพร่แล้ว: 2022-07-28หากมีสิ่งหนึ่งที่ลินุกซ์มีอุปกรณ์ครบครัน นั่นคือยูทิลิตี้สำหรับจัดการสตริง แต่มีชุดฟังก์ชันการทำงานทั้งหมดที่สร้างขึ้นใน Bash shell ด้วย นี่คือวิธีการใช้
การจัดการสตริง
ระบบนิเวศของ Linux นั้นเต็มไปด้วยเครื่องมือที่ยอดเยี่ยมสำหรับการทำงานกับข้อความและสตริง ซึ่งรวมถึง awk, grep, sed และ cut สำหรับการโต้เถียงกับข้อความที่มีน้ำหนักมาก สิ่งเหล่านี้ควรเป็นทางเลือกของคุณ
แม้ว่าบางครั้งจะสะดวกที่จะใช้ความสามารถในตัวของเชลล์ โดยเฉพาะอย่างยิ่งเมื่อคุณกำลังเขียนสคริปต์ที่สั้นและเรียบง่าย หากสคริปต์ของคุณจะถูกแชร์กับบุคคลอื่นและจะทำงานบนคอมพิวเตอร์ของพวกเขา การใช้ฟังก์ชัน Bash มาตรฐานหมายความว่าคุณไม่จำเป็นต้องสงสัยเกี่ยวกับการมีอยู่หรือเวอร์ชันของยูทิลิตี้อื่นๆ
หากคุณต้องการพลังของยูทิลิตี้เฉพาะ คุณก็ใช้มันได้เลย นั่นคือสิ่งที่พวกเขาอยู่ที่นั่น แต่บ่อยครั้งที่สคริปต์และ Bash ของคุณสามารถทำงานให้เสร็จได้ด้วยตัวเอง
เนื่องจากเป็น Bash ในตัว คุณจึงสามารถใช้ได้ในสคริปต์หรือบนบรรทัดคำสั่ง การใช้คำสั่งเหล่านี้ในหน้าต่างเทอร์มินัลเป็นวิธีที่รวดเร็วและสะดวกในการสร้างต้นแบบคำสั่งของคุณและทำให้ไวยากรณ์สมบูรณ์แบบ มันหลีกเลี่ยงรอบการแก้ไข บันทึก รัน และดีบัก
การสร้างและทำงานกับตัวแปรสตริง
ทั้งหมดที่เราจำเป็นต้องประกาศตัวแปรและกำหนดสตริงให้กับตัวแปรนั้นคือการตั้งชื่อตัวแปร ใช้เครื่องหมายเท่ากับ =
และจัดเตรียมสตริง หากมีช่องว่างในสตริง ให้ใส่เครื่องหมายคำพูดเดี่ยวหรือเครื่องหมายคำพูดคู่ ตรวจสอบให้แน่ใจว่าไม่มีช่องว่างที่ด้านใดด้านหนึ่งของเครื่องหมายเท่ากับ
my_string="สวัสดี วิธีสอนโลก"
echo $my_string
เมื่อคุณสร้างตัวแปรแล้ว ชื่อตัวแปรนั้นจะถูกเพิ่มลงในรายการคำเติมแท็บของเชลล์ ในตัวอย่างนี้ การพิมพ์ "my_" และกดปุ่ม "Tab" จะเป็นการป้อนชื่อเต็มในบรรทัดคำสั่ง
ตัวแปรแบบอ่านอย่างเดียว
มีคำสั่ง declare
ที่เราสามารถใช้ประกาศตัวแปรได้ ในกรณีง่ายๆ คุณไม่จำเป็นต้องใช้มันจริงๆ แต่การใช้คำสั่งนี้จะทำให้คุณสามารถใช้ตัวเลือกบางอย่างของคำสั่งได้ น่าจะเป็นตัวเลือกที่คุณใช้มากที่สุดคือตัวเลือก -r
(อ่านอย่างเดียว) สิ่งนี้สร้างตัวแปรแบบอ่านอย่างเดียวที่ไม่สามารถเปลี่ยนแปลงได้
ประกาศ -r read_only_var="นี่คือสตริงที่ไม่เปลี่ยนรูปแบบ!"
หากเราพยายามกำหนดค่าใหม่ให้กับมัน มันจะล้มเหลว
read_only_var="สตริงใหม่..."
กำลังเขียนไปยังหน้าต่างเทอร์มินัล
เราสามารถเขียนสตริงหลายสตริงลงในหน้าต่างเทอร์มินัลโดยใช้ echo หรือ printf เพื่อให้ดูเหมือนเป็นสตริงเดียว และเราไม่ได้จำกัดเฉพาะตัวแปรสตริงของเราเท่านั้น เราสามารถรวมตัวแปรสภาพแวดล้อมเข้ากับคำสั่งของเราได้
user_account="บัญชีผู้ใช้ของคุณคือ:"
echo $user_account $USER
การต่อสายอักขระ
ตัวดำเนินการบวกเท่ากับ +=
ให้คุณ "เพิ่ม" สองสตริงเข้าด้วยกัน เรียกว่าเชื่อมสัมพันธ์กัน
user_account="บัญชีผู้ใช้ของคุณคือ:"
user_account+=$USER
echo $user_account
โปรดทราบว่าคุณจะไม่เพิ่มช่องว่างระหว่างสตริงที่ต่อกันโดยอัตโนมัติ หากคุณต้องการเว้นวรรค คุณต้องใส่ช่องว่างที่ท้ายสตริงแรกหรือที่จุดเริ่มต้นของสตริงที่สอง
user_account="บัญชีผู้ใช้ของคุณคือ: "
user_account+=$USER
echo $user_account
ที่เกี่ยวข้อง: วิธีการตั้งค่าตัวแปรสภาพแวดล้อมใน Bash บน Linux
กำลังอ่านอินพุตของผู้ใช้
เช่นเดียวกับการสร้างตัวแปรสตริงที่มีเนื้อหากำหนดเป็นส่วนหนึ่งของการประกาศ เราสามารถอ่านอินพุตของผู้ใช้ลงในตัวแปรสตริงได้
คำสั่ง read
อ่านอินพุตของผู้ใช้ ตัวเลือก -p
(พร้อมท์) เขียนข้อความแจ้งไปยังหน้าต่างเทอร์มินัล อินพุตของผู้ใช้ถูกเก็บไว้ในตัวแปรสตริง ในตัวอย่างนี้ ตัวแปรเรียกว่า user_file
อ่าน -p "เปิดไฟล์ใด" user_file
echo $user_file
หากคุณไม่ได้ระบุตัวแปรสตริงเพื่อดักจับอินพุต ตัวแปรจะยังคงทำงานอยู่ อินพุตของผู้ใช้จะถูกเก็บไว้ในตัวแปรที่เรียกว่า REPLY
อ่าน -p "เปิดไฟล์ใด"
ก้อง $REPLY
โดยปกติแล้วจะสะดวกกว่าที่จะระบุตัวแปรของคุณเองและตั้งชื่อที่มีความหมาย
การจัดการสตริง
ตอนนี้เรามีสตริงของเราแล้ว ไม่ว่าจะกำหนดไว้ ณ เวลาที่สร้าง อ่านจากอินพุตของผู้ใช้ หรือสร้างโดยการต่อสตริง เราก็สามารถเริ่มทำสิ่งต่างๆ กับสตริงเหล่านั้นได้
การหาความยาวของสตริง
หากการทราบความยาวของสตริงมีความสำคัญหรือมีประโยชน์ เราสามารถหาได้โดยนำสัญลักษณ์แฮช “ #
” นำหน้าชื่อตัวแปร
my_string="มีอักขระ 39 ตัวในสตริงนี้"
เสียงสะท้อน ${#my_string}
การแยกสตริงย่อยตามการชดเชยอักขระ
เราสามารถแยกสตริงย่อยออกจากตัวแปรสตริงโดยระบุจุดเริ่มต้นภายในสตริง และความยาวที่เลือกได้ หากเราไม่ระบุความยาว สตริงย่อยจะมีทุกอย่างตั้งแต่จุดเริ่มต้นจนถึงอักขระตัวสุดท้าย
จุดเริ่มต้นและความยาวตามชื่อตัวแปร โดยมีเครื่องหมายทวิภาค “ :
” คั่นกลาง โปรดทราบว่าอักขระในตัวแปรสตริงจะมีหมายเลขเริ่มต้นที่ ศูนย์
long_string="Frankenstein หรือ Prometheus สมัยใหม่"
สตริงย่อย=${long_string:0:12}
echo $substring
เสียงสะท้อน ${long_string:27}
รูปแบบอื่นช่วยให้คุณสามารถทิ้งตัวอักษรจำนวนหนึ่งออกจากส่วนท้ายของสตริงได้ ช่วยให้คุณกำหนดจุดเริ่มต้น และใช้จำนวนลบเป็นความยาวได้อย่างมีประสิทธิภาพ สตริงย่อยจะมีอักขระตั้งแต่จุดเริ่มต้นจนถึงจุดสิ้นสุดของสตริง ลบด้วยจำนวนอักขระที่คุณระบุในจำนวนลบ
my_string="ตามตัวอักษร"
เสียงสะท้อน ${my_string:5:-4}
ในทุกกรณี ตัวแปรสตริงดั้งเดิมจะไม่ถูกแตะต้อง สตริงย่อย "แยก" ไม่ได้ถูกลบออกจากเนื้อหาของตัวแปร
การแยกสตริงย่อยโดยตัวคั่น
ข้อเสียของการใช้การชดเชยอักขระคือคุณจำเป็นต้องทราบล่วงหน้าว่าสตริงย่อยที่คุณต้องการแยกนั้นอยู่ภายในสตริงที่ใด
หากสตริงของคุณถูกคั่นด้วยอักขระที่ซ้ำกัน คุณสามารถแยกสตริงย่อยโดยไม่ทราบว่าอยู่ที่ไหนในสตริงหรือยาวแค่ไหน
หากต้องการค้นหาจากด้านหน้าของสตริง ให้ทำตามชื่อตัวแปรที่มีเครื่องหมายเปอร์เซ็นต์สองเท่า %%
อักขระคั่น และเครื่องหมายดอกจัน *
คำในสตริงนี้คั่นด้วยช่องว่าง
long_string="ที่หนึ่ง สอง สาม สี่ ห้า"
เสียงสะท้อน ${long_string%%' '*}
ส่งคืนสตริงย่อยแรกจากด้านหน้าของสตริงที่ไม่มีอักขระตัวคั่น สิ่งนี้เรียกว่าตัวเลือกสตริงย่อยแบบสั้น
ตัวเลือกสตริงย่อยแบบยาวจะคืนค่าส่วนหน้าของสตริงจนถึงสตริงย่อยที่คั่นด้วยตัวคั่นล่าสุด กล่าวอีกนัยหนึ่ง จะละเว้นสตริงย่อยที่คั่นด้วยตัวคั่นสุดท้าย ในทางวากยสัมพันธ์ ความแตกต่างเพียงอย่างเดียวคือมันใช้เครื่องหมายเปอร์เซ็นต์เดียว “ %
” ในคำสั่ง
long_string="ที่หนึ่ง สอง สาม สี่ ห้า"
เสียงสะท้อน ${long_string%' '*}
อย่างที่คุณคาดหวัง คุณสามารถค้นหาในลักษณะเดียวกันได้จากส่วนท้ายของสตริง แทนที่จะใช้เครื่องหมายเปอร์เซ็นต์ ให้ใช้เครื่องหมายแฮช “ #
” และเลื่อนตัวคั่นให้มา หลัง เครื่องหมายดอกจัน “ *
” ในคำสั่ง
long_string="this.long.string.of.words.is.delimited.by.periods"
เสียงสะท้อน ${long_string##*.}
นี่คือตัวเลือกสตริงย่อยแบบสั้น ซึ่งจะตัดสตริงย่อยแรกที่พบจากด้านหลังของสตริงที่ไม่มีตัวคั่น
long_string="this.long.string.of.words.is.delimited.by.periods"
เสียงสะท้อน ${long_string#*.}
ตัวเลือกสตริงย่อยแบบยาวจะคืนค่าส่วนหลังของสตริงจนถึงตัวคั่นแรกจากด้านหน้าของสตริง กล่าวคือข้ามสตริงย่อยที่คั่นด้วยตัวคั่นแรก
การแทนที่สตริงย่อย
การสลับสตริงย่อยสำหรับสตริงย่อยอื่นทำได้ง่าย รูปแบบคือชื่อของสตริง สตริงย่อยที่จะถูกแทนที่ และสตริงย่อยที่จะแทรก โดยคั่นด้วยเครื่องหมายทับ “ /
”
string = "หมูสีน้ำเงินหัวเราะคิกคัก"
เสียงก้อง ${string/pig/goat}
หากต้องการจำกัดการค้นหาไว้ที่ส่วนท้ายของสตริง ให้นำหน้าสตริงการค้นหาด้วยอักขระเครื่องหมายเปอร์เซ็นต์ “ %
”
string = "หมูสีน้ำเงินหัวเราะคิกคัก"
เสียงก้อง ${string/%giggles/chuckles}
หากต้องการจำกัดการค้นหาไว้ที่จุดเริ่มต้นของสตริง ให้นำหน้าสตริงการค้นหาด้วยอักขระแฮช “ #
”
string = "หมูสีน้ำเงินหัวเราะคิกคัก"
เสียงก้อง ${string/#blue/yellow}
สตริงเป็นสิ่งที่ยืดหยุ่นได้
หากสตริงไม่ใช่แค่ตามที่คุณต้องการหรือต้องการ เครื่องมือเหล่านี้จะช่วยให้คุณฟอร์แมตใหม่เพื่อให้เหมาะกับความต้องการของคุณ สำหรับการแปลงที่ซับซ้อน ให้ใช้ยูทิลิตี้เฉพาะ แต่สำหรับการปรับแต่งเล็กน้อยให้ใช้เชลล์ในตัวและหลีกเลี่ยงค่าใช้จ่ายในการโหลดและเรียกใช้เครื่องมือภายนอก
ที่เกี่ยวข้อง: ทุกสิ่งที่คุณอยากรู้เกี่ยวกับ inodes บน Linux