วิธีเขียนข้อความแจ้งการแพร่กระจายที่เสถียรที่ยอดเยี่ยม

เผยแพร่แล้ว: 2022-09-23
ภาพถ่ายของ Adirondacks ตอนพระอาทิตย์ตก ฤดูใบไม้ร่วง. นอกจากนี้ รูปภาพยังสร้างโดย Stable Diffusion ในเวลาประมาณ 18 วินาที
Adirondacks ที่พระอาทิตย์ตกดินในช่วงฤดูใบไม้ร่วง ยกเว้นรูปภาพนี้เป็นของปลอมที่ผลิตใน 18.5 วินาที

Stable Diffusion ซึ่งเป็นเครื่องมือสร้างงานศิลปะ AI ยอดนิยม ต้องการข้อความแจ้งเพื่อสร้างรูปภาพ บางครั้งมันก็ทำงานได้อย่างน่าทึ่งและสร้างสิ่งที่คุณต้องการด้วยข้อความแจ้งที่คลุมเครือ ในบางครั้ง คุณจะได้รับผลลัพธ์ที่ไม่เหมาะสม ต่อไปนี้คือเคล็ดลับและกลเม็ดบางประการเพื่อให้ได้ผลลัพธ์ในอุดมคติ

วิธีการเขียนพรอมต์การแพร่กระจายที่เสถียร

หากคุณเคยใช้เวลากับโปรแกรมสร้างภาพ AI เช่น Stable Diffusion, DALL-E หรือ MidJourney เลย คุณจะสังเกตเห็นว่าคำพูดที่ฉับไวมีความสำคัญอย่างยิ่ง คำพูดที่ชัดเจนคือความแตกต่างระหว่างการเปลี่ยนความคิดของคุณให้เป็นภาพที่ยอดเยี่ยมและการได้รับความแปลกประหลาดในหุบเขาด้วยนิ้วที่จ้องกลับมาที่คุณมากเกินไป

วิธีเรียกใช้การแพร่กระจายที่เสถียรบนพีซีของคุณเพื่อสร้างอิมเมจ AI
ที่เกี่ยวข้อง วิธีเรียกใช้การแพร่กระจายที่เสถียรบนพีซีของคุณเพื่อสร้างอิมเมจ AI

ผู้คนพยายามค้นหาวิธีที่ดีที่สุดเพื่อให้ได้ผลลัพธ์ในอุดมคติตั้งแต่ Stable Diffusion เปิดตัวในเดือนสิงหาคม 2022 และพวกเขาจะเป็น "งานช่างตีเหล็กทันที" หรือ "วิศวกรรมพร้อมรับคำ" ในอีกหลายปีข้างหน้า เป็นไปได้อย่างยิ่งเนื่องจากจุดตรวจที่แจ้งว่าการแพร่กระจายที่เสถียรสร้างภาพจะได้รับการอัปเดตเป็นระยะ พร้อมท์ในอุดมคติจะเป็นเป้าหมายที่เคลื่อนไหวในอนาคตอันใกล้

ที่เกี่ยวข้อง: เครื่องสร้างภาพ AI ที่ดีที่สุดที่คุณสามารถใช้ได้ตอนนี้

เฉพาะเจาะจงที่สุดเท่าที่จะทำได้

Stable Diffusion มีแนวโน้มที่จะเติบโตได้เมื่อมีการเตือนโดยเฉพาะเมื่อเปรียบเทียบกับ MidJourney คุณต้องบอก สิ่ง ที่คุณต้องการอย่างแน่นอน นี่คือตัวอย่างการใช้สัตว์ที่อินเทอร์เน็ตชื่นชอบ ได้แก่ แมวน่ารัก

แผงรูปภาพเอาต์พุต 6 รูปจาก Stable Diffusion โดยใช้ข้อความ "แมวน่ารัก"
พรอมต์: “แมวน่ารัก”, Sampler = PLMS, CFG = 7, ขั้นตอนการสุ่มตัวอย่าง = 50

เอาล่ะ พวกเขาน่ารักมาก ยกเว้นคนที่น่าสงสารที่อยู่ตรงกลางด้านบนซึ่งดูเหมือนว่าเขาใช้เวลามากเกินไปในการจ้องมองเข้าไปในขุมนรก แต่ถ้าคุณต้องการแมวสีเทา ไม่ใช่แมวผสมกันล่ะ คุณต้องระบุว่า ใช้ "แมว สีเทา น่ารัก" เป็นข้อความเตือนแทน

แผงรูปภาพเอาต์พุต 6 รูปจาก Stable Diffusion โดยใช้ข้อความ "แมวสีเทาน่ารัก"
พรอมต์: “แมวสีเทาน่ารัก”, Sampler = PLMS, CFG = 7, ขั้นตอนการสุ่มตัวอย่าง = 50

ตอนนี้ Stable Diffusion จะคืนค่าแมวสีเทาทั้งหมด คุณสามารถเพิ่มคำอธิบายของสิ่งที่คุณต้องการได้ตลอดรวมถึงเครื่องประดับแมวในรูปภาพ

อีกแผงภาพเอาท์พุต 6 ภาพ จาก Stable Diffusion พร้อมข้อความ "แมวสีเทาน่ารักตาสีฟ้า ผูกโบว์"
Prompt: “แมวสีเทาน่ารัก ตาสีฟ้า ผูกโบว์” Sampler = PLMS, CFG = 7, Sampling Steps = 50

สิ่งนี้ใช้ได้กับทุกสิ่งที่คุณต้องการสร้าง Stable Diffusion รวมถึงทิวทัศน์ อธิบายให้ละเอียด และเมื่อคุณลองใช้คำหลักหลายคำรวมกัน ให้ระลึกไว้เสมอว่าภาพมีการเปลี่ยนแปลงอย่างไร คำและวลีบางคำมีแนวโน้มที่จะมีอคติต่อรูปภาพมากกว่าคำอื่นๆ ดังนั้นคุณอาจต้องปรับข้อความแจ้งของคุณตามนั้น

ชื่อรูปแบบศิลปะหรือสื่อเฉพาะ

ความต้องการเฉพาะเจาะจงไม่สิ้นสุดเมื่อคุณอธิบายเนื้อหาของภาพที่คุณต้องการอย่างเต็มที่ คุณสามารถ (และควร) ระบุสไตล์ที่คุณต้องการได้เช่นกัน เราจะยึดตาม "แมวสีเทาน่ารัก" สำหรับสิ่งนี้ สมมติว่าเราต้องการแมวสีเทาน่ารักบางตัว แต่เราก็ต้องการให้พวกมันดูเหมือนเป็นภาพวาดอะคริลิกด้วย สิ่งแรกที่คุณควรลองคือการเพิ่ม “ภาพวาดอะคริลิก” เป็นคำหลักถัดไปในข้อความแจ้งของคุณ ดังนั้นมันจะอ่านว่า: “แมวสีเทาน่ารัก ภาพวาดสีอะครีลิค”

โดยทั่วไปแล้ว เป็นการดีที่สุดที่จะเริ่มต้นด้วยคำหลักที่น้อยที่สุดเพื่อเข้าใกล้สิ่งที่คุณต้องการ แล้วเพิ่มคำอื่นๆ เพื่อความสวยงามที่คุณต้องการ

แมวสีเทา 6 ตัวจาก Stable Diffusion ที่ดูเหมือนภาพวาดอะคริลิก
พร้อมท์: “แมวสีเทาน่ารัก ภาพวาดสีอะครีลิค”, Sampler = PLMS, CFG = 7, Sampling Steps = 50

การกระจายที่เสถียรรับรู้สไตล์ที่แตกต่างกันมากมาย ตั้งแต่ภาพวาดดินสอไปจนถึงแบบจำลองดินเหนียวไปจนถึงการเรนเดอร์ 3 มิติจาก Unreal Engine

อีกตัวอย่างหนึ่งของแมวสีเทาในสไตล์ "Unreal Engine"
พรอมต์: “แมวสีเทาน่ารัก, การเรนเดอร์ Unreal Engine”, Sampler = PLMS, CFG = 7, ขั้นตอนการสุ่มตัวอย่าง = 50

ตัวอย่างข้อความแจ้งนั้นง่ายมาก แต่คุณสามารถใช้คำหลักหลายสิบคำเพื่อปรับแต่งผลลัพธ์ของคุณ หากคุณต้องการโมเดลไก่ดินเหนียวสีแปลกตาใน Walmart คุณต้องระบุเงื่อนไขเหล่านั้น ทั้งหมด

ประติมากรรมดินเหนียวละลายประหลาดของไก่ในวอลมาร์ท
พร้อมท์: “อกไก่ในห้างวอลมาร์ท โมเดลดินเหนียว (สีประสาทหลอน) ละลาย ประหลาด” Sampler = PLMS, CFG = 7, Sampling Steps = 150

ระบุชื่อศิลปินเฉพาะเพื่อเป็นแนวทางในการแพร่กระจายที่เสถียร

Stable Diffusion สามารถทำได้มากกว่าการเลียนแบบรูปแบบหรือสื่อเฉพาะ มันสามารถเลียนแบบศิลปินเฉพาะได้หากคุณต้องการทำเช่นนั้น ตัวอย่างนี้ใช้ Pablo Picasso

คุณควรลองใส่ "โดย (ชื่อศิลปิน)" ลงในข้อความแจ้งของคุณหากยังไม่ได้ดำเนินการ มีแนวโน้มที่จะให้ผลลัพธ์ที่น่าทึ่ง อย่ากลัวที่จะรวมศิลปินที่ปกติไม่ไปด้วยกัน บ่อยครั้ง Stable Diffusion จะรวมเอาสไตล์ของพวกเขาเข้าไว้ด้วยกันในรูปแบบที่น่าตื่นเต้นและคาดเดาไม่ได้

เคล็ดลับ: หากคุณใช้เวอร์ชัน GUI ของ Stable Diffusion สำหรับ Windows ที่เราแนะนำ จะมีปุ่ม "ม้วน" ทางด้านขวาของหน้าต่างพร้อมท์ที่จะสุ่มส่งศิลปินไปยังข้อความแจ้งของคุณ เป็นวิธีที่ดีในการสะดุดเข้ากับสไตล์ใหม่ๆ

แมว 6 ตัวดังภาพ Stable Diffusion Picasso น่าจะวาดไว้

ให้น้ำหนักคำหลักของคุณ

แน่นอน เพียงแค่ใส่คำหลักลงในข้อความแจ้งของคุณ คุณก็จะทำได้จนถึงตอนนี้ จะเกิดอะไรขึ้นหากคุณได้รับสิ่งที่ถูกต้องทั้งหมดในการแจ้งเตือนของคุณ แต่สิ่งเหล่านี้ไม่ได้สัดส่วนอย่างเหมาะสม

Stable Diffusion รองรับการถ่วงน้ำหนักของคำสำคัญพร้อมท์ กล่าวอีกนัยหนึ่ง คุณสามารถบอกได้ว่าจำเป็นต้องให้ความสนใจกับคำหลักหนึ่งๆ (หรือคำหลัก) ที่เฉพาะเจาะจงจริงๆ และให้ความสำคัญกับคำอื่นๆ น้อยลง มันสะดวกมากหากคุณได้ผลลัพธ์ที่ตรงกับความต้องการของคุณ แต่ยังไม่ถึงขั้นนั้น

ที่เกี่ยวข้อง: วิธีเรียกใช้การแพร่กระจายที่เสถียรบนพีซีของคุณเพื่อสร้างอิมเมจ AI

ในเวอร์ชันบรรทัดคำสั่งของ Stable Diffusion คุณเพียงแค่เพิ่มโคลอนเต็มตามด้วยตัวเลขทศนิยมให้กับคำที่คุณต้องการเน้น ตัวเลขทศนิยมเป็นเปอร์เซ็นต์ ดังนั้นต้องรวมกันได้ 1

กลับไปที่ข้อความแจ้ง "แมวสีเทาน่ารัก" ของเรา สมมติว่ามันผลิตแมวน่ารักได้อย่างถูกต้อง แต่มีภาพที่ส่งออกไม่มากนักที่มีแมวสีเทา คุณสามารถแก้ไขข้อความแจ้งเพื่ออ่านว่า "แมวน่ารักสีเทา:0.7" แทน และมันจะให้ความสำคัญกับแมวสีเทามากที่สุด จากนั้นจึงนำความแตกต่างไปใช้กับ "น่ารัก" โดยอัตโนมัติ คุณยังสามารถกำหนดน้ำหนักให้กับแต่ละคำในพรอมต์ด้วยตนเองได้หากต้องการการควบคุมที่ละเอียดยิ่งขึ้น เช่น “น่ารัก:0.10, แมวสีเทา:0.60, การแสดงผล Unreal Engine:0.30” เป็นต้น

ที่เกี่ยวข้อง: วิธีเรียกใช้การแพร่กระจายที่เสถียรในเครื่องด้วย GUI บน Windows

GUI ส่วนใหญ่ที่มีให้สำหรับ Stable Diffusion จัดการน้ำหนักโดยที่คุณไม่ต้องป้อนเปอร์เซ็นต์ที่ชัดเจน โดยปกติคุณสามารถเพิ่มวงเล็บรอบคำในข้อความแจ้งเพื่อเน้นย้ำ และวงเล็บเพื่อลดความสำคัญของคำศัพท์ ดังนั้น “แมวสีเทาน่ารัก” ก่อนหน้านี้อาจดูเหมือน “[น่ารัก],((แมวสีเทา))”

หมายเหตุ: คุณสามารถใช้วงเล็บหลายอันเพื่อซ้อนการเน้นได้มากเท่าที่คุณต้องการ

ค้นหาแรงบันดาลใจที่อื่น

การแพร่กระจายที่เสถียรและเครื่องกำเนิดงานศิลปะ AI อื่น ๆ ได้รับความนิยมอย่างมาก คุณสามารถหางานศิลปะ AI ประเภทนี้ได้ทุกที่ นั่นหมายความว่าขณะนี้มีรูปภาพที่ผู้ใช้สร้างขึ้นอย่างน้อยสองสามล้านรูปที่ลอยอยู่บนอินเทอร์เน็ต และโดยส่วนใหญ่ ผู้คนมักแจ้งข้อความแจ้งที่พวกเขาเคยใช้เพื่อให้ได้ผลลัพธ์

ที่เกี่ยวข้อง: หอศิลป์ AI นี้ดีกว่าการใช้เครื่องกำเนิด

ต่อไปนี้เป็นแหล่งข้อมูลบางส่วนที่จะช่วยจุดประกายแรงบันดาลใจของคุณ หากคุณไม่แน่ใจว่าคุณต้องการสร้างอะไร:

คำเตือน: สิ่งเหล่านี้อาจเป็น NSFW
  • Lexica — พื้นที่เก็บข้อมูลรูปภาพที่สร้างโดยใช้ Stable Diffusion และพร้อมต์ที่เกี่ยวข้อง ค้นหาได้จากคำสำคัญ
  • Stable Diffusion Artist Style Studies — รายชื่อโดยย่อของศิลปิน Stable Diffusion อาจรู้จัก เช่นเดียวกับคำอธิบายทั่วไปของสไตล์ศิลปะของพวกเขา มีระบบการจัดอันดับเพื่ออธิบายว่า Stable Diffusion ตอบสนองต่อชื่อศิลปินได้ดีเพียงใดโดยเป็นส่วนหนึ่งของการแจ้งเตือน
  • Stable Diffusion Modifier Studies — รายการของตัวดัดแปลงที่สามารถใช้กับ Stable Diffusion ได้ เช่นเดียวกับหน้าศิลปิน
  • รายการ AI Art Modifiers — แกลเลอรีรูปภาพที่แสดงตัวปรับแต่งที่รัดกุมที่สุดบางส่วนที่คุณสามารถใช้ได้ในข้อความแจ้งของคุณ และสิ่งที่พวกเขาทำ โดยจะจัดเรียงตามประเภทตัวปรับแต่ง
  • ศิลปิน 500 อันดับแรกที่เป็นตัวแทนของ Stable Diffusion — เราทราบดีว่าภาพใดบ้างที่รวมอยู่ในชุดการฝึก Stable Diffusion จึงสามารถบอกได้ว่าศิลปินคนใดมีส่วนมากที่สุดในการฝึก AI โดยทั่วไป ยิ่งตัวแทนของศิลปินมีความเข้มแข็งมากเท่าใดในข้อมูลการฝึกอบรม การแพร่กระจายที่เสถียรก็จะยิ่งตอบสนองต่อชื่อของพวกเขาเป็นคำหลัก
  • The Stable Diffusion Subreddit — The Stable Diffusion subreddit มีการแจ้งเตือนใหม่ๆ และการค้นพบที่สนุกสนานอย่างต่อเนื่อง หากคุณกำลังมองหาแรงบันดาลใจหรือข้อมูลเชิงลึก คุณไม่สามารถผิดพลาดได้

ปรับแต่งการตั้งค่าที่สำคัญอื่นๆ

ข้อความแจ้งที่ดีเป็นส่วนที่ยากที่สุดของการใช้ Stable Diffusion แต่มีการตั้งค่าอื่นๆ อีกสองสามรายการที่จะเปลี่ยนแปลงผลลัพธ์อย่างมาก

  • CFG: กำหนดว่าการแพร่กระจายที่เสถียรมากเพียงใดตามข้อความแจ้งของคุณ ตัวเลขที่สูงขึ้นส่งผลให้เกิดการยึดมั่นกับข้อความแจ้งมากขึ้น ในขณะที่ตัวเลขที่ต่ำกว่าทำให้ AI มีอิสระมากขึ้น ลองปรับแต่งสิ่งนี้ก่อน
  • วิธีการ สุ่มตัวอย่าง: วิธีปรับแต่งภาพจากสัญญาณรบกวนให้กลายเป็นรูปร่างที่จดจำได้ ลองใช้สิ่งเหล่านี้ Euler_a, k_LMS และ PLMS ดูเหมือนจะเป็นตัวเลือกยอดนิยม
  • ขั้นตอนการสุ่มตัวอย่าง: จำนวนครั้งที่ภาพจะถูกสุ่มตัวอย่างก่อนที่คุณจะได้ผลลัพธ์สุดท้าย บางครั้งคุณได้ผลลัพธ์ที่ดีเมื่อก้าว 30 ก้าว บางครั้งคุณต้องไปถึง 50 หรือ 80 ก้าว โดยปกติคุณจะไม่ได้รับผลลัพธ์ที่ดีกว่า 150 ก้าวเสมอไป เริ่มต้นด้วยขั้นตอนน้อยลงและขึ้นไป

ข้อความพร้อมท์ที่เราโปรดปรานบางส่วน

นี่คือข้อความแจ้งที่เราโปรดปรานเนื่องจากมีแนวโน้มที่จะทำงานได้อย่างน่าเชื่อถือ เพียงใส่หัวข้อที่คุณเลือกพร้อมตัวดัดแปลงสองสามตัว การตั้งค่า Stable Diffusion อื่นๆ ทั้งหมดยังคงเหมือนเดิมตามข้อความแจ้งด้านบน

หมายเหตุ: ตามกฎแล้ว Stable Diffusion จะสร้างพระอาทิตย์ตกและใบไม้ร่วงได้ดีเป็นพิเศษ

(ตัวแบบ), 35mm, คม

เลือกหัวเรื่อง และข้อความแจ้งนี้จะส่งคืนผลลัพธ์ที่เหมือนจริงเสมือนภาพถ่ายของคน สัตว์ และทิวทัศน์

หมายเหตุ: ตัวอย่างพรอมต์นี้รวม "Golden Hour" ไว้ด้วยเพื่อให้ได้สีพระอาทิตย์ตก
การแพร่กระจายที่เสถียรบน Mount Katahdin เมื่อมองจากอีกฟากหนึ่งของทะเลสาบ
Prompt: รูปถ่ายเขากฐินกับทะเลสาบสวยงาม 35mm คม ชั่วโมงทอง

(หัวเรื่อง), เรนเดอร์ 3 มิติโพลีต่ำ, สีพาสเทลที่สดใส, การเลื่อนเอียง, เกรนของฟิล์ม

ใส่หัวเรื่องแล้วคุณจะได้มันในสุนทรียศาสตร์ "Art of Rally"

รถที่มีสีสันมาก

(หัวเรื่อง), (คำอธิบายด้านสิ่งแวดล้อม), ภาพยนตร์, ดราม่า, การจัดองค์ประกอบ, ท้องฟ้าแจ่มใส, นักโหดเหี้ยม, สมจริงมาก, สเกลมหากาพย์, ความรู้สึกของความกลัว, ไฮเปอร์แม็กซิมอลลิสต์, รายละเอียดระดับบ้า, สำนักงานใหญ่ของสถานีศิลปะ

เพียงแค่ใส่หัวข้อและคำอธิบายด้านสิ่งแวดล้อม และข้อความแจ้งนี้จะให้ภาพแนวความคิดของเมืองที่ยอดเยี่ยมพร้อมผลกระทบต่อสิ่งแวดล้อมที่คุณเลือก ต่อไปนี้คือตัวอย่างการใช้นิวยอร์กซิตี้เป็นหัวข้อและพายุฝุ่นเป็นคำอธิบายด้านสิ่งแวดล้อม:

วันที่อากาศไม่ดีปานกลางในนิวยอร์กซิตี้
พรอมต์: เมืองนิวยอร์ก, พายุฝุ่น, ภาพยนตร์, ดราม่า, องค์ประกอบ, ท้องฟ้าแจ่มใส, นักโหดร้าย, สมจริงมาก, สเกลมหากาพย์, ความรู้สึกของความกลัว, hypermaximalist, รายละเอียดระดับบ้า, สำนักงานใหญ่ของ artstation

Kermit Anything

Stable Diffusion ให้ผลลัพธ์ที่ยอดเยี่ยมด้วย Kermit ลองใช้ที่ไหนก็ได้

มิตร์มีหุ่นร้ายอยู่ข้างหลัง

เหตุใด Stable Diffusion จึงตีความว่า "Kermit in Mordor" และใครคือสิ่งชั่วร้ายของ Kermit ที่อยู่เบื้องหลังฮีโร่ผู้แข็งแกร่งของเรา ไม่มีความเห็น.

จำไว้ว่า อย่ากลัวที่จะลบสิ่งที่คุณคิดว่าอาจเป็นคำสำคัญออกจากข้อความแจ้งของคุณ คำบางคำ เช่น "งดงาม" จะมีอิทธิพลอย่างมากต่อรูปลักษณ์ของภาพ แม้ว่าจะไม่มีความหมายที่ชัดเจนก็ตาม เมื่อคุณใช้เวลามากขึ้นกับ Stable Diffusion คุณจะพัฒนาความรู้สึกว่ามันตอบสนองต่อคำบางคำอย่างไร และคุณจะพบว่าการเขียนข้อความแจ้งที่ดีนั้นเป็นศิลปะสำหรับตัวมันเอง