안정적인 확산으로 모든 이미지를 AI로 업스케일링하는 방법

게시 됨: 2023-07-17

우주 헬멧을 쓰고 있는 자동차의 디지털 페인팅, 한쪽 면을 더 높은 해상도로 업스케일링. — 안정적인 확산 / Jordan Gloor / How-To Geek

Stable Diffusion WebUI에서 "Extras" 탭을 클릭합니다.
업스케일링하려는 이미지를 업로드합니다.
크기 조정 슬라이더를 조정하여 원하는 해상도를 선택하십시오.
사용할 업스케일러를 선택합니다.
"생성"을 클릭합니다.

Stable Diffusion 작품의 저해상도에 실망하셨습니까? 아니면 고급화하고 싶은 오래된 "실제" 사진이 있습니까? Stable Diffusion WebUI에는 이를 위한 도구가 있으며 그 과정에서 배운 몇 가지 팁을 공유하면서 프로세스를 안내합니다.

참고: 이 가이드에서는 automatic11111의 Stable Diffusion WebUI가 설치되어 실행 중이라고 가정합니다. Stable Diffusion의 결정판이며 표준 Stable Diffusion 설치에 비해 업스케일링(AI 이미지 작업의 다른 많은 측면과 함께)을 훨씬 더 간단하고 직관적으로 만듭니다.

안정적인 확산에서 이미지를 업스케일링하는 방법
더 나은 업스케일링 결과를 위한 팁

안정적인 확산에서 이미지를 업스케일링하는 방법

오래된 사진, 오래된 디지털 사진 또는 저해상도 AI 생성 이미지를 스캔한 경우 Stable Diffusion WebUI를 시작하고 아래 단계를 따르세요.

1. 이미지 업로드

Stable Diffusion의 업스케일링 도구는 모두 "Extras" 탭에 있으므로 클릭하면 업스케일링 메뉴가 열립니다.

또는 확대할 이미지를 방금 생성한 경우 "Extras로 보내기"를 클릭하면 확대할 이미지가 있는 위치로 이동합니다. 그렇지 않으면 이미지를 Extras 업로드 필드로 끌어다 놓을 수 있습니다.

Stable Diffusion WebUI의 Extras 업로드 필드에 있는 사진.

한 번에 업스케일링하고 싶은 이미지가 여러 개인 경우 "일괄 처리" 탭으로 전환하고 한 번에 여러 개를 드롭합니다. 하지만 내 경험상 이것이 항상 작동하는 것은 아니며

2단계: 크기 선택

"크기 조정" 슬라이더를 사용하여 출력 이미지의 크기를 조정합니다. 기본적으로 이미지의 현재 해상도에 주어진 숫자를 곱할 수 있는 "축척 기준" 탭을 사용합니다. 예를 들어 2로 설정하고 입력 이미지가 512×512이면 이미지가 1024×1024로 업스케일링됩니다.

"Scale By" 슬라이더 또는 숫자 필드를 조정하여 업스케일링할 배수를 선택합니다.

또는 "크기 조정" 탭으로 전환하고 원하는 특정 해상도를 입력할 수 있습니다. 이미지의 현재 종횡비에 주의를 기울이고 가장자리가 잘리지 않도록 하려면 "크기에 맞게 자르기" 옵션을 선택 취소하십시오.

배경 화면을 만들 계획이라면 대부분의 최신 휴대폰은 9:16 화면비, 태블릿은 4:3, 컴퓨터는 16:9를 사용한다는 점을 기억하세요(초광각 모니터는 21:9까지 가능).

3단계: 업스케일러 선택

이제 압도당하는 느낌이 들기 쉬운 부분이 있습니다. 여러 가지 업스케일링 알고리즘을 마음대로 사용할 수 있으며 모두 비밀스러운 이름을 가지고 있고 하나를 선택해야 합니다.

궁극적으로 선택해야 하는 것은 사진, 그림, 애니메이션 아트 또는 다른 종류의 "만화" 스타일 아트워크와 같이 업스케일링하는 이미지의 종류에 따라 다릅니다. 다른 알고리즘도 다른 속도로 작동하므로 어떤 종류의 서두름에 따라 달라질 수도 있습니다.

사용 가능한 업스케일러를 표시하는 Stable Diffusion WebUI의 드롭다운 목록입니다.

최고의 안정적인 확산 업스케일러는 무엇입니까?

다양한 알고리즘으로 실험하는 것이 Stable Diffucion의 내장 업스케일러 중 어떤 것이 귀하의 경우에 가장 적합한지 정확히 알 수 있는 유일한 방법입니다. 즉, 기본 권장 사항을 원하는 경우 일반적으로 다음을 선택하는 것이 좋습니다.

사진: ESRGAN_4x
그림: R-ESRGAN 4x+
애니메이션: R-ESRGAN 4x+ Anime6B

4단계: 고급!

설정이 완료되면 고급화할 차례입니다. 프로세스를 시작하려면 큰 "생성" 버튼을 누르십시오.

주어진 알고리즘으로 처음 업스케일할 때 Stable Diffusion은 적절한 모델을 다운로드해야 하므로 초기 실행에 추가 시간이 걸릴 수 있습니다(부분적으로 연결 속도에 따라 다름).

업스케일링이 완료되면 outputs 폴더의 extras-images 하위 디렉토리에서 출력 이미지를 찾을 수 있습니다.

관련: 안정적인 확산을 사용하여 AI GIF 및 비디오를 만드는 방법

더 나은 업스케일링 결과를 위한 팁

이미지가 예상한 대로 표시되지 않는 경우 Stable Diffusion의 업스케일링 도구에서 더 나은 결과를 얻을 수 있는 몇 가지 방법이 있습니다.

업스케일러 콤보 시도

고급 업스케일링의 경우 동일한 이미지에 효과를 적용할 두 번째 알고리즘을 선택할 수 있으며 두 업스케일러의 결과가 최종 제품에 혼합됩니다. (분명히 말하면, 두 번째 업스케일러는 출력 해상도를 두 배로 만들지 않습니다 .) 이는 서로 다른 두 업스케일러가 서로 다른 이유로 더 나은 결과를 생성하는 경우에 유용합니다.

예를 들어, 내 테스트에서 나는 ESRGAN_4x가 세부 사항을 유지하는 데 가장 적합하다는 것을 알았지만 SwinIR은 그레인이 적고 성가신 타일 아티팩트도 도입했습니다. ESRGAN_4x를 기본 업스케일러로 설정하고 SwinIR을 보조로 0.5 가시성으로 설정하여 두 세계의 장점을 모두 얻을 수 있었습니다.

Stable Diffusino WebUI에서 선택된 보조 업스케일러.

Outpainting으로 잘못된 종횡비 수정

특정 종횡비로 사용하려는 이미지가 있지만 확대된 이미지가 크롭하지 않고 사용하기에는 너무 크거나 두 폭인 경우 Stable Diffusion의 "아웃페인팅" 도구를 사용하여 잠재적으로 해당 문제를 해결할 수 있습니다. 그것은 당신이 이미지의 "더"를 생성할 수 있게 하여 이전에는 없었던 측면 또는 상단과 하단에 이미지를 추가합니다.

아웃페인팅을 시작하려면 이미지를 img2img 입력에 드롭하고 "Script" 드롭다운 메뉴를 찾아 Outpainting mk2 또는 Poor Man's Outpainting을 선택합니다. 필요에 따라 표시되는 설정을 조정한 다음 "생성"을 클릭합니다.

빠르게 알 수 있듯이 잘 칠하는 것은 어려우며 특히 사람과 동물과 같은 복잡한 이미지 콘텐츠의 경우 다른 가이드의 주제일 수 있습니다. 즉, 너무 많이 변경하지 않고 장난을 치면서 언뜻 보기에는 반쯤 믿을 수 없는 내 이미지의 파노라마 버전을 생성할 수 있었습니다.

Stable Diffusion을 사용하여 왼쪽과 오른쪽이 생성된 가을 산책로의 확대 사진. — 안정적인 확산 / Jordan Gloor / How-To Geek

GPFGAN 또는 CodeFormer로 왜곡된 얼굴 복원

당신이 폭파하는 이미지에 사람의 얼굴이 있으면 알아볼 수 없을 정도로 쉽게 왜곡될 수 있습니다. Stable Diffusion의 다소 끔찍한 인간 얼굴 표현도 본 적이 있을 것입니다. 두 경우 모두 GPFGAN 또는 CodeFormer 가시성 슬라이더를 살짝 밀고 싶을 때입니다. 각각은 업스케일링 과정에서 안면 교정 레이어를 적용하여 으스스한 눈과 기괴한 주름을 수정합니다.

CodeFormer를 사용하는 경우 효과의 "가중치"를 조정할 수도 있습니다. 이는 강도 수준을 제어하는 것과 비슷합니다(가시성 슬라이더는 보정 레이어의 투명도를 조정하는 것과 비슷함). 가중치를 높일수록 CodeFormer는 더 많은 수정을 시도합니다. 이는 상황에 따라 최종 이미지를 개선하거나 저하시킬 수 있습니다. 최상의 결과를 얻으려면 시행 착오를 거쳐야 할 수도 있습니다.

안면 복원을 위한 GPFGAN 대 CodeFormer

둘 다 유능한 도구이지만 GPFGAN은 일반적으로 얼굴 구조(특히 눈)를 복원하는 데 더 좋지만 CodeFormer는 피부 질감을 수정하는 데 더 좋습니다. GPFGAN은 인간의 피부를 이상하게 매우 매끈하게 보이게 하는 경향이 있으므로 이러한 일이 발생하는 경우 대신 CodeFormer를 사용해 보십시오. 또는 두 가지를 결합하여 두 세계의 장점을 최대한 활용하십시오. 다시 말하지만, 실험이 핵심입니다.

GFPGAN 및 CodeFormer 슬라이더를 사용하여 확대된 이미지에 얼굴 보정을 추가하십시오.

속도면에서 GPFGAN은 CodeFormer보다 약간 빠릅니다. 따라서 업스케일링을 가능한 한 빨리 수행하려는 경우 GPFGAN에 의존하고 싶을 것입니다.

관련: MidJourney를 사용하여 모든 장치에 대해 멋진 배경 화면을 만드는 방법