Stable Diffusion에서 CFG는 Classifier Free Guidance 척도를 나타냅니다. CFG는 텍스트 프롬프트를 얼마나 정확하게 따를지를 조절하는 설정으로, 텍스트를 이미지로 (txt2img) 및 이미지를 이미지로 (img2img) 변환하는 데 사용됩니다.
CFG 값이 높으면 이론적으로 프롬프트를 더 엄격하게 따르게 됩니다. 기본값은 7로, 창의적인 자유와 지시 사항을 따르는 균형을 잘 이룹니다. 값이 1인 경우 거의 완전한 자유를 가지게 되며, 15 이상의 값은 상당히 제한적이라고 볼 수 있습니다.
Stable Diffusion에서 CFG를 증가시키면 출력 이미지 품질에 영향을 미칩니다.
더 높은 CFG 값에서 출력 이미지 품질이 떨어지는 것을 보완하기 위해 일반적으로 다음 두 가지 방법을 사용할 수 있습니다
메모리와 처리 시간을 최소화하면서 최상의 출력 이미지를 얻기 위해 사용자는 사용 중인 시스템에 대해 CFG, 샘플러 단계 및 샘플러 사이의 균형을 찾아야 합니다. 샘플링 스텝의 효과와 한계에 대해서는 다음 문서에서 다루도록 하겠습니다.
Stable Diffusion을 이용한 이미지 업스케일 (0) | 2023.04.30 |
---|---|
이미지 품질은 유지하고 출력시간 줄이기 (0) | 2023.04.29 |
Latent와 ESRGAN 업스케일러 비교 (0) | 2023.04.29 |
오픈포즈를 활용해 원하는 자세로 이미지 생성하기 (0) | 2023.04.29 |
CFG Scale 과 Sampling steps (1) | 2023.04.28 |
댓글 영역