Bamboo is coming
stable diffusion for developers 본문
stable diffusion의 구조는
CLIP: 텍스트를 받아서 token에 따라 vector를 출력한다.
해당 사진에서 출력된 나무의 경우 나무의 위치가 왜 저 곳으로 매핑됐는지는 알 수 없다. latent space 내에 차원이 특징을 추출한 것으로 입력 데이터의 나무가 사이드에 위치된 데이터가 많았을 수도 있다.
stable-diffusion-for-developers (https://haandol.github.io/2023/07/16/stable-diffusion-for-developers.html#fn:4)
illustrated-stable-diffusion (https://jalammar.github.io/illustrated-stable-diffusion/)
how-stable-diffusion-work (https://stable-diffusion-art.com/how-stable-diffusion-work/)
CLIP:text2img (https://openai.com/research/clip)
'논문' 카테고리의 다른 글
[랩세미나]XAI (0) | 2023.11.29 |
---|---|
[랩세미나]Anomaly Detection in Surveillance Video (1) | 2023.10.26 |
Video Diffusion Study (0) | 2023.10.09 |
Score-based Generative Models and Diffusion Models (0) | 2023.09.07 |
Diffusion Model(Denoising Diffusion Probabilistic Models, DDPM), 디퓨전 모델 (0) | 2023.09.07 |
Comments