스테이블 디퓨전(stable diffusion)과 prompt 본문

공부는 끝이 없다/미디어혁신과 뉴스 스토리텔링

스테이블 디퓨전(stable diffusion)과 prompt

Stable Diffusion

Stable Diffusion은 텍스트 프롬프트를 기반으로 이미지를 생성하는 오픈 소스 AI 도구이다. 사용자가 로컬 환경에서 직접 설치하고 실행할 수 있으며, 다양한 파라미터와 커스터마이징을 통해 사진, 일러스트 등 고유한 이미지를 창의적으로 생성할 수 있다.

 

Stable Diffusion 소개 및 프롬프트 구조 예제

Stable Diffusion은 생성형 AI 중 하나로, 텍스트 프롬프트를 기반으로 이미지를 생성하는 강력한 도구이다. 이 모델은 오픈 소스 커뮤니티에서 활발히 사용되고 있으며, 사용자가 로컬 환경에서 직접 설치하고 실행할 수 있어 매우 유연한 활용이 가능하다. 특히 프로그래밍 경험이 있는 사용자는 Stable Diffusion을 통해 다양한 설정을 조정하며 고유한 이미지를 생성할 수 있다.

1. Stable Diffusion 개요

Stable Diffusion은 텍스트 기반의 입력을 통해 이미지를 생성하는 이미지 생성 AI로, 사용자로 하여금 상상력을 구체적인 시각적 결과물로 구현하게 한다. 이 모델은 오픈 소스로 공개되어 있어 누구나 무료로 접근하여 사용할 수 있으며, 로컬 컴퓨터에 직접 설치하여 사용 가능하다. 이 점에서 Stable Diffusion은 높은 자유도를 제공하며, 커스터마이징 옵션을 통해 특정 요구 사항에 맞춰 생성 결과를 최적화할 수 있다.

Stable Diffusion은 사용자가 입력한 텍스트 프롬프트를 기반으로 이미지의 구체적인 요소를 결정하며, 다양한 파라미터를 통해 이미지의 세부 사항을 조정할 수 있다. 이러한 특성 덕분에 사용자는 사진, 일러스트, 추상화된 예술 작품 등 다양한 스타일과 유형의 이미지를 생성할 수 있다.

 

2. 프롬프트 구조

Stable Diffusion에서 프롬프트는 생성하고자 하는 이미지의 세부적인 요구사항을 설정하는 핵심 도구이다. 프롬프트는 사용자가 원하는 이미지의 형태, 스타일, 분위기 등을 명확히 기술하여 AI가 최대한 정확하게 그 요구를 반영할 수 있도록 도와준다. 일반적으로 Stable Diffusion의 프롬프트는 다음과 같은 구성 요소를 포함한다:

  • type(이미지 형식 : 예) Film still (영화의 한 장면처럼), media type (photography, illustration, cartoon, anime, logo), technique (impasto, enamel painting, pencil sketch, pastel, crayon, water color)
  • Subject(대상): 그림의 주된 대상이 무엇인지 설명한다. 예를 들어 "고양이", "우주 비행사" 등과 같이 구체적인 대상을 지정할 수 있다. 예) detective
  • Action(동작): 대상이 어떤 행동을 하고 있는지에 대한 설명이다. 예를 들어 "달 위를 걷고 있는 우주 비행사"와 같은 식으로 대상의 행동을 추가한다. 예) examining evidence
  • Setting(배경): 이미지의 배경과 분위기를 설정한다. 예를 들어 "별이 빛나는 밤하늘 아래"와 같은 방식으로 이미지의 배경을 구체화할 수 있다. 예) Mood - in a dimly-lit room, Camera - extrem close-up
  • Style(스타일): 특정 예술적 스타일이나 미술 장르를 지정한다. "인상주의 스타일", "SF 영화 스타일" 등으로 이미지의 느낌을 설정할 수 있다.
  • Parameter(파라미터) : --ar 3:2 (aspect ratio : 가로 세로 비율)

Stable Diffusion Prompt Structure 예제

 

Type - 이미지 형식

 

Subject(대상) & Action(동작)

 

Setting 중 Mood(분위기) 요소

 

Setting 중 Camera 요소

 

Style

 

3. 프롬프트 예시와 사용 사례

Stable Diffusion에서 좋은 이미지를 얻기 위해서는 프롬프트 작성이 매우 중요하다. 예를 들어 "A majestic lion resting under a sunset, in the style of digital painting --ar 16:9 --scale 10"와 같은 프롬프트를 사용하면, Stable Diffusion은 사용자가 요청한 사자 그림을 멋진 석양 아래에서 디지털 페인팅 스타일로 표현하여 생성한다.

  • "A futuristic cityscape with flying cars, neon lights, in the style of cyberpunk --ar 21:9 --steps 100": 이 프롬프트는 미래 도시의 전경을 묘사하며, 사이버펑크 스타일로, 가로 세로 비율은 21:9로 설정되고 세밀한 생성 과정을 위해 100 스텝으로 지정되었다. 이를 통해 매우 디테일하고 분위기 있는 사이버펑크 도시 이미지를 생성할 수 있다.
  • "A serene forest with mystical creatures, watercolor painting --scale 7": 이 예시는 고요한 숲 속에서 신비한 생명체가 등장하는 장면을 수채화 스타일로 그려달라는 요청이다. "--scale" 파라미터를 사용하여 이미지의 디테일 정도를 조정했다.

 

Structure & Parameter Checkout


"파라미터, 프롬프트 구조 Checkout"
QRcode를찍으면Midjourney프롬프트구조와파라미터는물론ChatGPT 프롬프트구조와파라미터등을일목요연하게정리한페이지를다운로드할수있다.

 

4. 주요 파라미터 설명

Stable Diffusion에서 사용할 수 있는 주요 파라미터는 이미지의 세부적인 조정을 가능하게 해준다. 몇 가지 중요한 파라미터는 다음과 같다:

  • --ar (Aspect Ratio): 이미지의 가로 세로 비율을 지정한다. 예를 들어 "--ar 16:9"는 16:9 비율의 이미지를 생성한다.
  • --scale: 이미지의 창의성 수준을 설정한다. 값이 높을수록 AI가 더 자유롭게 해석하지만, 값이 낮을수록 프롬프트에 더 충실한 결과를 얻을 수 있다.
  • --steps: 이미지 생성 과정에서의 단계 수를 의미하며, 단계가 많을수록 더 정교한 결과를 얻을 수 있다. 일반적으로 50~150 사이의 값을 사용한다.
  • --seed: 특정 숫자를 지정하여 동일한 결과를 재현할 수 있도록 한다. 같은 프롬프트와 seed 값을 사용할 경우, 동일한 이미지를 생성할 수 있다.
  • --chaos: 이미지 생성의 변동성을 제어하는 파라미터이다. 값이 낮을수록 프롬프트에 충실한 이미지를 생성하며, 값이 높아질수록 예측 불가능하고 창의적인 이미지를 얻을 수 있다. 일반적으로 0에서 100 사이의 값을 사용한다.
  • --no: 특정 요소를 배제하는 파라미터이다. 예를 들어 "--no plant, bee, ant"와 같이 입력하면 해당 요소들이 이미지에서 제외된다. 원하지 않는 요소를 배제하여 더욱 정밀한 결과를 얻을 수 있다.
  • --quality: 이미지의 품질을 조정하는 파라미터로, 그리는 시간에 영향을 미친다. 값이 높을수록 더 정교한 이미지를 얻을 수 있으며, 디폴트 값은 1이다. 여러 값을 실험하여 최적의 결과를 얻는 것이 좋다.
  • --stop: 이미지 생성 과정을 중단할 시점을 설정한다. 예를 들어 "--stop 50"으로 설정하면 100% 완성된 이미지가 아닌 50%까지만 그리고 멈춘 상태의 이미지를 생성할 수 있다. 미완성된 이미지가 필요한 경우 유용하게 사용할 수 있다.
  • --stylize: 이미지의 예술적 표현 정도를 설정하는 파라미터이다. 값이 높을수록 예술적인 스타일이 강해지고, 값이 낮을수록 사실적인 표현이 강화된다. 값의 범위는 1에서 1000이며, 기본값은 100이다.
  • --Weight prompt: 이미지에서 특정 요소의 강조 정도를 조절하는 파라미터이다. 대상 이름 뒤에 "::"와 숫자를 추가하여 강조할 부분을 지정할 수 있다. 예를 들어 "cat::2 dog::1"은 고양이를 더 강조하고 개를 덜 강조하도록 설정한다.

 

5. Stable Diffusion의 장점

Stable Diffusion의 가장 큰 장점 중 하나는 오픈 소스로 제공된다는 점과 높은 자유도를 바탕으로 사용자가 원하는 대로 커스터마이징이 가능하다는 점이다. 로컬 환경에서 실행하기 때문에 사용자 데이터의 보안과 프라이버시를 보호할 수 있으며, 다양한 파라미터 설정을 통해 원하는 스타일과 느낌을 자유롭게 조절할 수 있다. Stable Diffusion은 아티스트, 디자이너, 연구자 등에게 매우 유용한 도구로 사용되고 있다.

Stable Diffusion의 활용 예시로는 예술 작품의 자동 생성, 게임 개발 시 컨셉 아트 제작, 광고 이미지 생성 등이 있다. 이처럼 다양한 분야에서 Stable Diffusion은 창의적인 작업을 돕는 강력한 도구로 자리 잡고 있다.

 

 

 

 

 

반응형

공부는 끝이 없다/미디어혁신과 뉴스 스토리텔링 Related Articles

MORE