AI 이미지 프롬프트(Prompt)란 AI에게 이미지를 생성하도록 지시하는 텍스트 명령입니다. 단순한 키워드 나열이 아니라 피사체, 환경, 조명, 구도, 스타일을 구체적으로 기술할수록 원하는 결과에 가까운 이미지가 생성됩니다.
Written by XBRUSH Content Team · Last updated: 2026-03-21
같은 AI 모델에 "고양이 사진"을 넣으면 매번 다른 고양이가 나옵니다. AI가 "나머지"를 알아서 채우기 때문입니다.
AI 이미지 생성에서 프롬프트는 단순한 검색어가 아닙니다. 화가가 캔버스에 앉기 전에 그리는 설계도입니다.
AI는 어떻게 이미지를 만드는가
Stable Diffusion 계열 모델은 텍스트와 이미지를 같은 잠재 공간(latent space)에서 처리하며, 지정하지 않은 영역은 확률적으로 채웁니다. Flux·Imagen 4·Kling 등 최신 통합 Transformer 모델은 공간 관계와 조명까지 더 정확하게 이해합니다.
Stable Diffusion: 이미지를 latent space로 압축 → 텍스트도 같은 공간으로 (CLIP) → 노이즈에서 디노이징으로 생성. 지정하지 않은 영역은 확률적으로 채운다.
최신 모델(Flux, Imagen 3, Kling): 텍스트와 이미지를 통합 Transformer로 처리 → 공간 관계, 속성 결합, 조명까지 더 정확하게 이해.
모델이 발전할수록 프롬프트를 이해하는 정밀도는 높아지지만, "무엇을 어떻게 표현할 것인가"를 설계하는 책임은 여전히 사용자에게 있습니다.
실전 예시 1: 눈표범 — 장면 서술형 프롬프트
장면 서술형 프롬프트는 촬영 스크립트처럼 장면의 모든 요소를 자연어로 기술합니다. 피사체의 행동, 배경 요소, 빛의 질감, 색조까지 문장 안에 담을수록 AI가 "나머지"를 임의로 채울 여지가 줄어듭니다.
by @NanoBanana / localbanana.io
상세 프롬프트: 발 들고 걷는 모습, 녹는 눈, 보라/노란 꽃, 해무리, 날카로운 암벽, 따뜻한 빛, 파란 눈, 직접 눈맞춤. 모든 요소가 실제 이미지에 구현됨.
피사체("발 들고 걷는 눈표범"), 배경("녹는 눈, 보라/노란 꽃"), 조명("해무리, 따뜻한 빛"), 시선 방향("직접 눈맞춤")을 각각 명시했기 때문에 가능한 결과입니다.
실전 예시 2: 딸기 계단 패션 — 구조화 프롬프트
구조화 JSON형 프롬프트는 이미지의 각 요소를 키-값 쌍으로 분리해 기술합니다. 동일한 프롬프트로 여러 장을 생성해도 일관된 결과를 유지하는 데 유리합니다.
by @Strength04_X / localbanana.io
구조화된 JSON형 프롬프트: quality, camera, lighting, style, scene, subject, outfit, pose, composition. 4개 이미지 모두 일관된 결과.
각 키(key)가 독립적으로 AI에게 전달되기 때문에, outfit만 바꾸면 나머지 요소(조명, 구도, 배경)를 유지한 채 의상만 달라진 이미지를 생성할 수 있습니다.
실전 예시 3: 지하철 헤드폰 광고 — 레퍼런스 이미지 기반 구조화 프롬프트
레퍼런스 이미지 기반 프롬프트는 특정 인물의 얼굴, 스타일, 구도를 기준점으로 고정하고 나머지 요소를 텍스트로 지정합니다. 제품 광고나 캐릭터 일관성이 중요한 작업에 적합합니다.
레퍼런스 이미지의 얼굴을 그대로 가져오는 조건까지 포함한 제품 광고용 구조화 프롬프트.
JSON 구조: reference(얼굴 구조·비율·정체성 일치), scene(지하철 객차, 형광등 조명), subject(헤드폰 조정 포즈, 옆 시선), product(프리미엄 무선 헤드폰), style(럭셔리 캠페인, 초포토리얼리스틱).
프롬프트 방식별 비교
세 가지 방식은 서로 배타적이지 않습니다. 작업의 성격에 따라 선택하거나 조합할 수 있습니다.
자연어 서술형 — 장점: 빠르게 작성, 유연한 결과 / 단점: 일관성 낮음, 재현 어려움 / 적합: 아이디어 탐색, 단발성 이미지
구조화 JSON형 — 장점: 요소별 수정 용이, 일관성 높음 / 단점: 초기 설계에 시간 필요 / 적합: 시리즈 이미지, 상품 사진 변형
레퍼런스 이미지 기반 — 장점: 얼굴·스타일 고정, 캐릭터 일관성 / 단점: 레퍼런스 이미지 준비 필요 / 적합: 제품 광고, 캐릭터 기반 콘텐츠
프롬프트 설계의 5가지 축
좋은 프롬프트는 5가지 축을 모두 갖추고 있습니다. 피사체와 행동, 환경과 배경, 조명, 카메라와 구도, 품질과 스타일. 각 축을 구체적으로 채울수록 AI가 임의로 결정하는 영역이 줄어들고 의도한 이미지에 가까워집니다.
1. 피사체와 행동 — 누가 무엇을 하는지 구체적으로
나쁜 예: 고양이 → 좋은 예: 검은 고양이가 달빛 아래 벽돌 담장 위에 앉아 먼 곳을 바라보고 있다
나쁜 예: 여자 → 좋은 예: 30대 여성이 카페 창가에서 커피잔을 두 손으로 감싸 쥐고 창밖을 바라보고 있다
나쁜 예: 음식 사진 → 좋은 예: 흰 세라믹 접시 위에 딸기 크레페가 놓여 있고 그 위에 생크림이 흘러내리고 있다
2. 환경과 배경 — 피사체를 둘러싼 공간
나쁜 예: 숲 배경 → 좋은 예: 안개 낀 새벽 침엽수림, 이끼 덮인 바위, 축축한 낙엽
나쁜 예: 도시 → 좋은 예: 비 오는 밤 도쿄 골목, 네온사인 반사, 젖은 아스팔트
3. 조명 — 방향, 질감, 온도
나쁜 예: 밝은 사진 → 좋은 예: 오후 3시 측면 자연광, 부드러운 그림자, 따뜻한 노란빛
나쁜 예: 드라마틱한 조명 → 좋은 예: 단일 스포트라이트, 아래에서 위로, 차가운 파란빛, 강한 명암 대비
4. 카메라와 구도 — 앵글, 렌즈, 비율
나쁜 예: 클로즈업 → 좋은 예: 85mm 렌즈, 얕은 심도(f/1.8), 눈 초점, 배경 보케
나쁜 예: 전신샷 → 좋은 예: 광각 20mm, 하이앵글, 전신, 3분의 1 법칙 구도
5. 품질과 스타일 — 렌더링 방향 선언
사실적 사진:
photorealistic, 8K, shot on Sony A7R V, RAW일러스트:
digital illustration, soft watercolor, studio ghibli style상업 광고:
luxury campaign, ultra-photoreal, commercial photography
자주 묻는 질문
Q: AI 이미지 프롬프트를 잘 쓰려면 어떻게 시작해야 하나요?
피사체와 행동부터 구체적으로 적는 것이 출발점입니다. "고양이" 대신 "검은 고양이가 담장 위에 앉아 먼 곳을 바라보는 모습"처럼 행동과 상태를 추가하면 결과물의 정밀도가 즉시 올라갑니다. 조명과 카메라 앵글은 그 다음 단계로 추가하면 됩니다.
Q: 한국어 프롬프트와 영어 프롬프트, 어떤 게 더 잘 되나요?
Flux, Imagen 4 등 최신 모델은 한국어 프롬프트도 잘 처리합니다. 다만 모델이 영어 데이터로 훈련되었기 때문에, 스타일 지시어(photorealistic, bokeh, studio lighting 등)는 영어로 쓸 때 더 안정적인 결과가 나오는 경우가 많습니다. 한국어로 전체 맥락을 기술하고 기술적 수식어는 영어로 추가하는 방식을 권장합니다.
Q: 프롬프트를 길게 쓸수록 좋은 결과가 나오나요?
반드시 그렇지는 않습니다. 중요한 것은 길이가 아니라 구체성입니다. 5가지 축(피사체, 환경, 조명, 구도, 스타일)을 각각 정확하게 기술한 30단어가 모호한 단어를 100개 나열하는 것보다 나은 결과를 만듭니다. 너무 많은 요소를 동시에 지정하면 AI가 균형을 잡느라 어느 하나도 제대로 구현하지 못하는 경우도 생깁니다.
Q: 같은 프롬프트를 써도 결과가 매번 다른 이유는 무엇인가요?
AI 이미지 생성은 확률 기반 프로세스이기 때문입니다. 동일한 프롬프트라도 매 생성마다 다른 시드(seed) 값을 사용하면 다른 결과가 나옵니다. 특정 결과를 재현하려면 시드 값을 고정하거나, 구조화 프롬프트로 지정 요소를 늘려 확률적 변동 폭을 줄이는 방법을 사용할 수 있습니다.
Q: XBRUSH에서 프롬프트를 어떻게 입력하나요?
XBRUSH 이미지 생성 화면의 텍스트 입력창에 프롬프트를 입력합니다. 참조 이미지를 함께 활용하려면 이미지 업로드 후 프롬프트를 추가하면 됩니다.