xbrush.ai에는 현재 이미지·동영상·오디오 분야를 합쳐 수십 개의 AI 생성 모델이 있다. 무료로 쓸 수 있는 것부터 고품질 결과물을 위해 크레딧을 꽤 쓰는 것까지, 스펙트럼이 넓다.
"어떤 모델을 골라야 하지?"라는 질문을 받을 때마다 정리가 필요하다고 느꼈다. 이 글은 그 질문에 답하는 실용 가이드다. 가격, 계산 방식, 스타일 특성, 추천 용도까지 한곳에 모았다.
요금 기준: creditConfig v24 (2026-06-16) / 단위: 💠(크레딧) / active 모델만 수록
이미지 생성 모델 비교
기준: 4장, 1024×1024 생성 시 UI 표시 크레딧
무료 모델
모델 | 특성 | 제한 |
|---|---|---|
Z-Image Free | 빠른 생성, 가볍고 실용적인 스타일 | 일 10회 |
Hunyuan 3.0 Free | 텐센트 Hunyuan 기반, 동양적 미감에 강함 | 일 10회 |
무료 모델이라도 특정 스타일에서는 유료 모델과 견줄 만한 결과가 나온다. 일 10회 제한이 있지만 가볍게 테스트하거나 반복 작업이 많지 않은 경우라면 충분하다.
경제형 모델 (💠10~50 / 4장)
모델 | 💠(4장) | 계산 방식 | 추천 용도 |
|---|---|---|---|
SDXL 1.0 | 10 | perMegapixel | 빠른 프로토타입, 범용 |
Z-Image Turbo | 12 | perMegapixel | 가성비 일러스트, 캐릭터 |
Qwen Image | 16 | perImage | 동양 스타일, 영문 프롬프트 권장 |
FLUX.1 DS | 20 | perMegapixel | 세밀한 텍스처, 사진 스타일 |
Qwen Image RE | 26 | perMegapixel | Qwen 개선판, 사실성 강화 |
FLUX.1 D | 42 | perMegapixel | 고품질 사진 리얼리즘 |
FLUX 계열은 전반적으로 사실적인 스타일에 강하다. Dev(D) 버전이 Schnell(DS) 버전보다 품질이 높지만 크레딧도 두 배 이상이다. Qwen 계열은 동양어 프롬프트에서 상대적으로 자연스러운 편이지만, 완벽한 한국어 이해를 지원하지는 않는다.
균형형 모델 (💠47~100 / 4장)
모델 | 💠(4장) | 계산 방식 | 추천 용도 |
|---|---|---|---|
Seedream 4.0 | 47 | byResolution (2K) | 일러스트, 웹툰 느낌 |
Wan 2.7 | 47 | perImage | 다목적, 균형감 |
Gemini 2.5 Flash | 48 | perImage | 텍스트 렌더링, 다국어 |
Flux 2 Pro | 50 | perMegapixel | FLUX 최고급, 상업 퀄리티 |
Nano Banana ★ | 62 | perImage | 자연스러운 인물, 따뜻한 색감, 한국어 완전 이해 |
Seedream 4.5 | 63 | byResolution (2K) | Seedream 개선판 |
GPT Image 2 ★ ⚠️ | 83 (medium 기준) | byResolutionAndQuality | 지시 따르기 정확, 텍스트 강함, 한국어 완전 이해 |
★ 한국어 완전 이해 모델 | ⚠️ GPT Image 2 품질별 단가 (4장, 1K 기준): low 💠10 / medium 💠83 / high 💠330 / 2K high 💠659 — 품질 설정에 따라 가격 차이가 크니 반드시 확인 후 사용.
프리미엄 모델 (💠148 이상 / 4장)
모델 | 💠(4장) | 계산 방식 | 추천 용도 |
|---|---|---|---|
Hunyuan 3.0 Instruct | 148 | perMegapixel | 지시 정확도 높음, 상업 광고 |
Nano Banana 2 ★ | 188 | byResolution (2K) | 고해상도 인물·제품 사진, 한국어 완전 이해 |
Nano Banana Pro ★ | 234 | byResolution (2K) | 최고급 퀄리티, 광고 비주얼, 한국어 완전 이해 |
GPT Image 2 (high) ★ | 330 | byResolutionAndQuality | 정밀한 지시 이행, 텍스트 포함 이미지, 한국어 완전 이해 |
★ 한국어 완전 이해 모델
한국어 프롬프트 완전 이해 모델
xbrush에 있는 대부분의 이미지 생성 모델은 한국어를 완벽하게 이해하지 못한다. 한국어를 입력해도 내부적으로 영문으로 변환하거나, 언어 뉘앙스가 정확히 반영되지 않는 경우가 많다.
한국어를 완전히 이해하는 모델:
모델 | 분류 | 비고 |
|---|---|---|
GPT Image 2 | 이미지 생성·편집 | 텍스트 렌더링과 한국어 지시 이행 모두 강함 |
Nano Banana | 이미지 생성·편집 | Google 기반, 자연스러운 인물·색감 |
Nano Banana 2 | 이미지 생성·편집 | 고해상도 인물 사진에 적합 |
Nano Banana Pro | 이미지 생성·편집 | 최고급 퀄리티, 광고 비주얼 |
Seedance 2.0 Fast | 동영상 생성 | 720p, 한국어 장면 묘사 반영 |
Seedance 2.0 | 동영상 생성 | 720p 고품질, 한국어 스토리 프롬프트 |
나머지 모델(FLUX, SDXL, Seedream, Wan, Hunyuan, Qwen 등)은 한국어를 완벽하게 이해하지 못한다. 한국어 프롬프트를 쓸 경우 원하는 결과가 나오지 않을 수 있으며, 영문 프롬프트가 더 안정적인 결과를 낼 수 있다.
아래는 동일한 한국어 프롬프트를 Qwen과 FLUX 2 Pro에 입력했을 때의 결과 비교다.
두 모델 모두 한국어를 완전히 이해하지는 못하며, 영문 프롬프트와 결과 차이가 있다.
이미지 편집 모델 비교
편집 탭 기준: 4장, 1024×1024 / 생성 모델과 동일한 요금 로직
모델 | 💠(4장) | 주요 특성 |
|---|---|---|
Hunyuan 3.0 Free Edit | FREE | 무료 인페인팅, 일 10회 |
Qwen Image Edit RE | 30 | 부분 수정, 가성비 |
Seedream 4.0 Edit | 47 | 일러스트 스타일 편집 |
Flux 2 Pro Edit | 50 | 사진 스타일 고품질 편집 |
Gemini 2.5 Flash Edit | 48 | 텍스트 포함 이미지 편집 |
Nano Banana Edit ★ | 62 | 인물 편집, 자연스러운 보정, 한국어 완전 이해 |
Seedream 4.5 Edit | 63 | Seedream 개선판 편집 |
GPT Image 2 Edit ★ ⚠️ | 83 (medium) | 정밀 지시 편집, 텍스트 강함, 한국어 완전 이해 |
Hunyuan 3.0 Instruct Edit | 148 | 복잡한 편집 지시 처리 |
Nano Banana 2 Edit ★ | 188 | 고해상도 부분 수정, 한국어 완전 이해 |
Nano Banana Pro Edit ★ | 234 | 최고급 편집 품질, 한국어 완전 이해 |
★ 한국어 완전 이해 모델 | ⚠️ GPT Image 2 Edit: medium 💠83 / high 💠330 (품질 설정 주의)
동영상 생성 모델 비교 (i2v)
기준: 기본 duration·해상도 / noAudio 기준 리스트 표시 크레딧
무료 모델
모델 | 기본 시간 | 특성 |
|---|---|---|
LTX 2.3 Free | 5초 | 빠른 생성, 실험·테스트용 |
경제형 모델 (💠106~164 / 기본 clip)
모델 | 💠 | dur | 해상도 | 초당 단가 | 특성 |
|---|---|---|---|---|---|
Hailuo 02 Standard | 106 | 6초 | 768p | 17.6/s | 자연스러운 모션 |
Kling v2.1 Standard | 110 | 5초 | — | 21.9/s | 안정적 범용 |
Kling v2.5 Turbo Pro | 137 | 5초 | — | 27.3/s | Kling 가성비 |
LTX 2.3 | 141 | 6초 | 1080p | 23.4/s | HD, 안정적 |
Wan 2.5 Preview | 150 | 5초 | — | 30/s | 다목적 |
Wan v2.2 14B | 153 | 5초 | 720p | 30.6/s | 대형 모델, 균형 |
Kling v3 Standard | 164 | 5초 | — | 32.8/s | Kling v3 기본 |
균형형 모델 (💠176~295 / 기본 clip)
모델 | 💠 | dur | 해상도 | 초당 단가 | 특성 |
|---|---|---|---|---|---|
Kling v2.1 Pro | 176 | 5초 | — | 35.1/s | 인물 동작 자연스러움 |
Kling v1.6 | 186 | 5초 | — | 37.1/s | 검증된 Kling 구버전 |
Hailuo 02 Pro | 188 | 6초 | 1080p | 31.2/s | HD 프로급 |
Kling v3 Pro | 219 | 5초 | — | 43.7/s | Kling 최신 프로 |
Seedance 2.0 Fast ★ | 236 | 5초 | 720p | 47.2/s | 빠른 고품질, 한국어 완전 이해 |
Wan 2.7 Video | 293 | 5초 | 1080p | 58.5/s | HD 균형형 |
Wan v2.5 Preview | 293 | 5초 | 1080p | 58.5/s | 개선판 Wan |
Seedance 2.0 ★ | 295 | 5초 | 720p | 58.9/s | 고품질 표준, 한국어 완전 이해 |
★ 한국어 완전 이해 모델
프리미엄 모델 (💠312 이상 / 기본 clip)
모델 | 💠 | dur | 오디오 포함 💠 | 특성 |
|---|---|---|---|---|
Veo3 Fast | 312 | 8초 | 624 | Google Veo3, 빠른 버전 |
Veo3.1 Fast | 312 | 8초 | 624 | Veo3 개선판 빠른 버전 |
Kling v2.1 Master | 546 | 5초 | — | 최고급 품질, 영화적 |
Veo3 | 624 | 8초 | 1,248 | Google 최고급, 8초 |
Veo3.1 | 624 | 8초 | 1,248 | Veo3 최신 개선판 |
Kling v3 Pro에 오디오 포함 시 💠328(5초) / Veo3 시리즈는 오디오 포함 여부에 따라 단가가 2배 차이
오디오 모델 비교
음악 생성 (music)
모델 | 💠 / 트랙 | 특성 |
|---|---|---|
Default | 10 | 기본 배경음악 |
Lyria 3 | 15.6 | Google Lyria, 자연스러운 음악성 |
Lyria 3 Pro | 31.2 | Lyria 고품질, 다양한 장르 |
Lyria 2 | 39 | 이전 세대 Lyria, 특정 스타일에 강함 |
립싱크 (lipsync) — 30초 기준
모델 | 💠 (30초) | 특성 |
|---|---|---|
Default | 300~ | 기본 립싱크 |
PixVerse Lipsync | 468~ | 자연스러운 입 움직임 |
Infinite Talk (480p) | 2,925~ | 실사 수준 립싱크 |
Infinite Talk (720p) | 5,850~ | HD 실사 립싱크 |
사운드이펙트 (soundeffect-text)
모델 | 💠 | 계산 방식 | 특성 |
|---|---|---|---|
ElevenLabs SFX | 0.78/s | perSecond | 텍스트 설명 → 효과음 |
Default | 2/s | perSecond | 기본 효과음 |
Stable Audio SFX | 78/트랙 | 고정 | 고품질 효과음 1트랙 |
TTS는 글자 수 기준 과금, 리스트 고정 표시 없음
용도별 추천 조합
작업 목적 | 추천 모델 | 💠 기준 | 선택 이유 |
|---|---|---|---|
빠른 아이디어 스케치 | Z-Image Free | FREE | 크레딧 소모 없이 방향 확인 |
SNS 일러스트 | Seedream 4.5 | 63/4장 | 일러스트·애니 감성, 가성비 |
인물·인플루언서 사진 | Nano Banana 2 | 188/4장 | 자연스러운 피부·표정 |
제품 사진 | Flux 2 Pro | 50/4장 | 선명도·색상 충실도 |
광고 비주얼 | Nano Banana Pro | 234/4장 | 상업 품질, 디테일 완성도 |
텍스트 포함 이미지 | GPT Image 2 (high) | 330/4장 | 텍스트 렌더링 업계 최강 |
한국어 프롬프트 | GPT Image 2 / Nano Banana | 83~ / 62~/4장 | 한국어 완전 이해 모델 |
동영상 테스트 | LTX 2.3 Free | FREE | 무료로 영상 방향 확인 |
짧은 SNS 영상 | Kling v2.1 Standard | 110/5초 | 안정적, 가성비 |
인물 동작 영상 | Kling v3 Pro | 219/5초 | 자연스러운 인체 동작 |
한국어 프롬프트 영상 | Seedance 2.0 | 295/5초 | 한국어 완전 이해 동영상 모델 |
고품질 광고 영상 | Seedance 2.0 | 295/5초 | 720p 고품질, 세밀한 모션 |
오디오 포함 영상 | Veo3.1 Fast | 624/8초 | 오디오 네이티브 생성 |
배경음악 | Lyria 3 | 15.6/트랙 | 자연스럽고 저렴 |
자주 묻는 질문
무료 모델과 유료 모델의 품질 차이가 얼마나 되나요?
작업 목적에 따라 다릅니다. Z-Image Free와 Hunyuan 3.0 Free는 일반적인 SNS 콘텐츠 수준에서 충분한 품질을 냅니다. 다만 고해상도 인물 사진이나 텍스트가 포함된 광고 이미지처럼 정밀도가 필요한 작업에서는 유료 모델과 차이가 납니다. 먼저 무료 모델로 방향을 잡고, 만족스럽지 않을 때 유료로 넘어가는 방식이 효율적입니다.
GPT Image 2의 품질 설정은 어떻게 고르나요?
low(💠10)는 개략적인 확인용, medium(💠83)은 일반 콘텐츠 제작, high(💠330)는 텍스트 렌더링이 중요하거나 광고·출판물 수준이 필요할 때 사용합니다. high와 medium의 가격 차이가 4배이므로, 텍스트가 없는 이미지라면 medium으로도 대부분 충분합니다.
동영상에 오디오를 포함하면 추가 요금이 얼마나 되나요?
모델마다 다릅니다. Veo3 시리즈는 오디오 포함 시 noAudio 대비 2배(8초 기준 💠624 → 💠1,248)가 됩니다. Kling v3 Pro는 5초 기준 noAudio 💠219에서 audio 💠328로 약 50% 증가합니다. 브이로그·광고처럼 음향이 중요한 결과물이 아니라면 noAudio로 생성 후 별도로 음악을 입히는 방식이 비용 측면에서 유리합니다.
한국어 프롬프트를 쓸 때 어떤 모델이 유리한가요?
한국어를 완전히 이해하는 모델은 GPT Image 2, Nano Banana 시리즈(Nano Banana / Nano Banana 2 / Nano Banana Pro), Seedance 시리즈(Seedance 2.0 / Seedance 2.0 Fast)에 한정됩니다. 이 모델들은 한국어 프롬프트의 뉘앙스를 그대로 반영할 수 있습니다. 나머지 모델(FLUX, Seedream, Qwen, Hunyuan, Wan, SDXL 등)은 한국어를 완벽하게 이해하지 못하며, 내부적으로 영문으로 변환하거나 언어 뉘앙스가 손실될 수 있어 영문 프롬프트가 더 안정적인 결과를 냅니다.
크레딧이 부족할 때 가장 효율적인 선택은 무엇인가요?
이미지는 Z-Image Free 또는 Hunyuan 3.0 Free(무료), 동영상은 LTX 2.3 Free(무료)로 시작하세요. 조금 더 투자할 수 있다면 이미지는 SDXL 1.0(💠10/4장), 동영상은 Kling v2.1 Standard(💠110/5초)가 안정적인 가성비를 냅니다.