xbrush logo | Blog
Docs Pricing
English 한국어
Go to App
Docs Pricing Go to App
사용 가이드

xbrush AI 모델 비교 가이드 2026 — 이미지·동영상·오디오 요금과 특성 정리

Byoul Oh's avatar
Byoul Oh
Jun 17, 2026
xbrush AI 모델 비교 가이드 2026 — 이미지·동영상·오디오 요금과 특성 정리
Contents
이미지 생성 모델 비교무료 모델경제형 모델 (💠10~50 / 4장)균형형 모델 (💠47~100 / 4장)프리미엄 모델 (💠148 이상 / 4장)한국어 프롬프트 완전 이해 모델이미지 편집 모델 비교동영상 생성 모델 비교 (i2v)무료 모델경제형 모델 (💠106~164 / 기본 clip)균형형 모델 (💠176~295 / 기본 clip)프리미엄 모델 (💠312 이상 / 기본 clip)오디오 모델 비교음악 생성 (music)립싱크 (lipsync) — 30초 기준사운드이펙트 (soundeffect-text)용도별 추천 조합자주 묻는 질문무료 모델과 유료 모델의 품질 차이가 얼마나 되나요?GPT Image 2의 품질 설정은 어떻게 고르나요?동영상에 오디오를 포함하면 추가 요금이 얼마나 되나요?한국어 프롬프트를 쓸 때 어떤 모델이 유리한가요?크레딧이 부족할 때 가장 효율적인 선택은 무엇인가요?

xbrush.ai에는 현재 이미지·동영상·오디오 분야를 합쳐 수십 개의 AI 생성 모델이 있다. 무료로 쓸 수 있는 것부터 고품질 결과물을 위해 크레딧을 꽤 쓰는 것까지, 스펙트럼이 넓다.

"어떤 모델을 골라야 하지?"라는 질문을 받을 때마다 정리가 필요하다고 느꼈다. 이 글은 그 질문에 답하는 실용 가이드다. 가격, 계산 방식, 스타일 특성, 추천 용도까지 한곳에 모았다.

요금 기준: creditConfig v24 (2026-06-16) / 단위: 💠(크레딧) / active 모델만 수록


이미지 생성 모델 비교

기준: 4장, 1024×1024 생성 시 UI 표시 크레딧

무료 모델

무료 이미지 생성 모델 결과 비교

모델

특성

제한

Z-Image Free

빠른 생성, 가볍고 실용적인 스타일

일 10회

Hunyuan 3.0 Free

텐센트 Hunyuan 기반, 동양적 미감에 강함

일 10회

무료 모델이라도 특정 스타일에서는 유료 모델과 견줄 만한 결과가 나온다. 일 10회 제한이 있지만 가볍게 테스트하거나 반복 작업이 많지 않은 경우라면 충분하다.

경제형 모델 (💠10~50 / 4장)

예산 이미지 생성 모델 결과 비교

모델

💠(4장)

계산 방식

추천 용도

SDXL 1.0

10

perMegapixel

빠른 프로토타입, 범용

Z-Image Turbo

12

perMegapixel

가성비 일러스트, 캐릭터

Qwen Image

16

perImage

동양 스타일, 영문 프롬프트 권장

FLUX.1 DS

20

perMegapixel

세밀한 텍스처, 사진 스타일

Qwen Image RE

26

perMegapixel

Qwen 개선판, 사실성 강화

FLUX.1 D

42

perMegapixel

고품질 사진 리얼리즘

FLUX 계열은 전반적으로 사실적인 스타일에 강하다. Dev(D) 버전이 Schnell(DS) 버전보다 품질이 높지만 크레딧도 두 배 이상이다. Qwen 계열은 동양어 프롬프트에서 상대적으로 자연스러운 편이지만, 완벽한 한국어 이해를 지원하지는 않는다.

균형형 모델 (💠47~100 / 4장)

균형형 이미지 생성 모델 결과 비교

모델

💠(4장)

계산 방식

추천 용도

Seedream 4.0

47

byResolution (2K)

일러스트, 웹툰 느낌

Wan 2.7

47

perImage

다목적, 균형감

Gemini 2.5 Flash

48

perImage

텍스트 렌더링, 다국어

Flux 2 Pro

50

perMegapixel

FLUX 최고급, 상업 퀄리티

Nano Banana ★

62

perImage

자연스러운 인물, 따뜻한 색감, 한국어 완전 이해

Seedream 4.5

63

byResolution (2K)

Seedream 개선판

GPT Image 2 ★ ⚠️

83 (medium 기준)

byResolutionAndQuality

지시 따르기 정확, 텍스트 강함, 한국어 완전 이해

★ 한국어 완전 이해 모델 | ⚠️ GPT Image 2 품질별 단가 (4장, 1K 기준): low 💠10 / medium 💠83 / high 💠330 / 2K high 💠659 — 품질 설정에 따라 가격 차이가 크니 반드시 확인 후 사용.

프리미엄 모델 (💠148 이상 / 4장)

프리미엄 이미지 생성 모델 결과 비교

모델

💠(4장)

계산 방식

추천 용도

Hunyuan 3.0 Instruct

148

perMegapixel

지시 정확도 높음, 상업 광고

Nano Banana 2 ★

188

byResolution (2K)

고해상도 인물·제품 사진, 한국어 완전 이해

Nano Banana Pro ★

234

byResolution (2K)

최고급 퀄리티, 광고 비주얼, 한국어 완전 이해

GPT Image 2 (high) ★

330

byResolutionAndQuality

정밀한 지시 이행, 텍스트 포함 이미지, 한국어 완전 이해

★ 한국어 완전 이해 모델

한국어 프롬프트 완전 이해 모델

xbrush에 있는 대부분의 이미지 생성 모델은 한국어를 완벽하게 이해하지 못한다. 한국어를 입력해도 내부적으로 영문으로 변환하거나, 언어 뉘앙스가 정확히 반영되지 않는 경우가 많다.

한국어를 완전히 이해하는 모델:

모델

분류

비고

GPT Image 2

이미지 생성·편집

텍스트 렌더링과 한국어 지시 이행 모두 강함

Nano Banana

이미지 생성·편집

Google 기반, 자연스러운 인물·색감

Nano Banana 2

이미지 생성·편집

고해상도 인물 사진에 적합

Nano Banana Pro

이미지 생성·편집

최고급 퀄리티, 광고 비주얼

Seedance 2.0 Fast

동영상 생성

720p, 한국어 장면 묘사 반영

Seedance 2.0

동영상 생성

720p 고품질, 한국어 스토리 프롬프트

나머지 모델(FLUX, SDXL, Seedream, Wan, Hunyuan, Qwen 등)은 한국어를 완벽하게 이해하지 못한다. 한국어 프롬프트를 쓸 경우 원하는 결과가 나오지 않을 수 있으며, 영문 프롬프트가 더 안정적인 결과를 낼 수 있다.

아래는 동일한 한국어 프롬프트를 Qwen과 FLUX 2 Pro에 입력했을 때의 결과 비교다.

동일 한국어 프롬프트 — Qwen Image vs FLUX 2 Pro 결과 비교

두 모델 모두 한국어를 완전히 이해하지는 못하며, 영문 프롬프트와 결과 차이가 있다.


이미지 편집 모델 비교

편집 탭 기준: 4장, 1024×1024 / 생성 모델과 동일한 요금 로직

모델

💠(4장)

주요 특성

Hunyuan 3.0 Free Edit

FREE

무료 인페인팅, 일 10회

Qwen Image Edit RE

30

부분 수정, 가성비

Seedream 4.0 Edit

47

일러스트 스타일 편집

Flux 2 Pro Edit

50

사진 스타일 고품질 편집

Gemini 2.5 Flash Edit

48

텍스트 포함 이미지 편집

Nano Banana Edit ★

62

인물 편집, 자연스러운 보정, 한국어 완전 이해

Seedream 4.5 Edit

63

Seedream 개선판 편집

GPT Image 2 Edit ★ ⚠️

83 (medium)

정밀 지시 편집, 텍스트 강함, 한국어 완전 이해

Hunyuan 3.0 Instruct Edit

148

복잡한 편집 지시 처리

Nano Banana 2 Edit ★

188

고해상도 부분 수정, 한국어 완전 이해

Nano Banana Pro Edit ★

234

최고급 편집 품질, 한국어 완전 이해

★ 한국어 완전 이해 모델 | ⚠️ GPT Image 2 Edit: medium 💠83 / high 💠330 (품질 설정 주의)


동영상 생성 모델 비교 (i2v)

기준: 기본 duration·해상도 / noAudio 기준 리스트 표시 크레딧

동영상 생성 모델 — 무료부터 프리미엄까지 프레임 캡처 비교

무료 모델

모델

기본 시간

특성

LTX 2.3 Free

5초

빠른 생성, 실험·테스트용

경제형 모델 (💠106~164 / 기본 clip)

모델

💠

dur

해상도

초당 단가

특성

Hailuo 02 Standard

106

6초

768p

17.6/s

자연스러운 모션

Kling v2.1 Standard

110

5초

—

21.9/s

안정적 범용

Kling v2.5 Turbo Pro

137

5초

—

27.3/s

Kling 가성비

LTX 2.3

141

6초

1080p

23.4/s

HD, 안정적

Wan 2.5 Preview

150

5초

—

30/s

다목적

Wan v2.2 14B

153

5초

720p

30.6/s

대형 모델, 균형

Kling v3 Standard

164

5초

—

32.8/s

Kling v3 기본

균형형 모델 (💠176~295 / 기본 clip)

모델

💠

dur

해상도

초당 단가

특성

Kling v2.1 Pro

176

5초

—

35.1/s

인물 동작 자연스러움

Kling v1.6

186

5초

—

37.1/s

검증된 Kling 구버전

Hailuo 02 Pro

188

6초

1080p

31.2/s

HD 프로급

Kling v3 Pro

219

5초

—

43.7/s

Kling 최신 프로

Seedance 2.0 Fast ★

236

5초

720p

47.2/s

빠른 고품질, 한국어 완전 이해

Wan 2.7 Video

293

5초

1080p

58.5/s

HD 균형형

Wan v2.5 Preview

293

5초

1080p

58.5/s

개선판 Wan

Seedance 2.0 ★

295

5초

720p

58.9/s

고품질 표준, 한국어 완전 이해

★ 한국어 완전 이해 모델

프리미엄 모델 (💠312 이상 / 기본 clip)

모델

💠

dur

오디오 포함 💠

특성

Veo3 Fast

312

8초

624

Google Veo3, 빠른 버전

Veo3.1 Fast

312

8초

624

Veo3 개선판 빠른 버전

Kling v2.1 Master

546

5초

—

최고급 품질, 영화적

Veo3

624

8초

1,248

Google 최고급, 8초

Veo3.1

624

8초

1,248

Veo3 최신 개선판

Kling v3 Pro에 오디오 포함 시 💠328(5초) / Veo3 시리즈는 오디오 포함 여부에 따라 단가가 2배 차이


오디오 모델 비교

음악 생성 (music)

모델

💠 / 트랙

특성

Default

10

기본 배경음악

Lyria 3

15.6

Google Lyria, 자연스러운 음악성

Lyria 3 Pro

31.2

Lyria 고품질, 다양한 장르

Lyria 2

39

이전 세대 Lyria, 특정 스타일에 강함

립싱크 (lipsync) — 30초 기준

모델

💠 (30초)

특성

Default

300~

기본 립싱크

PixVerse Lipsync

468~

자연스러운 입 움직임

Infinite Talk (480p)

2,925~

실사 수준 립싱크

Infinite Talk (720p)

5,850~

HD 실사 립싱크

사운드이펙트 (soundeffect-text)

모델

💠

계산 방식

특성

ElevenLabs SFX

0.78/s

perSecond

텍스트 설명 → 효과음

Default

2/s

perSecond

기본 효과음

Stable Audio SFX

78/트랙

고정

고품질 효과음 1트랙

TTS는 글자 수 기준 과금, 리스트 고정 표시 없음


용도별 추천 조합

작업 목적

추천 모델

💠 기준

선택 이유

빠른 아이디어 스케치

Z-Image Free

FREE

크레딧 소모 없이 방향 확인

SNS 일러스트

Seedream 4.5

63/4장

일러스트·애니 감성, 가성비

인물·인플루언서 사진

Nano Banana 2

188/4장

자연스러운 피부·표정

제품 사진

Flux 2 Pro

50/4장

선명도·색상 충실도

광고 비주얼

Nano Banana Pro

234/4장

상업 품질, 디테일 완성도

텍스트 포함 이미지

GPT Image 2 (high)

330/4장

텍스트 렌더링 업계 최강

한국어 프롬프트

GPT Image 2 / Nano Banana

83~ / 62~/4장

한국어 완전 이해 모델

동영상 테스트

LTX 2.3 Free

FREE

무료로 영상 방향 확인

짧은 SNS 영상

Kling v2.1 Standard

110/5초

안정적, 가성비

인물 동작 영상

Kling v3 Pro

219/5초

자연스러운 인체 동작

한국어 프롬프트 영상

Seedance 2.0

295/5초

한국어 완전 이해 동영상 모델

고품질 광고 영상

Seedance 2.0

295/5초

720p 고품질, 세밀한 모션

오디오 포함 영상

Veo3.1 Fast

624/8초

오디오 네이티브 생성

배경음악

Lyria 3

15.6/트랙

자연스럽고 저렴


자주 묻는 질문

무료 모델과 유료 모델의 품질 차이가 얼마나 되나요?

작업 목적에 따라 다릅니다. Z-Image Free와 Hunyuan 3.0 Free는 일반적인 SNS 콘텐츠 수준에서 충분한 품질을 냅니다. 다만 고해상도 인물 사진이나 텍스트가 포함된 광고 이미지처럼 정밀도가 필요한 작업에서는 유료 모델과 차이가 납니다. 먼저 무료 모델로 방향을 잡고, 만족스럽지 않을 때 유료로 넘어가는 방식이 효율적입니다.

GPT Image 2의 품질 설정은 어떻게 고르나요?

low(💠10)는 개략적인 확인용, medium(💠83)은 일반 콘텐츠 제작, high(💠330)는 텍스트 렌더링이 중요하거나 광고·출판물 수준이 필요할 때 사용합니다. high와 medium의 가격 차이가 4배이므로, 텍스트가 없는 이미지라면 medium으로도 대부분 충분합니다.

GPT Image 2 low vs medium 품질 비교

동영상에 오디오를 포함하면 추가 요금이 얼마나 되나요?

모델마다 다릅니다. Veo3 시리즈는 오디오 포함 시 noAudio 대비 2배(8초 기준 💠624 → 💠1,248)가 됩니다. Kling v3 Pro는 5초 기준 noAudio 💠219에서 audio 💠328로 약 50% 증가합니다. 브이로그·광고처럼 음향이 중요한 결과물이 아니라면 noAudio로 생성 후 별도로 음악을 입히는 방식이 비용 측면에서 유리합니다.

한국어 프롬프트를 쓸 때 어떤 모델이 유리한가요?

한국어를 완전히 이해하는 모델은 GPT Image 2, Nano Banana 시리즈(Nano Banana / Nano Banana 2 / Nano Banana Pro), Seedance 시리즈(Seedance 2.0 / Seedance 2.0 Fast)에 한정됩니다. 이 모델들은 한국어 프롬프트의 뉘앙스를 그대로 반영할 수 있습니다. 나머지 모델(FLUX, Seedream, Qwen, Hunyuan, Wan, SDXL 등)은 한국어를 완벽하게 이해하지 못하며, 내부적으로 영문으로 변환하거나 언어 뉘앙스가 손실될 수 있어 영문 프롬프트가 더 안정적인 결과를 냅니다.

크레딧이 부족할 때 가장 효율적인 선택은 무엇인가요?

이미지는 Z-Image Free 또는 Hunyuan 3.0 Free(무료), 동영상은 LTX 2.3 Free(무료)로 시작하세요. 조금 더 투자할 수 있다면 이미지는 SDXL 1.0(💠10/4장), 동영상은 Kling v2.1 Standard(💠110/5초)가 안정적인 가성비를 냅니다.

Share article
Contents
이미지 생성 모델 비교무료 모델경제형 모델 (💠10~50 / 4장)균형형 모델 (💠47~100 / 4장)프리미엄 모델 (💠148 이상 / 4장)한국어 프롬프트 완전 이해 모델이미지 편집 모델 비교동영상 생성 모델 비교 (i2v)무료 모델경제형 모델 (💠106~164 / 기본 clip)균형형 모델 (💠176~295 / 기본 clip)프리미엄 모델 (💠312 이상 / 기본 clip)오디오 모델 비교음악 생성 (music)립싱크 (lipsync) — 30초 기준사운드이펙트 (soundeffect-text)용도별 추천 조합자주 묻는 질문무료 모델과 유료 모델의 품질 차이가 얼마나 되나요?GPT Image 2의 품질 설정은 어떻게 고르나요?동영상에 오디오를 포함하면 추가 요금이 얼마나 되나요?한국어 프롬프트를 쓸 때 어떤 모델이 유리한가요?크레딧이 부족할 때 가장 효율적인 선택은 무엇인가요?
xbrush logo
라이트웨이트(주)
대표 연윤호 | 사업자등록번호 208-87-02239
통신판매업신고 제2026-서울서초-1518호
서울시 서초구 매헌로 8길 47, 서울 AI 허브 희경빌딩 B동 306호
contact@lightweight.kr
리소스
블로그 사용자 가이드
약관 및 정책
이용약관 개인정보처리방침 쿠키 정책
고객센터
평일 10:00 - 18:00 (KST)
0507-1336-9329
contact@lightweight.kr
Copyright ⓒ 2026 Lightweight Inc. All Rights Reserved.