툭투유 (Talk2U)
한줄 요약: 툭투유는 AI 모델에게 내 제품을 들게 하고 직접 대사를 말하게 하는 광고 영상 제작 기능입니다. 몇 분 만에 완성된 숏폼 광고를 얻을 수 있습니다.
툭투유란?
툭투유는 XSpark의 핵심 광고 제작 기능입니다. AI 모델을 선택하고, 제품 이미지를 업로드하고, 대사를 작성하면 모델이 제품을 들고 대사를 말하는 영상이 자동으로 생성됩니다. 소셜 미디어나 마케팅 캠페인에 바로 활용할 수 있는 숏폼 광고를 손쉽게 제작할 수 있습니다.
1단계 — 모델 선택 및 시작 이미지 설정

툭투유 작업 화면 — 생성한 동영상(상단)과 시작 이미지(하단).
- 왼쪽 사이드바에서 툭투유를 클릭합니다.
- 작업 화면에는 다음이 표시됩니다:
- 생성한 동영상 — 이 모델로 이전에 생성한 툭투유 영상 목록
- 시작 이미지 — 선택한 모델의 사진 목록
- 상단 모델명을 클릭하여 다른 모델로 전환할 수 있습니다.
- 모델의 사진 중 하나를 시작 이미지로 선택하거나, Create New Image를 클릭하여 새 이미지를 생성합니다.
생성 후 사용할 수 있는 편집 모드:
- AI 시프트 모드 — AI가 자동으로 장면을 조정
- 타임라인 편집 — 수동으로 타임라인 편집
2단계 — 제품 합성

제품 이미지를 업로드하고 합성 방법을 설명합니다.
- 오른쪽 패널에서 제품 합성하기를 클릭합니다.
- 제품 합성 모달이 열립니다:
- 제품 이미지 업로드 — 드래그 앤 드롭하거나 클릭하여 제품 사진 업로드
- 배경제거 — 제품 이미지의 배경을 자동으로 제거
- 이미지 개수 — 생성할 합성 이미지 수 선택 (1 – 4개)
- 어떻게 합성할까요? — 합성 방법을 텍스트로 설명 (예: "두 이미지를 합성 후 어울리게 모델 포즈 취해줘")
- 합성하기를 클릭하면 합성 이미지가 생성됩니다.
합성된 이미지는 시작 이미지 슬롯에 배치되어 영상 생성의 기반이 됩니다.
3단계 — 동영상 생성

대사를 입력하고 음성을 설정합니다.
- 오른쪽 패널에서 동영상 생성을 클릭합니다.
- 영상 생성 모달이 열립니다:
- 대사 — 모델이 말할 대사 입력
- 감정 표현 — 토글 활성화 시 감정 표현이 강조된 발화로 생성
- 음성 설정 — 펼쳐서 음성 톤 선택
- 음성 목록 — 음성 미리 듣기 후 원하는 톤 선택 (예: 톤 1)
- 동영상 생성을 클릭하면 렌더링이 시작됩니다.
결과 확인

완성된 툭투유 영상 — 모델이 제품을 들고 대사를 말합니다.
- 완성된 영상은 내 비디오와 툭투유 작업 화면 상단의 생성한 동영상 섹션에 나타납니다.
- 영상 카드를 클릭하면 라이트박스 플레이어에서 재생됩니다.
- 업로드 버튼을 눌러 영상 파일을 다운로드합니다.
- 입력한 대사가 플레이어 아래에 자막으로 표시됩니다.
활용 팁
- 대사는 한두 문장으로 짧게 작성할수록 오디오 싱크가 더 명확하게 맞습니다.
- 배경이 복잡한 제품 이미지는 배경제거 옵션을 사용하면 더 자연스러운 합성 결과를 얻을 수 있습니다.
- 영상 생성 전에 합성 이미지를 최대 4개까지 생성하여 가장 자연스러운 포즈를 먼저 선택하세요.