필수 파일 다운로드 — 아래 버튼으로 한 번에 받으세요.
⓪ YouTube 다운로드
① 보컬/악기 분리
② 모델 학습
③ 보이스 변환
④ 믹스
⑤ 피치 편집
설정 가이드
YouTube URL
다운로드 기록
💡 다운로드 후 보컬/악기 분리로 보내기 버튼을 누르면 바로 다음 탭에서 보컬을 분리할 수 있습니다.
오디오 파일 업로드
🎵
파일을 드래그하거나 클릭하여 업로드
MP3, WAV, FLAC, OGG, M4A 지원 · 여러 개 동시 선택 가능
분리 기록
변환할 보컬 파일
🎤
변환할 보컬 파일 업로드
WAV 권장 · MP3, FLAC 지원
변환 설정
0
0.40
5
0.50
💡 사용 전 필요: 먼저 설정 가이드 탭에서 HuBERT 모델을 다운로드하고, 모델 학습 탭에서 학습된 .pth 파일을 준비하세요.
변환 기록
RVC v2 — 빠른 학습 · 실시간 변환 가능 · 일반 용도에 적합
학습 데이터 (보컬 파일 여러 개)
📂
보컬 파일 여러 개 선택
총 10분 이상 동일 목소리 권장 · WAV/MP3/FLAC
RVC 모델 설정
권장: 800 에폭 · 데이터 많을수록 높게
RMVPE (고정) — 딥러닝 기반, 고음·팔세토 정확
먼저 보컬/악기 분리 탭에서 Demucs로 보컬을 추출한 뒤 이 탭에 업로드하면 더 좋은 품질의 모델을 얻을 수 있습니다.
학습 기록
🎤 보컬
파일을 선택하거나 드래그하세요
파형이 여기에 표시됩니다
100%
0st
여러 파일 동시 선택 가능 · 드럼·베이스·other 한 번에 추가
서버에서 FFmpeg로 렌더링 · 피치/볼륨 정확히 적용됨
믹스 기록
오디오 파일 업로드
🎵
파일을 드래그하거나 클릭하여 업로드
변환된 보컬 파일 권장 · WAV, MP3, FLAC 지원
또는
▶ 재생 모드: 클릭 = 해당 위치부터 재생 · 호버 = 해당 음 즉시 미리 들음 │
✏ 편집: 드래그로만 피치 조정 (클릭만으로는 변경 안 됨) │
미니맵: 하이라이트 영역 드래그 = 스크롤 · 영역 끝 드래그 = 줌 │
Ctrl+Z 되돌리기
경로 A — 내 목소리로 직접 학습 (권장)
🚀 직접 학습 순서
1
2
보컬 준비 — "보컬/악기 분리" 탭에서 MP3/WAV를 업로드하고 보컬(vocals)을 분리하세요.
같은 목소리의 파일을 10분 이상 모을수록 품질이 좋아집니다.
같은 목소리의 파일을 10분 이상 모을수록 품질이 좋아집니다.
3
"모델 학습" 탭에서 분리된 보컬 파일들을 업로드하고 모델 이름 입력 후 학습 시작.
RTX 5090 기준 100 에포크 약 20~40분 (에포크가 많을수록 품질↑)
RTX 5090 기준 100 에포크 약 20~40분 (에포크가 많을수록 품질↑)
4
"보이스 변환" 탭에서 학습한 모델 선택 → 변환할 보컬 업로드 → 변환!
경로 B — 커뮤니티 모델 바로 사용
📥 기존 모델 다운로드 & 적용
1
아래 사이트에서 원하는 목소리 모델 (.pth 파일) 다운로드:
🔗 weights.gg — 가장 큰 RVC 모델 커뮤니티 (한국 아이돌, 해외 가수 등 수천 개)
🔗 HuggingFace — 검색:
Discord 서버 (AI Hubbers, RVC 커뮤니티) 에서도 공유됩니다.
🔗 weights.gg — 가장 큰 RVC 모델 커뮤니티 (한국 아이돌, 해외 가수 등 수천 개)
🔗 HuggingFace — 검색:
RVC voiceDiscord 서버 (AI Hubbers, RVC 커뮤니티) 에서도 공유됩니다.
2
받은 파일을 아래 위치에 넣기:
C:\Users\pro\audio-tool\models\rvc\<모델이름>\
├── model.pth ← 필수 (목소리 모델)
└── model.index ← 선택 (같이 있으면 품질↑)
├── model.pth ← 필수 (목소리 모델)
└── model.index ← 선택 (같이 있으면 품질↑)
3
"보이스 변환" 탭 → 모델 선택 옆 ↻ 새로고침 클릭 → 변환!
현재 상태
학습된 RVC 모델
확인 중...