폴란드 친구들이 주말 프로젝트로 시작한 AI 음성 복제, 2년 만에 44억 유니콘 달성
“솔직히 폴란드 더빙은 정말 최악이야. 모든 영화를 똑같은 아저씨 목소리 하나로 다 해버린다고.”
폴란드 바르샤바 고등학교 시절부터 친구였던 Mati Staniszewski와 Piotr Dabkowski가 2022년 어느 주말에 나눈 대화예요.
두 사람은 어릴 때부터 이 문제가 너무 싫었거든요. 액션 영화든 로맨스든 상관없이 모든 외국 영화를 한 남성 성우가 단조로운 목소리로 더빙하는 폴란드 방식이요.
“이거 진짜 AI로 해결할 수 있을 것 같은데?”
이런 간단한 짜증에서 시작한 게 지금 연 $100M 수익(1,300억원)을 올리는 ElevenLabs예요.
더 놀라운 건, 이 두 친구가 주말 프로젝트로 시작해서 단 2년 만에 $3.3B(44억달러) 유니콘을 만들어냈다는 거예요.
어릴 때부터 기술 덕후였던 두 친구
Mati Staniszewski는 바르샤바에서 태어나 어릴 때부터 수학과 기술에 푹 빠져 살았어요.
고등학교 동창이었던 Piotr Dabkowski와는 늘 주말마다 뭔가 재미있는 프로젝트를 만들어보곤 했어요.
“우리는 항상 문제를 보면 ‘이거 기술로 해결할 수 있을 것 같은데?‘라고 생각하는 성격이었어요.”
두 친구는 각각 영국으로 유학을 떠났어요. Mati는 Imperial College London에서 수학을, Piotr는 옥스포드/케임브리지에서 컴퓨터 사이언스를 공부했거든요.
졸업 후에는 BlackRock, Palantir, Google 같은 대기업에서 7년간 커리어를 쌓았어요. 그런데도 주말마다 만나서 취미 프로젝트를 계속했다는 게 대단하죠.
폴란드 더빙이 너무 짜증났던 이유
2022년 초, 두 친구는 또 다른 주말 프로젝트로 음성 분석을 실험하고 있었어요.
그때 갑자기 깨달은 거예요. “아, 우리가 어릴 때부터 싫어했던 폴란드 더빙 문제를 이걸로 해결할 수 있겠네!”
폴란드는 정말 특이한 더빙 시스템이거든요. 액션 영화든 로맨스든 상관없이 모든 외국 영화를 한 명의 남성 성우가 단조로운 목소리로 더빙해요.
“우리는 그냥 받아들이고 살았어요. 근데 얼마나 형편없는지 깨닫고 나니까 더 이상 참을 수가 없었어요.”
그래서 생각한 게 “AI로 진짜 사람 같은 목소리를 만들 수 있다면?”이었어요.
주말 프로젝트에서 창업까지
2022년 4월, Mati와 Piotr는 과감하게 대기업 커리어를 포기하고 ElevenLabs를 창립했어요.
처음엔 정말 간단했어요. “음성 합성으로 감정과 억양을 제대로 표현할 수 있는 기술을 만들자.”
완벽하지 않아도 두 사람은 과감하게 출시했어요. “완벽함을 기다리다간 영원히 못 내놓을 것 같았거든요.”
첫 버전은 솔직히 별로였어요. 그래도 Mati는 확신했어요. “음성 AI가 텍스트나 이미지만큼 발전할 거라고 생각했어요.”
유튜버 1,000명에게 이메일 폭격 작전
ElevenLabs는 처음엔 “유튜버들이 관심 있을 거야”라고 생각했어요.
그래서 1,000명 넘는 유튜버들에게 데모 샘플과 함께 이메일을 보냈어요. 반응은? 완전 쥐소리.
“1,000명 중에 5명 정도만 답장이 왔어요. 진짜 망한 줄 알았죠.”
그런데 그 5명의 피드백이 완전 게임체인저였어요. 그들이 원하는 건 풀 더빙이 아니라 더 나은 내레이션, 깔끔한 음성해설이었거든요.
그때 한 작가가 자신의 책 전체를 ElevenLabs에 복붙해서 오디오북을 만들었는데, 사람이 검토해도 AI인지 몰랐어요. 리뷰도 대박이었고요.
“아, 이거 진짜 될 수도 있겠다!”
ChatGPT 덕분에 투자자들이 몰려들다
2022년 말 ChatGPT가 터지면서 ElevenLabs에게 완벽한 타이밍이 왔어요.
갑자기 모든 투자자들이 생성형 AI에 미친 듯이 관심을 보이기 시작한 거예요.
- 2022년: $2M pre-seed (인생을 바꾼 투자라고 Mati가 회상)
- 2024년: $80M Series B ($1B+ 유니콘 달성)
- 2025년: $108M 추가 투자 ($3.3B 평가)
“$2M만으로도 GPU 용량 확보하고 빠르게 인재 채용할 수 있었어요. 그게 모든 걸 바꿨죠.”
투자자들이 줄을 서서 투자하려고 했대요. Andreessen Horowitz, Sequoia Capital 같은 톱티어 VC들이 모두 참여했거든요.
하나의 제품으로 모든 고객을 만족시키다
ElevenLabs의 천재적인 전략은 고객별로 다른 제품을 만들지 않는다는 거예요.
소설가든 대기업이든 상관없이 모두 같은 제품을 써요:
- 개발: AI 음성 모델 연구개발
- 고객 지원: 70+ 언어 지원
- 마케팅: 제품이 스스로 마케팅 (제품 주도 성장)
“소설가가 자기 책을 내레이션하든, Cisco나 Twilio 같은 기업이 에이전트 워크플로우에 통합하든 똑같은 제품을 써요.”
이 전략이 정말 스마트한 게, 기업 고객들이 직접 써보고 품질을 확인한 다음에 계약하거든요.
전 세계가 인정한 성공 성과
ElevenLabs의 성장은 정말 폭발적이었어요:
- 첫 해: 베타 출시 후 바로 화제
- 1년차: 100년 분량의 오디오 생성 달성
- 2년차: 연 $100M 수익(1,300억원) 달성
“우리 사용자들이 생성한 오디오를 다 합치면 100년이 넘어요.”
고객층도 정말 다양해요. 개인 크리에이터부터 워싱턴 포스트, Cisco, Twilio 같은 대기업까지요.
심지어 2025년에는 젤렌스키 대통령 인터뷰를 영어, 우크라이나어, 러시아어로 동시 번역하는 프로젝트도 했어요. 원래 목소리와 억양을 완벽하게 보존하면서요.
기술보다 제품에 집중한 철학
ElevenLabs은 지금도 Mati 혼자 핵심 의사결정을 전부 담당해요.
- 연구개발: AI 모델 지속 개선 (V3까지 출시)
- 제품 개발: 70+ 언어, 감정 표현, 억양 조절
- 비즈니스: 플랫폼 오픈으로 생태계 구축
“모델은 언젠가 상품화될 거예요. 지금이 생태계를 구축할 때라고 생각해요.”
Mati는 제품 해킹보다는 모델 자체의 개선에 집중해요. 발음이 안 좋으면 인터페이스를 복잡하게 만드는 대신 모델이 나아질 때까지 기다리거든요.
실패보다 더 큰 도전들
Mati도 처음부터 성공한 건 아니에요. 몇 가지 실수도 했고요.
가장 큰 실수: GPU를 일찍 더 많이 사지 않은 것
“속도가 정말 중요한데, GPU 용량이 부족해서 아쉬웠던 순간들이 있었어요.”
하지만 Mati는 이제 더 전략적으로 접근해요. 예상치 못한 사용 사례들을 열어두는 것이죠.
한 해커톤에서 시각 장애인을 위한 카메라-내레이션 시스템을 만든 팀이 있었는데, 완전 예상 밖이었지만 완벽했다고 해요.
2025년 AI 음성 혁명의 중심
Mati의 이야기에서 가장 인상적인 건, 진짜 문제 해결에 집중했다는 거예요.
- 검증된 기술로 확실한 제품을 만들기
- 완벽함보다 빠른 출시와 지속적 개선
- 한 제품으로 다양한 시장에 적용하기
“AI가 인간 수준의 음성에 도달할 거예요. 6-12개월 내에요.”
Mati는 ChatGPT처럼 강력한 AI 도구들과 함께 음성 AI도 모든 사람의 일상이 될 거라고 확신해요.
혹시 여러분도 AI 음성으로 시작해보고 싶다면?
혹시 여러분도 Mati처럼 본인만의 AI 도구를 만들어 수익화하고 싶다면, ElevenLabs처럼 해보는 건 어떨까요?
- 진짜 짜증나는 문제부터 찾기 - 폴란드 더빙처럼 정말 해결하고 싶은 것
- 주말 프로젝트로 시작하기 - 완벽하지 않아도 일단 만들어보기
- 직접 사용자에게 피드백 받기 - 1,000명에게 이메일 보내는 용기
- 하나의 제품으로 여러 시장 공략 - 복잡하게 만들지 말고 단순하게
Mati가 증명했듯이, 진짜 문제 해결과 빠른 실행만으로도 충분히 글로벌 유니콘을 만들 수 있어요.
“Stephen Hawking에게 목소리를 돌려줄 수 있다면 그걸 하고 싶어요.”
2년 후에는 여러분도 Mati처럼 “우리가 만든 AI로 세상이 바뀌고 있어요”라고 말하고 있을지도 몰라요. 🚀