카카오 mm 에서 TTS로 대화하기

코로나로 인해 재택 근무가 시작되면서, 카카오 음(mm)과 같은 음성기반 소셜미디어에 빠졌다. 서버스에 대한 논란과 평은 차치하고, 사용하면서 느낀 불편함이 있었는데 바로 오피스에 출근하게 되면 -이어폰을 통해- 듣기 전용으로 참여할 수 밖에 없다는 점이었다. 그것도 재미있지만, 가끔은 나도 말하고 싶다고! (특히 환경적인 문제로 말을 못하겠으니까 더!)

그래서 TTS(Text To Speach)를 통해 말을 하면 된다는 생각을 했다. TTS의 경우 kakao developers에서 제공하는 서비스를 사용해 본 경험이 있기 때문에 될 것 같아서…

1차 시도

mm-tts-01

랩탑의 3.5파이 헤드셋 아웃풋의 출력을 Y케이블을 통해 헨드폰의 헤드폰 아웃풋의 입력으로 넣고 출력에 이어폰을 연결하는 구상을 했다.

이렇게 했을때 문제는 핸드폰에서 나오는 음성은 내가 들을 수 있는데 내가 말하는, 아니 나 대신 TTS가 말하는 랩탑 소리는 들을 수 없다는 것.

처음엔 왜 무슨 차이인지 헷갈렸는데, 입으로 말하는 경우 핸드폰을 통해 귀로 들어오는게 아니라 바로 귀에 들어오며 TTS로 말하면 핸드폰으로 바로 들어가서 내가 들을 기회가 없다.

수정

mm-tts-02

결론부터 말하면, 하드웨어 오디오 믹서를 사용해 이 문제를 해결 할 수 있었다.

  1. 랩탑의 출력을 “2분배 이어폰 오디오 Y젠더"로 복제해 오디오 믹서로,
  2. 핸드폰의 출력을 “TRS to TRRS Y케이블"로 오디오 믹서로,
  3. 오디오 믹서에서 이 둘을 합쳐서 헤드폰으로 듣기

하드웨어 오디오 믹서는 각 입력들과 출력의 볼륨을 직관적으로 조절할 수 있기 때문에 좋았다

사용한 하드웨어

  1. 3극 스테레오 2 분배 젠더 케이블 이어폰 오디오 Y젠더 Y형 Y잭 듀얼잭 커플잭 분배기
  2. Marshall MXL MM-C002 TRS to TRRS Y 어댑터 케이블 모바일 기기용
  3. Rolls MX51S 미니 믹스 2 4채널 스테레오 라인 믹서

2번의 변환 케이블의 경우 저가형 제품에서는 마이크 입력이 핸든폰으로 안 들어가는 문제가 있었다. 오디오 레벨 차이고 회로를 꾸며 해결하는 방법을 검색해 보기도 했는데, 다행이? 돈으로 해결 할 수 있었다.

3번의 오디오 믹서의 경우, 사전지식 없이 샀는데, 이 경우 2채널이면 충분했고, 오디오 믹서가 입력을 RCA로 받아서 3.5파이toRCA 케이블을 사용해야 되는게 번거로왔다. 알리 익스프레스에서 저렴한 버전을 나중에 볼 수 있었는데 구매해서 테스트 해 보지는 않았다.

전체 사진

mm-tts_real