오래만의 넋두리입니다

요즘 전자기기들은 펌웨어라는게 대부분 들어갑니다. 전자기기들에게 있어서 이 펌웨어는 최소 구동을 위한 요소입니다. 즉, 이 펌웨어가 없으면 전자기기들은 그냥 벽돌이됩니다.

펌웨어는 엄연히 소프트웨어이기에 버그란게 당연히 존재합니다. 걔중에는 치명적인 버그도 있고 하드웨어에 밀접한 이상 기기를 망가뜨리기도 합니다.

----------------------------
최근 ESP8266모듈을 쓸일이 있었습니다.  교육용 키트로 와이파이 기능을 쓸 수 있게하는 제품입니다.  인기가 많아서 후속작인 ESP32가 기업용 제품에 쓰이기까지 하지요.

그런데 "교육용"이기에 당연히 저는 이 제품이 아두이노처럼 그냥 예제따라 하면 작동할 줄 알았습니다. 그런데 이상하게 동작이 안 되길래 찾던중 "펌웨어업데이트의 지옥에 온걸 환영한다"라는 글이 있더군요. ESP8266모듈은 펌웨어 업데이트가 엄청 빡세기로 유명하고 시중에 도는 제품은 펌웨어가 있기도 하고 없기도 하답니다.

이게 뭔 소리인가 싶었는데 칩셋제조국을 보고 이해했습니다. 본사가 상하이...
아무래도 칩셋 구하기 쉽다보니 짝퉁도 엄청 많아서(그런데 어찌어찌 동작은 합니다) 펌웨어 버전이 낮거나 없이 파는게 많은듯 하더군요.

결국 20개의 모듈을 개삽질해가면서 펌웨어 업데이트를 했고 지금은 정상작동합니다.
하지만 업데이트 하면서 펌웨어도 안 넣고 판다고 쌍욕을 엄청 했지요.
----------------------------
얼마전에 SSD 인클로저라는걸 샀습니다.
말이 거창해서 그렇지 SSD를 USB로 연결할 수 있게하는 제품입니다.

이쪽은 그래도 나름 유명업체것을 썼기에 큰불만 없었는데 이상하게 사용하고 30분만 지나면 열이 미친듯이 나더군요. 심지어 5기가 이상 파일을 넣으면 작동을 멈춥니다.

알고보니 펌웨어 버그였고 펌웨어 업데이트를 하고나니 정상적으로 작동합니다. 심지어 작년에 핫픽스수준으로 나온것이더군요. 그냥 펌웨어가 초기 버전이었던겁니다.
원인을 알고보니 제가 산건 한국정식업체것이 아니라 병행수입제품이었고 병행수입한곳이 펌웨어업데이트를 할리가 없으니 1년동안 먼지쌓인걸 그냥 배송한겁니다.

저야 이상해서 인터넷을 찾아서 원인을 펌웨어가 문제라고 알았지만 보통사람들은 모르겠지요. 그냥 고장난줄 알거고 버릴겁니다. 정식수입업체는 펌웨어 업데이트를 직접 해준다고 하는데 저는 그것도 불가능했지요.

----------------------------------
한때 닌텐도의 위유가 펌웨어 업데이트로 곤혹을 치뤘습니다.  새제품을 사면 업데이트로 허송세월을 보냈거든요. 그런데 인터넷 상태가 좋은 집만 있는게 아니죠. 그래서 사람들이 펌웨어를 업데이트해서 팔아달라고 하니(어차피 공장에서 나오는 족족 팔려나가고 있었으니) 닌텐도가 "선물하기전에 업데이트해주세요"라는 망발을 해서 욕을 먹었습니다. 포장을 풀어서 선물을 하면 쓰던거 주는거 같아서 좀 그렇잖아요.

플레이스테이션이 구버전 펌웨어에서 보안이 뚫려서 작살난거 생각하면 펌웨어를 미리 올려야 자사에 더 이득이었을텐데요.

스위치부터는 새제품에는 그 당시 최신 펌웨어가 들어있는것 같은데 펌웨어를 공장출고단계에서 올려주는게 이래저래 더 이득이었다는걸 몰랐던것 같습니다.
---------------------------------

그러니까 제발 펌웨어좀 최신버전 넣어서 팔아주세요...

,

노래를 불러주는 AI가 있습니다. Diff-SVC라고 부릅니다.
물론 정확히 말하면 stable-diffusion을 기반으로 목소리를 변환해주는것에 가깝습니다. 뒤에 SVC는 Singing Vocal Conversion이라고 해서 대놓고 목소리변환이라고 정의합니다.

누군가의 목소리를 학습한 AI가 다른 사람이 부른 노래의 목소리를 학습한 목소리로 바꿔주는 겁니다.

방법은 Stable-Diffusion과 동일한데

1. 목소리를 학습한 AI를 준비합니다. 이 AI는 사실 MEL-Spectrogram형태로 목소리를 학습했습니다.
2. 타겟의 음성을 준비합니다.
3. 여기에 각종노이즈를 섞어줍니다. 그냥 전파가 잘 안잡히는 라디오 수준으로 만든다고 생각하면 됩니다. 노래가 잡음과 함께 들려서 "노래가 들린다"수준으로 만드는겁니다.
4. 이걸 AI한테 "복원"하라고 시킵니다. AI는 자기나름대로 "복원"작업을 해서 돌려줍니다. 물론 아는 목소리는 자기가 학습한 목소리 뿐이라 오리지널이 아닌 학습한 그 목소리로 복원해줍니다.

...?

5. 보컬의 목소리가 바뀌었습니다.


그래서 이것저것 해보던 중 굉장한 사실을 알았습니다. 분명 "복원"이지만 원래 파일상태가 개판인 타겟을 넣으면 복원된것도 개판으로 나오더군요.

전 이걸 가이드보컬이라고 부르고 있습니다. 실제 녹음실에서 가수들이 노래부를때 가이드보컬의 노래를 듣고 이에 맞춰서 자신의 목소리로 부르거든요. 가이드보컬은 주로 오래된 경력자나 진짜 실력자가 합니다. 그래야 신인 가수들이 따라오니까요.

꼭 AI가 하는 짓이 가이드보컬을 따라 부르는 느낌이네요. 괜찮은 보컬은 AI가 변환했을때 상당히 훌륭한 결과가 나오는 반면 엉망인(특히 음반에서 보컬추출 등으로 만들어서 여기저기 망가진)걸 타겟으로하면 AI도 이상하게 만듭니다.

재미있지요.
TTS의 경우 학습초기를 보면 옹알이를 들을 수 있는데 꼭 애기들이 말을 배우는 느낌이 듭니다. 그런데 보컬AI도 좋은 가이드를 만나야 좋은 결과가 나온다는게 참 신기하네요.

,

요즘 스마트폰들은 3.5파이 스테레오 구멍이 없습니다.
그냥 블루투스 쓰라는 것처럼 들리는데 삼성의 경우 USB-C형태의 이어폰을 번들로 줍니다. 이걸로 라디오도 들으라는 의미인데 라디오를 위해 굳이 그걸 챙길리가...

그리고 이어폰을 쓰면서 충전도 안 되지요. 이어폰이 USB를 점령하고 있으니까요.

하지만 사람들은 다 계획이 있었나봅니다.

이런 케이블을 하나 사면 충전과 동시에 3.5파이 이어폰을 쓸 수 있습니다.

더 웃긴건 케이블안에 DAC가 내장되어있는건지 소리가 노이즈없이 더 깨끗하게 들립니다.

USB-C AUX Y젠더라고 검색하면 비슷한것들이 나오고 케이블류는 다 파는걸로 유명한 Coms에서 팝니다.
일단 제가 구매한건 IH618이라는 품목인데 인터넷에는 안 나오네요.

어쨌건 굳이 3.5파이 구멍이 없어도 되겠네요

,