IT Note/서비스 or 제품 리뷰

카카오미니 인공지능 스피커 2년 사용기

_Jessietheace 2019. 12. 19. 20:33

*원문 보기 >> https://brunch.co.kr/@jessiejisulee/154

0. 작년에 센트비에서 일할때 카카오미니를 질렀다. 당시 멜론 사용자 4만 9천원 구입가 딜이 뜨기도 했고 아무래도 IT 스타트업 다니니까 그런 쪽으로 관심이 많아 지더라.

그땐 사무실에 놔두고 쓰고 지금은 집에서 쓰고 있는데 뭔가 주위 사람들 SNS 포스팅같은걸 보면 다 똑같은 인공지능 스피커여도 어떻게 사용하는지가 조금씩 다른거 같다. 제조사의 성향(아마존 알렉사, 구글 홈, 카카오미니, 네이버 클로버, SK 누구, KT 기가지니)에 따라서 핵심으로 미는 기능이 다를수밖에 없어서인가.

 

 

1. 카카오미니를 엄마 주기로 해서 최근에 사내 경매에서 구글 홈을 사서 영어로 쓰고 있다. 구글 어시스턴트랑 음성 인식 서비스는 같은건가? 내 영어에 악센트가 없지 않을 텐데 잘 알아들음.

근데 확실히 한국에서 만들어서 그런가 한국인이 쓰기에는 카카오미니가 좋은거 같다. 한국인이 자주 쓰는 서비스들이랑 연동되어서 그런거도 있다. 그리고 헤이카카오 핸드폰 앱 UX가 카카오스럽고 한국인이 많이 써봤던 인터페이스라서 대충 내가 생각했을때 이 기능이 이 토글에 있겠지? 라고 하면 거의 있다.

 

그리고 무엇보다 카카오의 지능이 늘었다.

처음엔 진짜 멍청했어서 말귀를 못알아먹어가지고...뉴스틀어달라그러면 날씨 틀어주고..

작년 1-2월에 멜론 이용자 4만 9천원 딜 하면서 내 주위 사람들도 많이 샀는데 다들 답답해서 못쓰겠다고 그랬었던 기억이. 그리고 지금 구글 홈은 내 영어를 알아듣는데 작년 카카오 미니는 명령어 반응도를 최대치로 올려도 동남아시아에서 온 내 동료들이 한국어로 명령 말하면 잘 못알아들었다.

 

작년 내 회사 책상 위를 지쳤던 라이언과 카카오 미니

 

 

2. 작년에 어떤 분 인스타 피드에서 본건데 미국에서 아마존 알렉사가 스마트홈 연결해서 음성 명령하면 불 꺼주던데 진짜 신기했다. 메리엇 호텔도 하긴 알렉사 넣고 노보텔이 기가지니 넣는다는데 이젠 말 다했지.

https://www.hotelmanagement.net/tech/alexa-for-hospitality-marriott-adds-amazon-to-guest-experience-0

 

With Alexa for Hospitality, Marriott adds Amazon to the guest experience

Five of Marriott International's brands will roll out Amazon's new Alexa for Hospitality platform, encouraging guests to use voice-activated devices in their guestrooms.

www.hotelmanagement.net

http://www.hani.co.kr/arti/economy/it/853800.html

 

인공지능이 호텔을 만나면…KT, ‘AI 호텔’ 서비스 나서

서울 노보텔 앰배서더 동대문에 적용 맞춤형 단말기 ‘기가지니 호텔’ 사용 한국어·영어만 지원은 ‘한계’

www.hani.co.kr

 

인공지능 스피커는 확실히 도입하는 국가/공간에서 연동되는 서비스가 많고 사용자들의 생활습관과 keen 하게 연결될수록 확장성과 중독성이 높아지는 거 같다.

카카오 택시도 설정해놓으면 집 앞이나 회사 앞으로 바로 오고, 멜론 쓰면 내 취향대로 음악 틀어주니까. 근데 함정인건 내가 지정해놓은 플레이리스트 틀어주는 기능은 아직 없고 (해당 기능을 준비중 이에요 라고 대답함) 스포티파이처럼 장르별로 추천되는거 아니고 단순 스트리밍 기반 데이터 추천이라 이 곡을 들은 사람은 보통 이걸 듣더라 하는 추천이다.

SKT NUGU는 IPTV하고 옥수수랑 연동하는 것도 그런 맥락일듯.

 

덧. 왜인지 모르겠지만 구글 홈으로 유튜브 뮤직 틀어놓는 것보다 카카오와 멜론의 큐레이션이 더 투박한 것 같다. 유튜브 동영상 시청자 조회수와 멜론 청취자 데이터의 체급 차이인지, 취향 큐레이션 알고리즘이 더 꾸져서 그런건지는 모르겠다. 아시는 분 답을 댓글로 주세요 ㅎㅎ

 

 

3. 음성이 IT기술의 한 획으로 떠오른 건 사실 좀 됬다. IBM Watson도 STT(Speech to Text)에 집중하고 강정수교수님도 제작년에 <보이스 퍼스트 패러다임>이라는 책을 냈다. 아직 읽어보진 않았지만...

다만 삽질도 그만큼 많았던거 같다. Vui(Voice UI)는 도대체 어떻게 설정해야되는 거고 결국 Vui의 설정은 엔지니어링과 붙어야 하는 건지. 무궁무궁한 가능성이 있다는데 삽질은 무지하게 많고 아직 효과가 뚜렷하게 입증된게 없다.

솔직히 카카오 미니 스피커의 명령 입출력도 거의다 룰베이스지 자연어 처리로 알아듣는 건 거의 없고.

 

개인적으로 애완견 목소리로 관리해주는 건 솔직히 효과 잘 모르겠고 어린 아이들 코딩가르쳐 주는 거나 영어 발음 체크해주는 건 괜찮은 것 같다. 특히 아직 글을 익히지 않아 쓰기보다는 듣고 말하기로 학습하는 아이들. 그 부분의 소양은 특히 일본/한국에서 집중되지 않은 교육법이니까.

 

 

4. 한국의 IT 회사에서 일하면서 그 어떤 시장보다 harsh 해서 힘들진 하지만 그래도 이런건 좋다.

5G가 제일 먼저 도입된 나라에서 살고, 국산 IT 회사들도 잘하고. 한국 시장이 스케일이 작아서 박터지긴 하지만 앞으로 목표대로 외국 나가서 일하게 되도 한국 벤처스퀘어나 블로터같은 매체는 계속 챙겨볼 것 같음. 빨리 해외 나가서 일하고 싶다 ㅠ

 

 

반응형