최근 출시되는 신차들은 아날로그와 디지털 중간 즈음의 느낌을 줍니다. 자동차를 움직이는 메커니즘은 여전히 전통적인 내연 기관의 그것입니다. 하지만 운전석에 앉아 계기판을 보는 순간부터 아직은 완전하지 않지만 반자율 주행 기능을 이용하는 순간까지 느껴지는 감성은 디지털을 향해 있습니다. 디지털 감성과 관련해 요즘 신차 리뷰 유튜브 영상에 빠지지 않는 것이 하나 있죠. 바로 음성 인식입니다. 목적지를 말하고 길을 찾는 것은 더 이상 흥미롭지 않죠. 요즘에는 여기서 조금 더 나아가 창문도 열어 주고, 에어컨도 틀어 줍니다. 물론 2019년 현재 신차에 적용된 음성 인식 기술은 걸음마 단계를 벗어나지 못하고 있습니다. 시쳇말로 말귀를 못 알아먹습니다. 정형화된 뻔한 질문 몇 개 알아듣는 수준이죠. 하지만 머지않아 꽤 똑똑한 음성 인식 기능을 차량에서 만날 수 있을 듯합니다. 다음 영상을 보시죠. 자동차와 운전자 그리고 탑승자가 자연스럽게 대화를 나눕니다. 운전자가 음성으로 명령하고 자동차가 알아듣는 수준이 아닙니다. 그냥 3명이 이야기를 나누는 장면을 보여줍니다.
위 영상은 미래를 가정한 것이 아닙니다. NVIDIA가 곧 공개할 예정인 자비스(Jarvis)라는 소프트웨어 개발 키트(SDK)를 이용하면 이 정도의 자동차를 위한 음성 인식 기능을 만들 수 있다는 것을 보여 주는 영상입니다. 물론 아이언맨에 나오는 그 자비스만큼은 아닙니다. NVIDIA 자비스 SDK는 멀티 모달(Multimodal) 기반의 음성 인식을 지원하는 인공 지능(AI) 애플리케이션을 만드는 것을 도와줍니다. 멀티 모달은 좀 어려운 개념인데요, 간단히 말해 단순히 음성만 듣는 것이 아니라 시청각 정보를 모두 활용해 대화를 나눈다고 보면 됩니다. 위 영상에서도 누가 말하는지 시스템이 인식하고, 대화를 자연스럽게 이어가죠. 단순히 소리만 듣는 것이 아니라 말하는 사람의 입술 모양도 보고 가능한 많은 정보를 참조해 말귀를 알아듣고, 문맥을 벗어나지 않는 선에서 대화를 이어가기 위한 기술이라 보면 됩니다. NVIDIA 자비스 기반 AI 애플리케이션은 음성 명령을 이해하고 실행하는 수준을 넘어 감정을 느끼고, 이야기의 흐름을 이해하는 수준까지 구현이 가능하다고 하네요. 빨리 위 영상 같은 음성 인식 기능을 자동차에서 이용하고 싶네요. 참고로 NVIDIA 자비스에 관심이 있는 개발자라면 관련해 먼저 프리뷰를 체험할 수 있으니, 사용자 등록을 한 후 최신 정보를 받아 보세요.
Kommentare