7장 : Siri, 오늘의 날씨는? : 음성 인터페이스와 AI
7장은 음성 인터페이스와 AI 관련된 내용입니다.
7장 연재를 시작하겠습니다.
1997년 삼성전자는 음성 인터페이스(VUI-Voice User Interface) 를 이용하여 음성으로 전화를 걸 수 있는 애니콜 브랜드의 전화기를 출시하면서 대대적인 광고를 진행한다. 광고의 모델인 영화배우 안성기 씨는 전화기에 '본부'라는 말로 전화를 연결하는 모습을 보여준다. 인터페이스로서 음성은 1960년대 부터 연구가 진행이 되었다. 음성 인터페이스는 인간이 사용하는 가장 보편적인 수단이며, 누군가 얘기하면 이를 인식하고 다시 답변을 하는 프로세스로 진행이 된다. 음성 인터페이스에서 가장 중요한 것도 이 두 가지로 간단히 정리해 볼 수 있다. 즉, 음성 인식과 음성 합성(또는 다른 형식의 출력)이 그것이며 이를 처리하기 위해서 언어를 분석하고 이를 이해하는 컴퓨팅 능력이 필요하다. 삼성전자의 애니콜도 마찬가지이지만 음성 인터페이스를 이용하기 위해서는 음성을 정확히 인식하는 기술이 필요했다. 당시의 기술은 음성 정보 처리를 위한 기술이 크게 발전하지 않아서 간단한 인식 방법(고립단어인식)이 사용되었으며, 주변 잡음 등이 끼어들게 되면 인식률이 많이 떨어져 제한적으로 사용이 가능했다. 삼성전자는 이러한 음성 인터페이스를 핸드폰(피처폰)의 메뉴까지 확대하기는 했지만 최신 기술력을 보여주는 의미 정도로 신기한 제품 정도로 여겨졌다.
2000년대 초에 접어들면서 음성 인터페이스 관련 기술은 급속하게 발전하기 시작한다. DSP(Digital Signal Processing)칩이 개발되면서 음성 데이터처리 능력이 비약적으로 발전하고 이를 통해 음성 인터페이스가 널리 대중화되기 시작한다. CTI를 기반으로 한 무인 콜센터가 등장하고, 텔레뱅킹, 각종 정보 조회 등에 사용되어 널리 퍼지게 된다. 또한 음성 합성 기술이 발전하면서 텔레매트릭스 등에도 활용되기 시작한다. 음성 인터페이스는 지능형 대화 인터페이스로 발전하여, 지능형 로봇, 통역, AI 등 다양한 분야로 영역을 확장하고 있다.
음성 인터페이스가 급격하게 발달하게 된 기반에는 CPU나 DSP칩 같이 하드웨어적인 발전으로 처리할 수 있는 프로세싱 파워가 비약적으로 발전한 것도 있지만 정확한 음성인식을 위한 딥 러닝(Deep Learning)기술과 AI가 결합하면서 부터이다.
혹시 구글 411 서비스를 들어본 적이 있는가?
Goog-411 (Google Voice Local Search)로 전화를 걸면, 완전 자동화된 음성 인식 시스템을 통해서, 원하는 주나 도시의 기업이나 업종을 무료로 안내해주는 서비스이다. 2007년 구글 411 서비스가 출시하였을 당시에, 전화안내 서비스는 년 70억 달러의 유료 시장이었다. 당시의 기술로 구글 411의 음성인식률은 70% 정도였지만 사용자들은 무료 서비스를 이용하는데 주저하지 않았다. 구글은 음성 안내 서비스에 어떠한 유료 모델을 도입하지 않고 서비스를 종료할 때가지 무료로 운영을 한다. 구글이 무료 구글 411 서비스를 운영한 이유는 자동 음성 안내 시스템을 사용하는 사용자의 음성 데이터를 수집하기 위해서 이다. 인간의 음성은 사람마다 다르기 때문에 이를 통계적인 기법으로 분석하고 적용하면 음성 인식률을 높일 수 있기 때문이다. 이제는 머신 러닝 기술을 활용하면 보다 효과적으로 분석하고 학습하여 기계가 보다 정확히 음성을 인식할 수 있게 되었다. 머신러닝, AI 등과 결합된 음성 인터페이스에 대해서는 뒤에 보다 자세히 살펴보도록 하겠다.
인터페이스 혁신 이전글
7장 Siri, 오늘의 날씨는? : 음성 인터페이스와 AI
6장 손가락이 지배하는 세상 : 터치 인터페이스 전성시대
6장1.PDA의 몰락과 아이폰
6장2.손가락이 혁신을 가져다 주다
6장3.아이패드의 연이은 성공
6장4.태블릿 PC의 귀환
6장5.매직 마우스와 매직 트랙패드
6장6.다시 연필로 돌아가다
5장 검색박스로 인터넷을 지배하는 구글
5장1.최초 인터넷 포털, Yahoo!
5장2.인터넷의 폭발적인 성장과 인터페이스
5장3.검색박스로 인터넷을 지배하는 기업
5장4.네이버 vs. 구글 - 문화와 인터페이스
5장5.구글은 웹 인터페이스 기업이다.
5장6.웹 인터페이스 회사들
5장7.구글의 경쟁자들
2장 급격하게 몰락한 기업이나 기술의 공통점은 ? : 인터페이스 혁신 불감증-글모음
짱짱맨 호출에 출동했습니다!!
고팍스에서 MOC상장 에어드롭 이벤트를 진행합니다.
혜자스러운 고팍스!
https://steemit.com/kr/@gopaxkr/moc
출동감사합니다.
고팍스에서 어제 100스달을 구입했네요~~~
아직 다른 코인은 관심이 없어서요
좋은글 감사합니다
애니콜 음성인식 서비스는 정말 인식이 잘 안되서 좀더 정확히는 false alarm이 너무 많아서 몇번의 시도후 영원히 사용하지 않은 기억이 있네요.
시작하는 글이라서 조금 짧았습니다.
사실 신기한 기능이기는 했지만 편리한 기능은 아니라서요~~~
자주 들려주세요...
잘 봤습니다.
구글이 무료로 진행하는데는 이유가 있었군요. 거대 기업이라 무료로 저렇게 진행해버리면 작은 기업들 쓰러지기 딱 좋겠어요 ㅜㅜ
시장을 약 50% 이상 차지했다는 기사가 있었습니다.
현재는 서비스를 중단했구요. 그래도 큰 비난을 받거나 하지는 않았습니다.
아마존도 새로운 시장 진출을 선언하면, 그 업종 기업이 망한다고는 하는데,
아마존을 크게 비난하지는 않는 풍토가 있더군요.
국내라면........