메뉴

검색

빅데이터

콜센터 녹취데이터 빅데이터 활용, 음성인식 엔진 개발

2015-03-23 14:34:00

콜센터 녹취데이터 빅데이터 활용, 음성인식 엔진 개발

- 녹취기록을 자동으로 텍스트 변환하는 기술
- 고객 음성 DB 빅데이터 분석으로 신 시장창출
- 외산대비 10% 이상 우수성능 결과로 수입대체 효과
은행, 증권, 카드사 등 국내 대규모 콜센터가 17만석에 달하는 가운데 고객의 음성데이터 자료의 중요성이 점차 부각되고 있다. 음성 데이터를 녹취하여 빅데이터 분석을 통해 경영에 반영 할 수 있기 때문이다. 국내 연구진이 콜센터 녹취기록을 자동 텍스트로 변화하는 기술개발에 성공, 관련 시장 상용화에 나서고 있다.

ETRI(한국전자통신연구원, 김흥남 원장)는 '자연어 음성인식 SW' 를 개발, 적극 상용화를 추진한다고 22일 밝혔다. 현재 콜센터의 고객 음성DB는 데이터 센터에 저장만 하는 형태였다. 따라서 고객과의 분쟁이나 사고 시에만 활용했다. 하지만, ETRI는 콜센터에 고객음성을 실시간으로 텍스트로 바꿔 고객의 음성 DB를 저장, 빅데이터 분석을 할 수 있다고 연구진은 설명했다.

이로써 회사는 고객의 연령, 성별에 따른 관심분야 파악은 물론 고객 성향을 알 수 있다. 최근 금융권을 중심으로 상담원과 고객 음성 데이터를 자동으로 음성 인식 처리하는 기술이 본격적으로 검토되고 있다. 이는 고객 음성DB 분석이 기업의 경영전략 수립과 고객 마케팅, 고객 분쟁 감소 등 경영 자산으로 인식되면서, 대규모의 콜센터를 운영하는 기업들이 관심을 갖게 된 것이다.

현재 전 세계 콜센터와 같은 고객의 음성DB 분석시장은 미국과 이스라엘이 시장을 주도하고 있다. 하지만, 외국산 제품은 영어 등 주요국가 언어를 분석대상으로 하기 때문에 독특한 우리말과 글을 인식하는데 한계가 있다. 따라서, 유지보수에 많은 비용을 수반하게 된다.
더욱 큰 문제는 국내 기업이 보유하고 있는 고객 음성DB의 해외유출로 민감한 개인정보 문제를 발생시킬 수 있다는 것이다.

이러한 이유로 ETRI는 본 기술개발을 진행하였으며, 현재 관련 기업에 기술이전이 되어 상용화가 추진되고 있다. 개발된 기술은 외산 기술과의 비교테스트에서 10% 이상의 우수한 성능 결과를 얻었다. 본 기술의 핵심기술은 '자연어 음성인식 및 핵심어 검출기술' 로 자연스럽게 발성한 음성을 인식하여 문자로 변환하거나 특정 단어를 자동 추출해주는 기술이며 특히 콜센터 발화특성에 최적화 되어있다. 하지만 아직은 콜센터 녹취데이터와 같은 대화체 음성의 비정형 특성으로 인하여 인식 성공률이 70% ~ 80% 대에 머무르고 있기 때문에 추가 기술개발이 필요하다.

한편, 현재 국내 음성DB 분석시장은 초기단계로, 본 기술이 국내 고객 음성DB 분석 시장창출에 큰 역할을 할 것으로 기대하고 있다.
ETRI 이윤근 자동통역인공지능연구센터장은 "음성인식 기술은 음성검색을 시작으로 SMS(단문메시지서비스), 콜센터 녹취데이터용 음성인식, 자동통역, 영어학습, 내비게이션 등으로 점차 적용 영역이 넓어지고 있으며, 편리성과 친근성을 장점으로 하여 가까운 장래에 자동차, 가정, 회사 등 생활 모든 영역에서 중요한 사용자 인터페이스로 자리 잡게 될 것이다." 라고 말했다.

한편, 본 기술은 미래창조과학부 '모바일 플랫폼 기반 대화 모델 적용 자연어 음성 인터페이스 기술 개발' 사업의 일환으로 개발 되었으며, 특허 6건, 논문 10건, 기술이전 6건을 완료했다. 한편, 전 세계 음성인식 시장 규모는 2017년 대략 167억불 규모로 예상되며 이 중, 콜센터 음성인식 시장규모는 약 4억불 규모이다.

향후 ETRI는 동 기술에 관한 확실한 기술 우위를 확보하기 위해 심층신경망(deep neural network) 및 고성능 잡음처리기술 등을 지속적으로 개발할 예정이다.

한편, 지난 18일 서울시도 1,400억 빅데이터 분석으로 ‘교통사고 대책’ 마련한다고 밝혔다. 김기병 서울시 통계데이터담당관은 “‘13년부터 시작된 교통·안전·복지 분야 빅데이터 분석 결과를 행정에 도입해 교통약자 안전 강화 등 시민이 체감할 수 있는 정책으로 만들어내겠다”며 “올해부터는 시민 생활과 밀접한 분야로 범위를 더욱 확대하고, 분석 결과를 ’서울시 열린데이터광장'을 통해 시민에게 개방해 새로운 서비스와 부가가치가 창출될 수 있도록 하겠다”고 말했다.

강진동 서울시 교통운영과장은 “교통사고와 관련된 각종 빅데이터를 시·공간적으로 분석한 결과를 토대로 보다 과학적인 대책을 수립했다”며 “시민의 소중한 생명을 보호하기 위해 시설개선, 교육, 홍보 등 교통사고 줄이기 대책을 철저하게 추진해나가겠다”고 말했다.

리스트바로가기

헤드라인

빅데이터 라이프

재계뉴스

상단으로 이동