메뉴

검색

정치

여권 유력 대선 주자 10월 한달간 빅데이터 분석…정보량 '이재명>이낙연'

'긍정률' 이낙연 대표 높고 '부정률'은 이재명 지사 더 낮아…연령별 포스팅 이재명 '20대' 1위 이낙연 '50대' 1위

2020-11-19 11:17:45

자료 제공 = 글로벌빅데이터연구소(배치 순서는 정보량 순, 이하 동일)
자료 제공 = 글로벌빅데이터연구소(배치 순서는 정보량 순, 이하 동일)
[빅데이터뉴스 김수아 기자] 여권 유력 대선 주자인 '이낙연 더불어민주당 대표'와 '이재명 경기도지사'에 대한 총 정보량(온라인 포스팅 수)을 집계한 결과 지난 10월엔 이재명 지사가 이낙연 지사를 앞선 것으로 나타났다.

19일 빅데이터뉴스와 글로벌빅데이터연구소가 공동으로 지난 10월1~31일 기간을 대상으로 ''뉴스를 제외한 '11개 채널(커뮤니티·블로그·카페·유튜브·트위터·인스타그램·페이스북·카카오스토리·지식인·기업/조직·정부/공공) 21만개 사이트'를 대상으로 빅데이터 분석한 결과 이같이 나타났다.

지난달 온라인 포스팅 수의 경우 이재명 지사는 4만2898건을 기록, 이낙연 대표 2만7312건에 비해 1만5586건 앞질렀다.
이는 허위사실 공표 혐의로 기소된 이 지사가 지난달 중순 파기환송심에서 최종 무죄를 선고 받으면서 트위터를 중심으로 포스팅 수가 늘어난 영향도 있다.

참고로 포스팅수 집계시 성인 도박 거래 스포츠 부동산 게임 증권 광고 및 공통글은 분석에서 제외했다.

여권 유력 대선 주자 10월 한달간 빅데이터 분석…정보량 '이재명>이낙연'


이재명 지사와 이낙연 대표의 10월 호감도를 조사한 결과 긍정률의 경우 이낙연 대표 7.7%, 이재명 지사 5.3%로 이낙연 대표가 2.4%P 앞섰다.

부정률의 경우엔 이재명 지사 37.8%, 이낙연 대표 38.9%로 이재명 지사가 1.1%P 낮았다.

통상적으로 정치권 빅데이터의 경우 긍정률은 낮고 부정률이 매우 높은게 특징인데 이에 따라 중립어를 사실상 긍정 시그널로 해석하는 의견도 있다.

정치인에 대해 중립적인 용어를 구사하면서 포스팅할 경우 어느 정도 호감이 있기에 가능하다는 분석이 뒷받침하기 때문이다.

이럴 경우 '긍정률+중립률'을 순호감도로 볼수 있는데 '순호감도'의 경우 이재명지사 62,3%, 이낙연 대표 61.1%로 이 지사가 1.2%P로 근소하게 앞섰다.

빅데이터 호감도 면에서는 이재명 지사와 이낙연 대표간 우열을 가리기 어렵다는 뜻이다.

여권 유력 대선 주자 10월 한달간 빅데이터 분석…정보량 '이재명>이낙연'


이재명 지사와 이낙연 대표의 채널별 포스팅수를 비교했다.

이재명 지사의 경우 트위터 정보량이 2만5880건으로 전체 60.33%에 달했으며 디시인사이드·보배드림·엠엘비파크·루리웹·에펨네이션·루리웹·38커뮤니케이션·네이버금융·일간베스트저장소 등 수많은 '커뮤니티'의 정보량이 1만956건(25.54%), 블로그 2442건(5.69%), 카페 1863건(4.34%), 유튜브 859건(2.0%), 기타(인스타그램·카카오스토리·지식인·기업/조직·정부/공공 등 5개 채널은 각 200건 미만), 페이스북 362건(1.33%) 순이었다.

이낙연 대표 역시 트위터 정보량이 1만2198건으로 1위였지만 전체 점유율은 44.66%에 그쳤으며 오히려 커뮤니티 비중은 1만234건 37.47%로 이 지사보다 높았다.

이어 블로그 1879건(6.88%), 카페 1692건(1.93%), 기타(인스타그램·카카오스토리·지식인·기업/조직·정부/공공 등 5개 채널은 각 200건 미만) 421건(1.54%), 페이스북 362건(1.33%) 순으로 나타났다.

참고로 리트윗된 정보는 집계하지 않는데 트위터를 포함, 리트윗된 포스팅까지 집계할 경우 정보량은 크게 늘어난다.

여권 유력 대선 주자 10월 한달간 빅데이터 분석…정보량 '이재명>이낙연'


이재명 지사와 이낙연 대표의 포스팅 글에서 어떤 단어가 많이 언급됐는지를 나타내주는 '연관어'를 분석했다.

분석 때 이재명 지사의 경우 '경기도'와 '도지사' 키워드는 제외했으며 이낙연 대표는 '민주당'과 '대표' 키워드는 제외했다.

또 '못하다'라는 키워드도 공통적으로 제외했는데 이는 '못하다'란 단어의 경우 본래 의미보다는 '하다못해' 등 보조형용사나 보조동사로 쓰이는 경우가 많기 때문이다.

분석결과 이재명 지사의 1위 키워드는 '이낙연 이재명'으로 총 4946건에 달했다. 많은 국민들이 이낙연 대표와 이재명 지사의 지지율에 대해 관심을 가지고 있다는 방증이다.

이 지사 연관어 2위는 '국민'으로 4682건이었으며 '대통령' 3808건, '민주당' 3327건, '생각' 2749건, '대선' 2551건, '정책' 2239건, '옵티머스' 2132건, '이낙연' 2059건 순이었다.

이낙연 대표의 경우 '이재명' 6192건, '이낙연 이재명' 4946건, '대통령' 3688건, '국민' 3684건, '더불어민주당' 3054건, '생각' 2140건, '정부' 2114건, '대선' 2085건, '후보' 2080건 순이었다.

여권 유력 대선 주자 10월 한달간 빅데이터 분석…정보량 '이재명>이낙연'


이재명 지사와 이낙연 대표를 키워드로 해서 온라인 글을 올린 사람들의 프로필을 살펴봤다.

이 경우 자신의 프로필을 드러낸 사람들을 대상으로 집계하는 것으로 표본수가 전체 정보량보다는 적어서 실제 수치와는 다를수가 있다.

이재명 지사의 경우 '남성' 포스팅이 76.4%로 '여성'(23.6%)에 비해 압도적으로 많았다. 지난 10월 한달간 대한민국 전체 포스팅의 77.9%가 여성이고 남성의 포스팅은 22.1%에 그쳤다는 것을 감안하면 이 지사에 대한 관심도는 남성들이 크게 높은 것으로 평가된다.

이지사를 포스팅한 사람들의 연령대를 보면 '20대'가 33.6%로 1위였으나 같은 기간 대한민국 전체 포스팅의 51.4%를 20대가 올렸다는 것을 감안하면 20대의 관심도는 상대적으로 떨어진다고도 볼수 있다.

2위는 '50대' 32.8%로 전체 포스팅 1.9%에 비한다면 사실상 50대로부터 큰 관심을 받는다고 평가할수 있다.

이 지사에 대한 지역별 포스팅 1위는 '서울'이 47.0%로 나타나 같은 기간 전체 포스팅 31.3%에 비해 높다. '경기'도지사임에도 불구하고 서울보다 인구가 350만명 이상 많은 경기도 거주자보다 서울 거주자 포스팅 수가 많은 것은 이 지사가 전국적인 인물 반열에 본격적으로 올랐다고 볼수 있다.

2위는 '경기도' 21.4%로 전체 데이터 점유율 18.6%보다 높았다. 3위를 기록한 '부산'의 경우 전체 데이터 점유율보다 상당폭 낮아 향후 이 지역에 대한 전략 수립도 필요할 것으로 보인다.

낙연 대표의 경우 '남성' 포스팅 비율이 이 지사보다 높은 84.7%에 달해 눈길을 끌었다. '여성' 포스팅 비율은 15.3%에 그쳤다.

연령별로는 '50대'가 44.3%로 역시 이 지사에 대한 50대 관심도보다 더 높았다. '20대' 관심도는 이 지사보다는 낮았다. 이는 이 지사가 공공앱 개발등 젊은층의 관심이 높은 분야에 대한 언급이 있었기 때문으로 분석된다.

이낙연 대표의 지역별 관심도를 보면 '서울'은 52.1%로 이 지사보다 높은데 비해 '경기도'는 10.8%로 이'지사보다 낮았다.

이낙연 대표에 대한 관심도 3위 지역은 '전라남도'로 전체 데이터 점유율 2.2%보다 2.5배 높은 5.5%에 달했다. '부산'의 경우엔 이지사와 비슷해 이낙연 대표 역시 부산 지역에 대한 관심이 더 필요할 것으로 보인다.

김수아 빅데이터뉴스 기자 news@thebigdata.co.kr
리스트바로가기

헤드라인

빅데이터 라이프

재계뉴스

상단으로 이동