빅데이터 공통기반 ‘혜안’을 활용한 소셜분석: 대전 ‘트램’을 중심으로
초록
이 연구는 갈등 이슈가 소셜 웹(Social Web)에서 어떻게 나타났는지를 분석했다. 정부가 구축한 빅데이터 공통기반 플랫폼 ‘혜안’을 활용해 대전시의 도시철도 2호선 ‘트램’의 정책결정과정에서 나타난 주요 이슈들을 소셜분석했다. ‘트램’을 키워드로 4년간의 뉴스 및 블로그·트위터를 4개의 시기로 나눠 분석한 결과 뉴스가 80%이상을 차지했지만 트램을 결정한 1시기에는 새로운 교통수단에 대한 시민들의 관심과 찬반 논쟁이 트위터(55.2%)에서 뜨거웠다. 주요 키워드로 검색된 ‘노면전차’, ‘교통약자’, ‘정치자금법 위반 혐의’, ‘시장직’, ‘시민들’, ‘예타 면제’ 같은 단어들은 각 시기별 특성을 반영했다. 정책을 결정(1시기)한 자치단체장이 정치자금법 위반 혐의로 시장직을 상실(2시기)한 시기에는 ‘문제’, ‘논란’, ‘어렵’, ‘우려’와 같은 부정 키워드들이 주를 이뤘다. 특히 뉴스 검색에서는 기자회견이나 성명서 등 보도자료 중심의 기사가 대부분이어서 언론의 심층 기획보도가 부족함을 드러냈다. 이 연구를 통해 지방자치단체가 범정부 빅데이터 시스템인 ‘혜안’을 통해 정책을 개발하고 민의(民意)를 파악함으로써 사회적 갈등 관리에 활용할 수 있다는 것을 알게 되었다. 또한 갈등 이슈에 대한 언론의 적극적인 취재보도의 필요성도 확인했다.
Abstract
This study analyzed big data to investigate how conflict issues are reflected in social webs. For this, social analysis was performed on the policy-making process for the urban rail transit no. 2 of Daejeon City, “tram,” using the big data platform “Hyean,” which was established by the Korean Government. An analysis of “tram” with keywords in four different stages revealed news to account for more than 80%. During stage 1, when it was decided to operate the tram, the citizens’ positive and negative responses toward the new transport system were massive on Twitter (55.2%). Major keywords, such as ‘trolley car,’ ‘the transportation vulnerable,’ ‘alleged violation of the Political Fund Law,’ ‘mayoralty,’ ‘citizens,’ and ‘the pre-feasibility study exemption’ reflected the characteristics of the time. During stages one and two, when the major who had made the policy was relieved of his post due to a violation of Political Fund Law, negative keywords, including ‘issues,’ ‘controversy,’ ‘difficult,’ and ‘concern’, were used widely. In particular, negative public opinion was evident on Twitter throughout the stages one to four. This study showed that local governments also need to utilize big data to identify public opinion, develop and promote policies, and manage conflicts to increase administrative efficiency.
Keywords:
Big Data, Social Analysis, Policy-Making, Conflict Management, Tram키워드:
빅데이터, 소셜분석, 정책결정, 갈등관리, 트램1. 문제제기 및 연구목적
세계경제포럼(World Economic Forum)이 2012년 10대 신기술 중 첫 번째로 빅데이터를 선정한1) 후 빅데이터는 데이터의 양적 증가뿐 아니라 4차 산업혁명, 사물인터넷, 인공지능 등과 결합하면서 우리 생활에 깊숙이 자리 잡았다.
구글, 애플, 아마존, 페이스북 같은 글로벌 기업들은 급변하는 사용자들의 심리를 정책에 반영하기 위해 발 빠르게 움직이고 있으며 정부 차원에서도 교통·안전·보건·복지 등 사회 전 분야에 걸친 빅데이터 기반의 정책들을 마련하고 있다.
미국 정부는 2017년 연방통계혁신보고서와 증거기반 정책수립보고서를 발표했으며 영국도 같은 해 ‘정부혁신전략’을 내놓았다. 일본 정부는 2017년 통계개혁추진회의 보고서를 발표한 데 이어 2018년에는 ‘데이터추동사회로의 혁신’이라는 부제가 붙은 ‘미래투자전략 2018’을 발표했다(정용찬, 2018). 국가와 미래사회의 정책운용에 효율성을 향상시키기 위해 빅데이터가 차지하는 의미가 급격히 증가하고 있음을 반영하는 것이다.
우리나라에서도 2011년 ‘빅데이터를 활용한 스마트 정부 구현(안)’을 시작으로 2012년 행정안전부의 ‘스마트 국가 실현을 위한 빅데이터 마스터플랜’, 2012년 방송통신위원회의 ‘빅데이터 서비스 활성화 방안’ 등 빅데이터를 기반으로 한 정책개발을 하고 있다(국가정보자원관리원, 2019).
지방자치단체들도 빅데이터 활용과 관련 산업 육성을 위한 조례 제정은 물론 전담조직 및 인력 확보에 나서고 있다(최봉, 윤종진, 2018). 가장 먼저 서울시는 2013년 KT의 휴대전화 빅데이터를 분석해 심야버스(올빼미버스)의 노선과 배차간격을 조정했다. 2015년 공공데이터 포털을 오픈한 경기도는 생활밀착형 공공데이터를 공개하는 한편 외래 관광객 패턴 분석(2016년), 119구급차 배치 및 운영 최적화 분석(2017년) 등에 활용했고 대전시도 소방서 및 안전센터 구급출동 현황분석(2016년)과 긴급차량 출동지연요인 분석(2017년)을 실시했다.
하지만 지자체 빅데이터 담당자를 대상으로 조사한 결과를 보면 전담조직과 인력 부족, 빅데이터 분석에 대한 현업부서의 인식 부족, 분석을 위한 데이터 확보의 어려움 등으로 빅데이터 사업추진에 어려움을 겪고 있었다(김유석, 2017).
이에 본 연구는 범정부 빅데이터 공통기반 플랫폼 ‘혜안’을 활용한 소셜분석을 통해 여론의 흐름을 읽고 이를 정책에 반영할 수 있는 방안을 도출해보고자 한다. ‘혜안’의 소셜분석은 전문가의 도움 없이도 데이터의 수집과 분석이 가능하다.
대전시민의 숙원사업으로 20년 이상 논란을 거듭한 도시철도 2호선 ‘트램’을 연구대상으로 삼아 정책 변화의 시기마다 뉴스 및 블로그, 트위터에서 여론이 어떻게 변화되었는지를 살펴보고자 한다.
또한 지방자치단체가 정책을 결정하는 데 있어 민의(民意)를 효율적으로 파악하고 갈등 관리에 빅데이터 분석을 활용할 수 있을지도 탐색해보려고 한다. 특정 이슈에 대한 주민들의 인식을 알아보기 위해 주로 여론조사를 시행하는데 ‘혜안’을 통한 소셜분석에서는 뉴스는 물론 블로그와 트위터에서의 긍정·부정의 반응을 실시간 파악할 수 있어 여론을 파악하는 또 다른 방법이 될 것으로 보인다.
2. 이론적 배경
1) 빅데이터의 개념 및 연구 동향
빅데이터(Big Data)에 대한 학계에서의 합의된 정의는 없지만 ‘정형 또는 비정형을 포함하는 대용량의 데이터’라고 보는 데는 이견이 없는 것 같다.
가트너(Gartner, 2012)는 빅데이터에 대해 “대량의 데이터가 실시간으로 끊임없이 다양한 형태로 들어오는 것”이라고 했고 맥킨지(McKinsey, 2011)는 “일반적인 데이터베이스 소프트웨어로는 수집, 저장, 관리, 분석하기 어려운 정도의 큰 규모의 데이터”라고 보았다. 갠츠(Gantz, 2011)는 “다양한 종류의 대규모 데이터로부터 가치 있는 정보를 추출할 수 있는 기술”이라고 했으며 최해옥(2012)은 “단순한 데이터 양의 증가가 아니라 데이터의 형식과 입출력 속도 등 수집, 저장, 검색, 분석이 어려운 데이터를 총칭해서 일컫는 용어”라고 설명했다.
이처럼 데이터의 양적 증가에서 출발한 빅데이터는 활용 목적에 따라 정의와 특징이 조금씩 다르기 때문에 엄밀하게 정의하기보다는 데이터와 기술 등 생태계를 아우르는 새로운 개념적 틀로 접근하는 것이 타당할 것으로 보인다.
연구자의 목적에 따라 다양하게 수집되는 빅데이터 분석은 <그림 1>에서처럼 크게 내용기반분석(content based analysis)과 구조기반분석(structure based analysis)으로 구분할 수 있다. 내용분석에는 토픽모델링과 텍스트 마이닝이, 구조분석에는 소셜 네트워크 분석이 해당된다.
이 연구에서 사용한 토픽모델링은 비정형 데이터를 정형화된 데이터로 변형하는데 텍스트 마이닝 기법이 활용되며 텍스트 내의 단어를 분석해 주제를 도출하는 방법론이다(Blei, 2012). 텍스트 마이닝은 텍스트 형태의 데이터에 마이닝 기법을 적용한 것으로 대규모 비정형 형태의 텍스트 안에 숨겨져 있는 의미 있는 지식을 찾아내는데 탁월하다(Oh, 2019). 특히 온라인 뉴스와 블로그, SNS(Social Network Service)에 남겨진 소셜 텍스트 데이터는 사용자들의 감정, 의견, 소감 등과 같은 비정형 데이터를 포함하고 있어(김해원, 전채남, 2014) 이를 분석하면 다양한 인식, 여론을 파악할 수 있고 의사결정이나 트렌드 예측을 가능하게 해준다(류시영, 유선욱, 2017). 우리나라 만3세 이상 인구의 91.5%가 인터넷을 사용하고 있으며 이중 65.2%가 SNS(트위터, 페이스북, 인스타그램 등)를 이용하기에 그 활용도가 높기 때문이다.2)
소셜 미디어상의 빅데이터 연구 동향을 살펴보면 주로 여행·관광, 축제, 음식, 스포츠, 미용 등 이용자 인식연구를 통해 감성과 여론의 흐름을 파악하는데 활용되고 있다.
뉴스, 블로그, 트위터 등 소셜 빅데이터 분석을 통한 관광 및 축제, 여행 실태 파악과 인식 연구로 박로운, 이기훈(2016)은 전라북도 내 관광지 특성 및 관광자원간의 연결성을 파악했다. 이수희, 박득희, 김맹선(2018)은 소셜 빅데이터 분석을 활용해 한한령(限韓令·한류금지령) 전후의 제주도 관광인식을 비교했다. 이들 연구는 대부분 국내 포털사이트인 네이버(Naver)와 다음(Daum)의 블로그, 카페에서 수집한 빅데이터를 텍스트 마이닝 하거나 사회연결망 분석(Social Network Analysis)을 했다.
키워드 분석도 있는데 대부분 주제어를 추출하고 의견 마이닝을 통해 긍·부정 감성을 분석한 연구다. 이정학, 이재문, 장용석(2017)은 소셜 네트워크 빅데이터 분석을 통해 2018평창올림픽에 대한 키워드와 문제점을 찾아냈고 오익근, 장미화, 윤영일(2017)은 소셜 미디어 빅데이터 분석으로 대구의 각 자치구별 대표음식 10가지를 뽑고 이에 대한 인식을 살펴보았다. 류시영, 유선욱(2017)은 강원도 관광에 대한 이슈와 관광객들의 긍·부정 평판을 분석해냈다.
본 연구와 관련된 중앙정부 및 지방자치단체들의 빅데이터 동향 연구도 있다. 김도우(2017)는 치안분야에서의 국내외 빅데이터 활용사례를 분석했고 김용진, 김도영(2018)은 전국 이슈와 차별화된 지방자치단체의 정책 이슈를 도출하는 데 있어 빅데이터 분석 방법론을 제시했다. 지방자치단체의 빅데이터 추진 현황을 다룬 김유석(2017)은 빅데이터 분석 사업이 행정과 주민서비스에 도움이 된다는 확신을 가지고 단체장과 현업부서에서는 중장기적 마스터플랜을 마련해야 한다고 제안했다. 아울러 범정부 빅데이터 공통기반 플랫폼 ‘혜안’을 적극 활용할 필요가 있음을 지적했다.
이 연구에서는 중앙 및 지방정부의 빅데이터 연구 동향을 토대로 지역의 갈등이슈가 정책 환경 변화에 따라 뉴스 및 블로그, 트위터에 어떻게 나타났는지를 ‘혜안’을 활용해 소셜분석했다.
2) 대전 도시철도 2호선 ‘트램(Tram)’ 사례
대전 도시철도 2호선에 대한 건설 논의는 1996년 1호선 착공과 더불어 시작되었지만 대중교통정책과 연계한 비전보다는 ‘기관장 소신’에 따라 오락가락하며 시간만 끌어왔다.3) 2006년 개통한 1호선과 달리 2호선은 시장이 바뀔 때마다 건설방식과 차량, 노선을 놓고 논란이 거듭됐기 때문이다.
2012년 11월 우여곡절 끝에 ‘고가(高架) 자기부상열차’로 정부의 예비타당성조사(이하 예타)를 통과한 2호선은 2014년 권선택 시장이 취임한지 5개월 만에 노면전차(路面電車) 트램(Tram)으로 전면 개편하면서 또다시 표류했다. 이미 정부의 예타를 통과한 대전광역시(이하 대전시)는 건설방식 자체가 바뀜에 따라 2016년 국토교통부에 2호선 기본계획 변경안 승인을 요청했지만 통과는 쉽지 않은 상황이었다. 예타를 다시 받아야할 가능성이 높은 데다 도심 도로를 자동차와 트램이 함께 달리기 위해서는 이른바 ‘트램 3법’으로 불리는 도시철도법, 철도안전법, 도로교통법을 개정해야 한다는 것이었다.4) 이런 상황에 당시 지방자치단체장이던 권선택 시장이 2017년 11월 대법원에서 정치자금법 위반 혐의로 낙마하면서 대전시의 트램 정책도 동력을 잃게 됐다. 시장 권한대행을 맡은 행정부시장이 트램의 정상 추진을 약속했지만 이듬해 새 시장 선출 때까지 트램은 물론 다른 지역 현안들도 ‘올스톱’ 되었다.5)
2018년 지방선거에서 당선된 허태정 시장은 10대 공약에 2호선 사업을 넣지 않을 정도로 트램 건설에 큰 관심을 표하지 않았다. “현재로서는 노선과 방식을 바꿀 수 없으니 타당성 재조사 결과를 지켜보겠다”는 취지였다.6) 새 시장 취임 후에도 진전이 없던 트램은 2019년 1월 정부의 예타 면제 사업에 포함되면서 다시 추동력을 얻게 되었다.
트램은 대전 도심 36.6㎞를 달리는 순환형으로 8,191억 원의 사업비를 투입해 35개 정거장과 1개 차량기지를 설치하고 2025년 개통예정이다.7) 하지만 트램이 기존 차로를 이용하는 만큼 차로잠식과 교통체증 우려 목소리가 여전하다.8)
이 연구에서는 20년을 끌어온 시민 숙원이자 갈등 이슈인 대전 트램을 4개의 중요시기로 나눠 정책 환경의 변화에 따라 뉴스 및 블로그, 트위터에서 여론이 어떻게 나타났는지를 알아보려고 한다.
3) 빅데이터 공통기반 플랫폼 ‘혜안’
본 연구의 자료처리를 위해 빅데이터 공통기반 플랫폼 혜안(www.insight.go.kr)을 활용하였다. ‘혜안’은 공공 및 민간의 데이터를 연계·수집·저장·분석하고 결과를 공유·활용하는 범정부(중앙부처 및 지자체) 빅데이터 분석시스템이다.
행정안전부는 2013년 빅데이터 기술 적용 시범분석을 시작으로 2015년 빅데이터분석과를 신설해 ‘혜안’을 구축했다. ‘혜안’은 국가정보자원관리원이 관리 운영하는데 중앙부처 및 지방자치단체와의 분석과제 발굴과 추진을 통해 빅데이터 공통기반의 분석 서비스를 다양화하고 있다.
<그림 2>는 빅데이터 공통기반 플랫폼 ‘혜안’의 추진체계인데 국가정보자원관리원과 정부혁신조직실, 공공빅데이터협의회는 물론 부처·지자체 및 주요 포털과의 연계를 통해 빅데이터 융복합 정보들을 분석 활용하고 있다.
‘혜안’의 이용자가 중앙부처 및 지자체 공무원이라는 제한이 있지만 최신의 데이터를 실시간 분석한 결과를 행정에 즉시 활용할 수 있으며 업무 담당자가 직접 분석을 수행할 수 있으니 예산 절감의 효과도 있다. ‘혜안’의 가입자 수는 2019년 기준 10만 명을 넘어섰고 국가정보자원관리원은 지속적인 교육을 통해 공무원들의 빅데이터 분석 활용 능력을 향상시키고 있다.
중앙부처 및 지자체는 ‘혜안’으로 민원분석, 소셜분석, 위치기반분석, 텍스트 분석을 수행해 업무에 적용하고 있다. 대표적 활용사례로는 CCTV 및 보안등 사각지대 선정(수원시, 2014년)을 비롯해 교통카드 데이터를 이용한 탄력배차제 대상 노선 발굴(전주시, 2015년), 전자통관시스템 상담내역분석(관세청, 2016년), 시티투어 노선 최적화(제주시, 2017년) 등이 있다. 전주, 순천, 강진 같은 지자체에서는 지역축제 및 관광지에 대한 소셜 웹 데이터를 분석해 여론의 흐름과 긍·부정 키워드를 통한 지역 이미지 개선에 활용한바 있다.
하지만 지역 현안이자 갈등이슈에 대한 여론흐름을 장기간 비교분석한 사례는 아직 없다. 이에 본 연구에서는 ‘혜안’의 소셜분석 기능을 활용해 대전 도시철도 2호선 ‘트램’에 대한 뉴스 및 블로그, 트위터 등에 나타난 여론의 정보를 분석하고자 한다.
3. 연구문제 및 연구방법
1) 연구문제
이 연구는 시장의 취임과 낙마, 새로운 의사결정 등 환경변화에 따라 정책이 바뀌면서 이에 대한 여론이 어떻게 나타났는지를 알아보기 위한 것이다. 대전시민의 오랜 숙원사업인 도시철도 2호선의 건설방식이 자기부상열차에서 트램으로 바뀐 후 4년간을 주요 시기별로 나눠 분석했다. 이에 따른 연구문제는 다음과 같다.
- ∙연구문제 1. ‘트램’ 관련 키워드의 발생빈도는 시기별로 차이가 있는가?
- ∙연구문제 2. ‘트램’ 관련 주요 키워드는 시기별로 차이가 있는가?
- ∙연구문제 3. ‘트램’ 관련 긍·부정 키워드의 분포는 시기별로 차이가 있는가?
2) 연구방법
이 연구는 대전 도시철도 2호선 트램에 대한 소셜 빅데이터 분석이다. 소셜분석은 관심 키워드에 대한 소셜 웹(뉴스·블로그·트위터) 데이터를 분석하는 것이다. 키워드와 함께 포함어 및 배제어를 반영할 수 있으며 분석기간을 설정해 기간별 비교분석도 가능하다. 키워드의 검색 추이를 통해 시기에 따른 여론의 동향을 파악할 수 있으며 키워드 관련 이슈가 언제 급증했는지도 확인할 수 있다.
분석 키워드는 ‘트램’으로 설정했으며 대전만을 대상으로 하기 위해 ‘대전’을 포함어로 삼았다.
분석 시기는 4개시기로 구분했다. 대전 도시철도 2호선이 20년 이상 지속된 지역현안인 만큼 건설방식 변경, 시장 낙마, 새 시장 취임, 예타 면제 확정 등 주요한 환경 변화에 맞춰 비교하기 위해서다.
1 시기는 도시철도 2호선 건설방식을 자기부상열차에서 트램으로 변경한 2014년 12월이며 2시기는 트램을 결정한 시장이 정치자금법 위반 혐의로 낙마한 2017년 11월이다. 3시기는 민선 7기 새 시장이 취임한 2018년 7월이고 4시기는 트램이 정부의 예타 면제 사업으로 확정된 2019년 1월이다. 각 시기별로 한 달씩을 대상기간으로 한정했다.
분석데이터 정보는 <표 1>과 같다.
분석은 빅데이터 공통기반 플랫폼 ‘혜안’을 활용했다. ‘혜안’은 공공·민간의 데이터를 연계·수집·저장 분석하고 결과를 공유·활용하는 범정부 빅데이터 분석시스템으로 전문가가 아닌 일반 공무원도 키워드 입력만으로 소셜 웹 데이터를 실시간 검색 분석할 수 있다. 네이버·다음·구글의 포털사이트에서 60개 언론사, 63개 사이트의 뉴스를 비롯해 네이버·다음의 1만 8,600여개 블로그, 437개의 영향력 있는 트위터 계정을 대상으로 데이터를 수집했다. 뉴스와 블로그는 5분 단위로, 트위터는 30분 단위로 수집이 이뤄진다.
분석처리 도구인 SRA(Smart R Analytics)는 오픈소스 R을 기본 분석 엔진으로 사용하며 정형·반정형·비정형 데이터에 대한 일반 통계 분석 및 고급분석을 수행할 수 있는 웹 기반의 분석처리 도구다. 공개 SW통계프로그래밍 언어인 R은 데이터 마이닝(Data Mining), 토픽모델링, 시각화 등 데이터 분석을 위한 요소들을 폭넓게 갖추고 있어 대용량 데이터와 비정형 데이터 분석에 효과적이다(국가정보자원관리원, 2019).
4. 연구결과
1) ‘트램’ 관련 키워드 발생빈도
빅데이터 분석시스템 ‘혜안’에 ‘트램’을 키워드로 설정하고 ‘대전’을 포함어로 삼아 소셜분석한 결과 시기별로 수집된 데이터 건수는 <표 2>와 같다.
‘트램’을 키워드로 뉴스 및 블로그, 트위터에서 수집된 총 데이터의 건수는 1,612건이다. 2호선의 건설방식을 자기부상열차에서 트램으로 변경 발표한 1시기에는 뉴스 161건, 블로그 40건, 트위터 247건 등 448건이 수집되었고 현직 시장이 정치자금법 위반으로 직을 상실한 2시기에는 뉴스 259건, 블로그 37건, 트위터 15건 등 311건이 검색되었다. 새 시장이 취임한 3시기는 132건(뉴스 111건, 블로그 19건, 트위터 2건)으로 다른 시기에 비해 가장 적었으며 트램이 정부의 예타 면제 사업으로 확정된 4시기에는 가장 많은 721건(뉴스 587건, 블로그 14건, 트위터 120건)이 검색되었다.
시기별로는 4시기의 검색 건수가 가장 많았지만 대부분 뉴스(81.4% )였으며 건설방식을 트램으로 결정한 1시기는 뉴스 161건, 트위터 247건으로 트위터에서의 검색이 뉴스(35.9%)보다 많은 55.2%를 차지했다. 각 시기별 뉴스와 블로그, 트위터에서의 검색 건수를 요약하면 <그림 3>과 같다.
그림에서 보듯 나머지 세 시기에서는 뉴스 검색이 80%이상을 차지했지만 1시기에는 뉴스(35.9%)보다 트위터(55.2%)에서 ‘트램’이 더 많이 검색되었다. 이는 새로운 교통수단에 대한 시민들의 관심이 높다는 것과 함께 전임 염홍철 시장이 도시철도 2호선의 건설방식을 ‘고가 자기부상열차’로 결정하고 퇴임한 후 권선택 시장이 취임 5개월 만에 트램으로 전격 변경한 데 대한 논란이 뉴스뿐 아니라 트위터에서도 뜨거웠음을 보여준다.
이 시기 트위터 반응을 살펴보면 트램 관련 기사를 공유하면서 ‘박물관에서나 볼 수 있었던 트램을 대전시가 부활(@gldlfkrl12)’, ‘한밭대로는 지금도 교통 체증을 견디기 힘든데 차로를 두개나 줄였다간(@ETinseon)’, ‘트램도 별로지만 고가는 노답임(@nudimmud)’, ‘지하철에서 고가철도, 트램으로 뒤죽박죽(@ladenijoa)’과 같은 의견들이 분분했다.
<그림 4>는 ‘트램’에 대한 뉴스 및 블로그, 트위터에서의 검색 추이다. 각 시기별로 한 달씩 검색한 결과 특정 이슈가 발생한 시기를 중심으로 관련 키워드가 집중된 것을 알 수 있다.
건설방식 변경(1시기), 시장 낙마(2시기), 새 시장 취임(3시기), 트램 예타 면제 사업 선정(4시기) 등 시기별로 관련 이슈 발생 일을 기점으로 하루 이틀정도 검색이 집중되는 모습이었다.
1 시기에서는 2014년 12월 4일 권선택 시장이 기자회견을 통해 도시철도 2호선 건설방식을 트램으로 전격 발표한 후 뉴스(33건)를 중심으로 트위터(140건)에서 관련 검색이 몰렸다. 하지만 다음날인 12월 5일에는 뉴스 14건, 트위터 17건으로, 12월 6일에는 뉴스 1건, 트위터 6건으로 급격히 관심이 떨어졌다. 이는 4시기에도 같았는데 2019년 1월 29일 정부의 예타 면제 사업으로 트램이 확정된 다음날 242건의 뉴스와 78건의 트위터 검색이 나타난 후 1월 31일에는 뉴스 15건, 트위터 19건으로 대폭 감소했다.
반면 2017년 11월 14일(2시기) 시장이 대법원 확정판결로 직을 상실하자 뉴스를 중심으로 트램 관련 검색이 지속됐다. 시장 낙마 후 도시철도 2호선의 정책 추진을 우려하는 보도들이 잇따랐고 이에 대한 트위터와 블로그 반응도 이어졌기 때문이다.
새 시장이 취임한 3시기도 비슷했다. 2018년 7월 1일 시장 취임 후부터 트램 검색이 늘기 시작했는데 언론과의 인터뷰에서 시정 비전을 밝히는 뉴스를 중심으로 관련 이슈가 만들어졌다. 하지만 주로 뉴스에서만 트램이 다뤄졌을 뿐 트위터에서는 한 달 동안 7월 1일과 7월 30일 각 한 건씩만 검색되었고 다른 날에는 전무했다. 블로그에서의 트램 검색도 소량(1~3건)이었다. 트위터와 블로그에서 트램이 검색되지 않은 것은 새 시장의 주요 공약에 트램이 없었으며 언론 인터뷰에서 “예비 타당성 재조사 결과를 지켜보겠다”9)는 식으로 유보적 입장을 취했기 때문으로 풀이된다.
각 시기별 트램 관련 키워드 발생빈도를 살펴본 결과 기자회견 등 특정 이슈를 발표한 날을 중심으로 하루 이틀 검색이 집중되었다. 또 시장이 낙마한 2시기처럼 언론이 특정 이슈를 지속적으로 보도할 경우 뉴스를 중심으로 다양한 의견이 개진되는 것을 확인했다.
이를 통해 언론이 주민 생활과 밀접한 갈등 이슈에 대해 보도자료를 받아쓰는 데 그칠 게 아니라 찬반에 대한 심층적이고 지속적인 보도를 해야 한다는 것을 알 수 있었다. 아울러 자치단체들도 민감한 갈등 이슈에 대해 일방적인 추진이 아닌 양방향 소통을 통해 여론의 향배를 살피고 정책에 반영하는 노력이 필요하다는 것을 확인했다.
2) ‘트램’ 관련 주요 키워드 분석
‘혜안’에서 트램 관련 뉴스·블로그·트위터 1,612건을 분석해 상위 키워드 10개씩을 추출했다.
시기별 검색 상위 키워드는 <표 3>과 같다.
시기별 공통 키워드로 가장 많이 검색된 단어는 ‘도시철도’ 였으며 트램과 관련한 ‘노면전차’, ‘자기부상열차’, ‘시민들’도 상위 키워드로 나왔다. ‘현안사업’ 키워드는 도시철도 2호선이 대전의 중요 현안이라는 것을 알게 했고 ‘시민들’, ‘교통약자’ 키워드는 대중교통수단인 도시철도 건설 사업에 시민들의 관심이 높다는 것을 보여주었다.
이들 공통 키워드 외에 ‘권선택(1시기)’, ‘정치자금법 위반 혐의(2시기)’, ‘허태정(3시기)’, ‘예타 면제(4시기)’ 키워드는 각 시기별 특성을 반영했다.
1시기에 가장 많이 검색된 키워드는 ‘노면전차’인데 도로상의 일부에 부설한 레일 위를 주행하는 전차로 흔히 ‘트램(Tram)’이라 부른다. ‘도시철도 2호선’의 ‘건설방식’을 놓고 오랫동안 논란을 빚어온 대전시가 새 시장이 취임하며 트램으로 변경했기 때문에 검색이 집중된 것으로 보인다. 트램의 장점으로 꼽히는 ‘교통약자’도 나왔고 ‘세계 각지’와 ‘어떤 모습’, ‘박물관’ 키워드에서는 우리나라 첫 도입 사례가 될 트램에 대한 기대와 관심이 드러났다.
블로그 글을 분석한 결과 “트램은 교통약자의 접근이 용이하지만 교통체증이 유발될 수 있다”10)는 장단점 소개와 “우리가 허영에 들떠 용인시처럼 지방재정 파탄을 가져오지 않으려면 지금까지 무모하게 추진해 온 일들을 하나하나 진지하게 되돌아봐야 한다”11)는 반대 목소리도 있었다.
트위터에서는 ‘박물관에서나 볼 수 있었던 트램을 대전시가 부활(@gldlfkrl12)’, ‘예산낭비 반드시 막아야함. 트램은 건설비가 자기부상열차의 절반도 안 들어(@kazzo2020)’, ‘트램 건설은 혁명적임. 차를 억압하고 대중교통 이용하란 뜻(@ZerialLim)’ 처럼 트램에 찬성하는 의견과 ‘트램으로 변경된 탓에 목표로 했던 2020년 2호선 개통은 꿈도 못 꾸게 됐다(@stpministre)’나 ‘대전에 트램을 놓는 건 난센스(@7godsofchaos)’, ‘2호선 트램 확정 교통지옥도 확정(@NavaAestas)’ 같은 부정적 의견도 보였다.
시장이 낙마한 2시기에는 ‘시장직’, ‘정치자금법 위반 혐의’, ‘집행유예’ 같은 판결 관련 키워드가 도출되었다. ‘도시철도’의 ‘건설방식’을 ‘자기부상열차’에서 트램으로 변경한 주체인 시장이 ‘정치자금법 위반 혐의’로 ‘시장직’을 잃게 되자 ‘시민들’은 ‘현안사업’에 대한 차질을 우려한다는 것을 도출된 키워드에서 읽을 수 있다.
트위터 분석에서는 ‘트램은 이제 다 끝났다(@twice_spring)’, ‘다음 시장이 누가 되든 트램 백지화 들고 나올 텐데 내 생애 대전 도시철도 2호선을 구경할 날은 올까(@Mujiraeng_E)’, ‘대전의 트램이 될 수 있었는데 아깝(@tuta_v)’ 같은 내용들이 있었다. 뉴스를 링크하거나 내용의 일부를 발췌한 블로그에는 “대전시 미래 교통수요에 더 적합한 방식으로 추진해야”12), “예산 정국서 추진력 잃은 대전시 현안 빨간불”13) 같은 의견이 올라왔다.
3시기 새 시장이 취임하면서 도시철도 2호선 문제가 다시 이슈로 부상했다. ‘시민들’은 ‘허태정’시장이 취임함에 따라 ‘지역 현안’인 ‘도시철도’ 문제가 ‘정부 국정과제’에 포함돼 ‘국비사업’으로 추진됨으로써 ‘일자리’ 창출 등 ‘정치권’에 대한 기대를 표출했다는 것을 키워드에서 알 수 있다.
하지만 대부분 뉴스 검색이었을 뿐 이 시기 트위터에 올라온 단 2건의 글은 ‘대전에 트램 깔면 역대급 전시행정(@rapbition)’과 ‘이 대전 트램 같은 ○○들아(@M18HellNeko)’라는 욕설이 있었다. 그러나 블로그에는 “충청권 광역철도망이 완공되면 도시철도 1호선과 2호선 트램이 연계된 교통망이 기대된다”14)거나 “허태정 시장 트램 등 지역현안 해결 광폭행보”15)와 같은 기대감도 드러났다.
트램이 정부의 예타 면제 사업으로 결정된 4시기 키워드에는 ‘예타 면제’가 두 번째로 올랐으며 ‘숙원사업’, ‘사업비’도 검색되었다. 새로운 건설 사업이 확정된 때문인지 블로그에는 부동산 관련 글이 많았는데 역세권을 중심으로 부동산 시장에 대한 기대감16)을 높이는 내용들이었다.
반면 트위터는 정부의 예타 면제 발표 당일과 다음날 관련 기사에 대한 트윗(tweet)과 리트윗(retweet)이 대부분이었는데 ‘대전을 교통지옥으로 만들려고 하는구나(@Enjoyist)’, ‘대전 트램은 상당히 우려되는 사업(@huyfongchicken)’, ‘대전 2호선 트램처럼 도시 현실에 맞지도 않는(@aika_tie)’, ‘트램은 미친 짓(@_lovelyJane)’, ‘사람들이 바란 건 2호선이었지 트램이 아니었는데(@MunchkinYoon)’, ‘안 그래도 지하철 적자인데 더 적자나게 생겼네(@Riveratnights)’와 같은 우려가 많았고 ‘대전시의 트램 건설 플랜, 이건 참 획기적이네(@kimjh71e)’의 찬성 의견도 있었다.
뉴스를 비롯해 블로그, 트위터에 나타난 트램 관련 상위 키워드 10개를 워드 클라우드로 시각화한 것이다(<그림 5> 참조). 글자의 크기가 클수록 소셜에 많이 등장한 키워드다.
분석대상 네 시기에 공통적으로 많이 검색된 키워드는 ‘도시철도’와 ‘건설방식’ 이었으며 ‘현안사업’, ‘지역현안’, ‘숙원사업’ 처럼 ‘시민들’의 관심이 집중돼 있음이 드러났다. 트램을 결정한 1시기에는 트램의 건설방식인 ‘노면전차’에 대한 검색이 가장 많았고 이와 대비되는 ‘(자기)부상열차’도 있었다.
시장이 낙마한 2시기는 ‘현안사업’과 ‘정치자금법 위반 혐의’, ‘시장직’ 처럼 트램 추진에 대한 우려와 함께 ‘행정안전부’, ‘사업비’, ‘내년 지방선거’에서는 트램에 대한 예비타당성 재조사와 차기 지방선거에서 시장이 바뀜에 따라 건설방식이 다시 변경될 수 있을 것이라는 인식이 엿보였다.
새 시장이 취임한 3시기에서는 ‘지역현안’과 ‘정부 국정과제’, ‘국비사업’ 같은 키워드가 두드러졌고 예타 면제가 확정된 4시기는 ‘도시철도’와 ‘예타 면제’ 키워드가 중심을 이뤘다.
이들 키워드들이 뉴스와 블로그, 트위터에서 어떻게 나타났는지 분석한 결과 뉴스는 1시기 161건, 2시기 259건, 3시기 111건, 4시기 587건이었다. <그림 6>은 트램 관련 주요 뉴스의 제목과 내용이다.
1시기 뉴스는 트램 결정 기자회견(2014년 12월 4일)을 시작으로 선정 배경, 환영 또는 반대 목소리, 시정 10대 뉴스 선정, 시장의 송년사 및 신년사, 신년 기자회견이 대부분이었다. 언론은 대전시를 비롯해 시의회, 자치구, 시민단체, 출연연 등이 발표한 자료를 중심으로 ‘환영’, ‘재검토’, ‘반발’ 등의 분위기를 전하는 데 그쳤을 뿐 트램에 대한 심층적인 분석 기획기사가 부족했다.
시장이 낙마한 2시기 뉴스는 시정 현안에 차질이 우려되고 ‘트램 3법’ 처리가 지연된다는 기사가 있었다. 특히 행정부시장이 시장 권한대행을 맡으며 “트램 정상 추진”을 밝혔지만 “2호선 건설방식을 차기 시장이 결정해야 한다”17)는 의견도 나왔다.
새 시장이 취임한 3시기에는 트램 관련기사가 다른 시기에 비해 적었다. 새 시장은 트램을 주요공약으로 내세우지 않았지만 당선 이후 트램이 대전의 숙원사업이라는 점을 들어 국회를 방문해 국비를 요청했다는 기사들이었다. 하지만 정부의 트램 시범사업 공모에 대전시가 지원하지 않음에 따라 전임 시장이 약속했던 시범노선을 새 시장이 포기하는 게 아니냐는 비판18)도 있었다.
트램이 예타 면제 사업으로 확정된 4시기에는 관련 기사가 가장 많았다. 트램의 예타 면제 사업 확정을 알리는 뉴스가 대부분이었고 노선과 정류장, 지역경제 활성화 등 사업의 정상 추진에 대한 기대감이 드러났다. 교통 혼잡, 시민 불편 등을 다루는 기사가 일부 있었으며 노선을 따라 부동산 시장이 들썩이고 있다19)는 내용도 보였다. 하지만 건설방식이 또 어떻게 바뀔지 시민들이 반신반의20)한다는 인식도 여전했다.
트램 뉴스를 살펴본 결과 이슈가 발표된 시점을 중심으로 하루 이틀 보도가 집중됐을 뿐 언론의 다양한 심층 취재보도가 부족했다. 언론의 중요의무가 현안에 대한 밀착 취재와 심층보도로 주민의 알권리 보호다. 그런데 분석대상 언론들은 수천억 원의 사업비가 드는 지역 최대 현안이자 갈등 이슈에 대해 기자회견과 성명서 발표 등을 중심으로 한 단발성 보도에 그쳐 언론의 역할은 물론 의제설정에도 미흡함을 보여줬다.
3) ‘트램’ 관련 감성분석
감성분석은 비정형 데이터를 다루며 어떤 사안이나 이슈에 대한 의견, 평가, 태도, 감성을 분석한다(이정훈, 김민호, 권혁철, 2017). 뉴스, 블로그, SNS, 상품 리뷰 등의 텍스트에서 긍정·부정·중립 등의 감성정보를 추출함으로써 조사 대상에 대한 의견, 관점, 인식 등에 관심을 가진 분석가들에게 유용하게 활용된다(김인겸, 김혜민, 임병환, 이기광, 2016).
이 연구에서는 뉴스, 블로그, 트위터에서 ‘트램’이 어떤 이미지로 드러났는지 알아보기 위해 긍정, 부정, 중립의 키워드로 분석했다. 또 트램과 관련한 주요 이슈들이 등장한 시기별로 긍·부정 이미지가 어떻게 변했는지도 알아보았다.
<그림 7>은 트램 관련 시기별 감성분석 결과다.
1시기에는 긍정(27%)보다 부정(38%)의견이 더 많았고 2시기에는 부정 여론이 48%로 늘어 분석대상 시기 중 가장 높았다. 새 시장이 취임한 3시기에는 긍정의견이 52%로 많아졌으며 4시기에는 긍정(41%)과 부정(40%)여론이 비슷했다.
감성분석 결과를 시기별 긍·부정 키워드로 나눠 워드 클라우드로 시각화 하면 <그림 8>과 같다.
감성분석에서처럼 시장이 트램을 발표하고 낙마한 1, 2시기에는 부정적 키워드들이 우세했으며 새 시장이 취임한 3시기에는 긍정 키워드가 늘어났다. 트램이 예타 면제 사업으로 확정된 4시기에는 긍정과 부정의견이 비슷했다.
특히 1시기에는 ‘발전’이라는 긍정 키워드보다 ‘문제’, ‘논란’, ‘어렵’, ‘우려’ 같은 부정 키워드가 많았고 2시기 역시 ‘낙마’, ‘문제’, ‘우려’, ‘위반’, ‘논란’ 등이 두드러졌다. 3시기에도 ‘문제’, ‘갈등’, ‘불편’ 같은 부정 키워드가 있었지만 ‘발전’, ‘혁신’, ‘노력’, ‘기대’, ‘행복’ 같은 긍정 키워드들이 많이 부각됐다. 4시기에는 ‘발전’, ‘기대’, ‘효과’와 함께 ‘우려’, ‘논란’, ‘반발’, ‘불만’도 남아 있음을 보여줬다.
이들 긍·부정 키워드는 뉴스와 블로그, 트위터의 전체 모습이지만 주로 개인적 의견을 드러낸 트위터에서는 모든 시기에서 부정적 의견이 우세하다는 결과는 눈여겨볼 대목이다.
1시기 트위터 감성분석에서는 ‘교통체증’, ‘현실감각’, ‘욕심’, ‘일 벌이지마’ 같은 부정적 키워드가 많았고 2시기에도 ‘불법선거자금’, ‘불명예 퇴진’, ‘불투명’ 등이 드러났다. 3시기 역시 ‘진짜 역대급 전시행정’이라는 비판이 있었고 4시기에도 ‘논란’, ‘지역 숙원사업 무산’, ‘시민들 불편’ 등이 여전했다.
이는 자치단체가 발표하는 보도자료를 대부분의 언론이 그대로 받아씀으로써 뉴스에서는 긍정적 의견이 많고 트위터에서는 이슈에 대한 개인들의 부정적 의견이 더 피력됐음을 알 수 있었다.
중요 현안에 대한 여론의 향배가 궁금한 지방정부로서는 언론보도 모니터링뿐 아니라 SNS에서의 찬반의견을 반영한다면 주민 눈높이에 맞는 정책추진은 물론 양방향 소통에도 도움이 될 수 있다는 것을 알게 해주는 결과다.
5. 논의와 결론
우리나라가 본격적인 지방자치시대를 맞은 것은 1995년으로 기초의회 의원과 단체장, 광역시·시·도의회 의원과 단체장 선거를 실시하면서부터다. 대통령은 물론 국회의원, 지방자치단체장, 지방의회 의원들까지 모두 주민의 손으로 선출한다.
표를 많이 얻어야 당선되는 선출직들이 가장 많이 하는 이야기가 ‘소통’ 이지만 당선 이후에 받는 비판의 대부분이 ‘소통 부재’다. 자치단체들도 홍보조직 확대와 소식지 발간, 홈페이지, 블로그, 트위터, 페이스북 등 온오프라인에서의 소통을 강화하고 각종 여론조사를 통해 주민 목소리를 정책에 반영하고 있다. 대전시도 공식 홈페이지21)와 블로그,22) 트위터,23) 페이스북,24) 인스트그램25) 등을 운영하고 있다. 하지만 이 연구에서 보면 시민들의 목소리를 듣고 정책에 반영하는 양방향 소통이 부족하다는 것을 알 수 있다.
20여년 논란이 거듭되던 도시철도 2호선이 ‘자기부상열차’로 정부 예타를 통과했음에도 불구하고 새 시장이 취임해 5개월 만에 ‘트램’으로 변경하자 트위터에서는 반대 여론이 뜨거웠다. 이 시기 소셜 웹에서는 트램에 대한 뉴스(35.9%)보다 트위터(55.2%) 검색이 많았으며 트램에 대한 부정(38%)의견이 긍정(27%)에 앞섰다. 정부의 예타 면제 사업에 트램이 포함됨으로써 논란이 일단락된 4시기까지도 트위터에서는 반대의견이 우세하다는 것은 대전시의 트램 정책에 부정적인 생각을 가진 시민들이 적지 않음을 말해준다.
대전시는 2025년 개통을 목표로 트램을 추진하고 있지만 2019년 국정감사에서도 지적26)받았을 정도로 트램에 대한 부정적 여론은 여전하다. 대전시가 트램 정책을 추진하는 과정에서 시민 여론을 더 많이 청취하고 반영했다면 갈등과 혼란을 줄일 수 있었을 것이다. 특히 SNS에서의 부정적 인식을 실시간 확인해 정책에 반영하거나 시민들을 이해시키고 설득하는데 활용했다면 시정의 효율성 또한 높아졌을 것이다.
대전의 중요 이슈인 ‘트램’에 대한 뉴스 및 블로그, 트위터를 분석한 이 연구에서는 언론의 역할이 중요하다는 것도 확인할 수 있었다.
소셜 웹에서의 ‘트램’은 언론이 트램 관련 보도를 하면 블로그와 트위터에서 기사를 인용하거나 링크하는 형태로 나타났다. 블로그에서는 주로 유럽 여행에서의 트램 경험담이 많았지만 트위터에서는 트램 건설방식에 대한 찬반 논쟁이 뜨거웠다.
하지만 대부분의 트램 뉴스는 기자회견과 성명서, 보도자료 등 발표 저널리즘의 수준을 벗어나지 못했다. 발표 저널리즘이란 정보원의 발표에만 의존해 그대로 전재하는 보도관행을 일컫는 것으로 우리 언론이 극복해야 할 부정적 타성 중 하나다. 언론의 핵심 기능이라고 할 수 있는 의제설정의 주도권이 발표자에게 넘어가고 획일화된 보도를 함으로써 결과적으로 다양한 정보에 대한 접근을 차단하는 부정성을 지니고 있다(김동규, 2004).
언론이 지역의 갈등이슈이자 대중교통수단인 도시철도 2호선 문제를 적극적으로 심층 취재 보도했다면 공론장 역할이 가능했을 것이다. 하지만 제대로 된 심층기획 보도를 하지 않은 채 보도자료 중심의 기사를 생산함으로써 여론을 제대로 반영하지 못했을 뿐 아니라 주민 알권리 제공에도 미흡했음을 드러냈다. 뉴스에 대한 감성분석에서는 긍정적 의견이 많은 반면 트위터에서는 분석대상 전체 시기에서 ‘교통체증’, ‘불투명’, ‘시민들 불편’, ‘진짜 역대급 전시행정’ 같은 부정적 키워드가 많다는 것이 이를 잘 말해준다.
이 연구는 지방자치단체가 정책을 결정하는 데 있어 민의를 파악하기 위한 방법으로 정부의 빅데이터 공통기반 플랫폼 ‘혜안’의 활용 방안을 제시했다는 점에서 의미를 지닌다. 빅데이터를 활용해 뉴스, 블로그, 트위터 등 소셜 웹을 분석함으로써 기존의 탑다운 방식의 일방적 정책 추진에서 벗어나 주민과 양방향 소통하며 홍보에 활용할 필요성을 보여주었다. 특히 지역의 갈등이슈에 관한 빅데이터 활용 연구가 많지 않은 현실에서 지방자치단체의 빅데이터 활용 가능성을 제시했다는 측면에서 의미가 있다.
그럼에도 불구하고 이 연구는 대전시의 도시철도 2호선 건설방식인 트램이라는 특정 이슈만을 대상으로 분석을 실시했다는 한계를 지닌다. 후속 연구를 통해 뉴스는 물론 민원, SNS 등 다양한 분야에서의 빅데이터의 분석 연구가 진행될 것으로 기대한다. 범정부 빅데이터 시스템인 ‘혜안’을 통한 이 연구가 지방정부의 정책수립과 결정, 수혜자인 시민 여론을 알아보는 방법론으로 활용되길 바란다.
References
- 국가정보자원관리원 (2019). <빅데이터 전문교육 교재>. 대전: 국가정보자원관리원.
- 김도우 (2017). 공공안전 분야의 빅데이터 정책과 연구동향. <한국행정학회 학술발표논문집>, 3044-3069.
- 김동규 (2004). 발표 저널리즘의 현황과 개선 방향. <언론중재>, 겨울호, 1-18.
- 김용진·김도영 (2018). 빅데이터 분석을 통한 지방자치단체 정책이슈 도출 방법론. <한국콘텐츠학회논문지>, 18(10), 229-235.
- 김유석 (2017). 지방자치단체 빅데이터 추진 현황 및 활성화 방안. 한국지역정보화학회 학술발표대회 논문집, 79-90.
- 김인겸·김혜민·임병환·이기광 (2016). 감성분석 결과와 사용자 만족도와의 관계: 기상청 사례를 중심으로. <한국콘텐츠학회논문지>, 16(10), 393-402.
- 김해원·전채남 (2014). 빅데이터를 활용한 콘텐츠 제작 방안에 관한 탐색적 연구: TV 홈쇼핑을 중심으로. <사이버커뮤니케이션학보>, 31(3), 5-51.
- 류시영·유선욱 (2017). 소셜 미디어에 나타난 강원도 관광에 대한 인식 연구: 빅데이터 분석을 중심으로. <관광연구저널>, 31(2), 63-81.
- 박로운·이기훈 (2016). 빅데이터 분석을 통한 농촌관광 실태와 활성화 방안 연구: 전라북도를 중심으로. <한국지역사회생활과학회지>, 27(S), 665-679.
- 오익근·장미화·윤영일 (2017). 소셜 미디어 빅데이터 분석을 통한 대구 음식에 대한 인식 변화 연구. <관광레저연구>, 29(11), 377-397.
- 이수희·박득희·김맹선 (2018). 소셜 빅데이터 분석을 활용한 제주도 관광 인식에 관한 연구: 한한령 이전과 이후 비교. <관광레저연구>, 30(2), 55-75.
- 이정학·이재문·장용석 (2017). 소셜 네트워크 빅데이터 분석을 활용한 2018 평창올림픽 키워드 분석. <한국스포츠산업경영학회지>, 22(6), 73-89.
- 이정훈·김민호·권혁철 (2017). 도메인의 통계정보를 이용한 감성분석. 한국정보과학회 학술발표논문집, 619-621.
- 정용찬 (2018). 공공분야 빅데이터 어떻게 활용해야 하나. <월간공공정책>, 158, 22-24.
- 채승병·안신현·전상인 (2012). 빅데이터: 산업 지각변동의 진원. <삼성경제연구소>, 5(2), 1-22.
- 최봉·윤종진 (2018). <서울시 공공 빅데이터 활성화 방안>. 서울연구원정책과제연구보고서.
- 최재원·이호·김정민·송주호 (2017). 토픽모델링을 활용한 소프트웨어 분야 대학 교과과정 분석. <한국전자거래학회지>, 22(4), 193-214.
- 최해옥 (2012). 빅데이터를 활용한 수도권 지식집약산업 네트워크의 기관들 간 연계구조 및 공간적 특성 분석. <도시행정학보>, 25(3), 111-128.
- Blei, D. (2012). Probablistic Topic Models. Communications of the ACM, 55(4), 77-84. [https://doi.org/10.1145/2133806.2133826]
- Gartner (2012). Gartner IT Glossary, AccessedNov 15. http://www.gartner.com/it-glossary/big-data.
- John Gantz, & David Reinsel (2011). Extracting Value from Chaos. IDC’s Digital Universe Study, sponsored by EMC.
- McKinsey Global Institute (2011). Big data: The next frontier for innovation, competition, and productivity.
- Oh, M. J. (2019). A topic modeling analysis from the aging keyword of domestic academic research. Korean Management Review, 48(2), 515-532. [https://doi.org/10.17287/kmr.2019.48.2.515]
- Sebei, H., Hadj Taieb, M. A., & M. Ben Aouicha (2018). Review of Social Media Analytics Process and Big Data Pipeline. Social Network Analysis and Mining, 8(1), 2-30. [https://doi.org/10.1007/s13278-018-0507-0]
[홈페이지]
- 가트너 홈페이지, www.gartner.com
- 맥킨지 홈페이지, www.mckinsey.com
- 정부 빅데이터 공통기반 ‘혜안’, www.insight.go.kr