충남대학교 사회과학연구소 학술지영문홈페이지
[ Article ]
Journal of Social Science - Vol. 36, No. 3, pp.261-281
ISSN: 1976-2984 (Print)
Print publication date 31 Jul 2025
Received 04 May 2025 Revised 20 Jun 2025 Accepted 15 Jul 2025
DOI: https://doi.org/10.16881/jss.2025.07.36.3.261

토픽모델링과 키워드 네트워크 분석을 활용한 지역언론 연구 동향

박찬익
전북대학교 미디어커뮤니케이션학과
Research Trends in Local Journalism: Topic Modeling and Keyword Network Analysis
Chan Ik Park
Jeonbuk National University

Correspondence to: 박찬익, 전북대학교 미디어커뮤니케이션학과 박사수료, 전북특별자치도 전주시 덕진구 백제대로 567, E-mail : jmbcgija@naver.com

초록

본 연구는 2000년부터 2025년까지 발표된 KCI 등재 ‘지역언론’ 관련 논문 404편의 초록을 대상으로 LDA 토픽모델링과 키워드 네트워크 분석을 수행하여 지역언론 연구의 주제 구조를 탐색하였다. 분석 결과, <토픽1> ‘지역성 기반 언론과 미디어 정책의 흐름’, <토픽2> ‘보도 프레임과 사회 갈등 보도의 구조’, <토픽3> ‘지상파 방송사의 프로그램 제작과 콘텐츠 전략’, <토픽4> ‘문화 행사와 미디어 수용자 이미지 형성’ 등 네 가지 토픽이 도출되었다. 토픽1은 지역언론의 정체성과 지속가능성, 지원 정책 논의가 중심을 이루었으며, 토픽2는 재난이나 사회 갈등 등 지역 이슈에 대한 보도 프레임을 중심으로 분석되었고, 토픽3은 지역방송사의 제작 역량과 편성 전략 등 내부 구조에 초점을 맞추었다. 토픽4는 지역 문화자산과 공동체 정체성 간의 연관성을 중심으로 나타났다. 한편, 키워드 네트워크 분석 결과, ‘신문’, ‘방송’과 같은 전통 매체 중심의 키워드가 네트워크 중심에 분포하였으며, ‘디지털’, ‘플랫폼’, ‘AI’ 등 기술 환경 변화와 관련된 키워드는 거의 등장하지 않아 지역언론 연구에서 디지털 전환에 대한 논의가 상대적으로 미흡함을 시사하였다.

Abstract

This study explores the thematic structure trends in local media research by applying Latent Dirichlet Allocation topic modeling and keyword network analysis to the abstracts of 404 papers on regional media registered on the Korea Citation Index between 2000 and 2025. The analysis yielded four key topics: 1: Locality-based Media and Media Policy; 2: Structure of News Frames and Coverage of Social Conflicts; 3: Program Production and Content Strategy of Local Broadcasters; and 4: Cultural Events and the Formation of Media Audience Images. Topic 1 primarily focuses on discussions of the identity and sustainability of local media, as well as related support policies. Topic 2 highlights the news framing of local issues such as disasters and social conflicts. Topic 3 concentrates on the internal structures of local broadcasting stations, including their production capabilities and programming strategies, and topic 4 highlights the relationship between regional cultural assets and community identity. Meanwhile, keyword network analysis shows that traditional media terms like newspaper and broadcasting are central, while those linked to technological changes—such as digital, platform, and AI—appeared infrequently, indicating relatively limited discussion of digital transformation in local media research.

Keywords:

Research Trends, Topic Modeling, Meta Analysis, Network Analysis

키워드:

지역언론, 연구동향, 토픽모델링, 키워드 네트워크 분석, 메타분석

1. 서 론

지역언론은 지역공동체와 소통하는 중요한 매개체이다. 지역의 공공정보를 단순히 전달하는 역할에 그치지 않고 지역 주민들과 지역에 기반한 다양한 정보를 공유하며 공동체 내부의 사회적 유대를 형성하고 유지하는 데 핵심적인 역할을 수행한다(Stamm, Emig, & Hesse, 1997). 즉, 지역언론은 지역사회 내 공론장으로서 지역 공동체의 참여 민주주의를 활성화하는 데 중대한 기여를 하고 있다.

그러나 지역언론은 오랜 기간 지속적으로 구조적인 위기에 직면해 왔다. 지역 인구의 감소, 광고 수익의 급감, 디지털 미디어 환경의 도래, 정치‧경제적 독립성의 약화 등 여러 요인이 복합적으로 작용하면서 존립 기반이 크게 흔들리고 있다(강준만, 전상민, 2019). 미국에서는 이러한 위기가 저소득, 소도시 지역을 중심으로 지역 기반 언론사들이 폐간되거나 인수·합병돼 ‘뉴스 사막화(news desert)’라는 용어가 등장하기도 하였다. 실제로 2020년 기준, 미국 3,143개 카운티 중 약 208개 카운티에는 단 한 개의 지역언론사도 존재하지 않으며, 전체의 절반 이상인 1,630개 카운티에서는 단 하나의 언론사만이 운영되고 있다(최재원, 2022). 애버너시(Abernathy, 2018)는 이와 같은 지역언론의 소멸이 단순한 정보 격차를 넘어 시민 감시 기능의 약화와 민주주의의 구조적 불균형으로 이어질 수 있다고 경고한다.

국내의 상황도 이와 유사하다. 한국 사회는 급격한 고령화와 저출산으로 인해 주로 농촌지역에 위기감을 불러왔던 ‘지역소멸’ 현상이 최근에 대도시까지 위협하며 전국적으로 확산될 조짐을 보이고 있다. 2024년 한국고용정보원이 발간한 자료에 따르면 부산시가 광역시 가운데 처음으로 ‘소멸위험지역’에 진입했기 때문이다(조영미, 2024). ‘지역소멸’ 현상은 ‘지역언론 사막화(media desert)’를 더욱 부추기고 있고, 여기에 포털 중심으로 재편된 국내 온라인 저널리즘 환경은 지역언론이 상대적으로 배제된 뉴스 유통구조를 형성하면서 지역언론의 영향력 약화와 함께 경제적 토대를 붕괴시키는 원인이 되고 있다(강주현, 최창식, 2021). 이러한 지역언론의 사막화는 결국 지역의 정체성과 자존감의 약화를 초래함으로써 지역공동체의 소통과 유지를 위협하는 악순환을 야기할 것으로 우려되고 있다.

지역언론의 위기는 언론산업의 구조적 문제 차원에서 그치지 않고 지역 공동체의 생존과 직결되는 중대한 사회적 과제로 인식되고 있으며 이러한 문제의식은 지역언론에 대한 학문적 관심을 점차 증대시키는 요인이 되었다. 지역언론은 1970년대 후반에서 1980년대 초반 사이에 국내 언론학의 주요 연구 영역으로 정착되었다(김영호, 1999). 이후 지역언론학은 양적·질적으로 성장해 왔으며 1997년 부산울산경남언론학회가 지역언론학 중심의 학술지 『언론학연구』를 처음 발간하였다. 『언론학연구』는 2017년 『지역과 커뮤니케이션』으로 명칭이 변경되었다. 2001년에는 한국지역언론학회가 『언론과학연구』를 창간함으로써 지역언론 연구의 학술적 기반이 견고해졌다(최현주, 이강형, 2008).

지역언론 연구가 언론학 분야의 한 영역으로 자리매김하고 연구 성과들이 꾸준히 쌓이면서 이를 체계적으로 정리하고 향후 연구 방향을 제시하려는 메타분석적 연구들은 간헐적으로 이뤄져 왔다. 예를 들어, 김병국과 김영호(1990)의 『지방언론연구의 성찰』, 김영호(1999)의 『한국사회의 지역화와 지역언론 연구의 성찰과 과제』는 지역언론 연구들을 체계화하는 초석을 다졌고, 이후 이건혁(2016), 최현주와 이강형(2008)은 보다 포괄적으로 지역언론 연구들을 메타분석하였으며, 정용복(2021), 김재영과 양선희(2015), 원용진과 황상현(2011), 한진만(1997)은 특정 매체나 주제를 중심으로, 정용복과 최낙진(2014)은 특정 지역에 대해 메타분석을 하였다.

그러나 이들 연구는 대부분 연구자의 주관에 따라 설정된 분석 유목에 근거하여 논문을 분류하고 해석하는 방식으로 진행되었다. 이 같은 방식은 유용하지만 분석자의 주관적 개입으로 인해 결과의 객관성과 재현성에 한계를 지닌다(신우종, 2015). 따라서 이러한 분석 유목 중심의 접근법을 보완할 수 있는 대안으로 주목받는 것이 바로 데이터 기반의 ‘토픽모델링’ 기법이다.

토픽모델링은 방대한 텍스트 자료에 잠재된 주제를 자동으로 추출하는 비지도 학습 기반의 분석방법으로 주제 구조를 시각화하고 주제 간 상호 연관성을 파악하는 데 매우 효과적이다. 특히 LDA(Latent Dirichlet Allocation) 기법은 분석 유목을 수작업으로 설정할 때 발생할 수 있는 주관성 개입이나 유목 누락 문제를 방지함으로써 메타분석의 객관성과 신뢰도를 제고할 수 있는 장점이 있다(이준웅, 김성희, 2018). LDA는 대표적인 베이즈 기반 모델로 토픽 수를 사전에 지정해야 하는 단점은 있지만 직관적이고 명확하게 주제를 추출하고 시계열 분석이 용이하다(Blei, Ng, & Jordan, 2003).

이에 본 연구는 LDA 기반의 토픽모델링 기법을 적용하여 2000년부터 2025년 3월까지 한국학술지인용색인(KCI)에 등재된 지역언론 관련 논문들을 분석함으로써 해당 분야의 주요 연구 주제와 경향성을 종합적으로 조망하고, 향후 지역언론 연구의 방향성과 과제를 탐색하고자 하였다.

나아가 본 연구는 토픽모델링과 키워드 네트워크 분석을 통해 지역언론 연구의 객관적 흐름을 진단함으로써 이론적으로는 지역언론학의 주제적 지형을 정교화하고, 정책적으로는 지역언론의 지속가능성과 공공성 강화를 위한 근거 자료를 제공하는 데 기여하고자 한다.


2. 이론적 배경

1) 국내 언론학의 메타분석

국내 언론학에서 ‘메타분석’ 방법론은 2004년에 처음 도입되었다. 정용복과 최낙진(2014)은 한국언론학 메타분석의 본격적인 시작을 알린 사례로 ‘국내 인터넷 연구의 메타분석’(황상재, 박석철, 2004)과 ‘문화연구에 대한 메타분석’(이영주, 조세훈, 2004), 그리고 ‘텔레비전 서사연구의 메타분석’(김훈순, 2004) 등 세 편의 논문을 제시하였다.

국내 지역언론 연구 관련 메타분석

황상재와 박석철(2004)은 인터넷의 발전으로 말미암아 1999년 이후 국내 인터넷 관련 연구들이 길지 않은 역사에도 불구하고 연구 성과가 상당히 축적되었다고 평가하고 이를 전체적으로 조망하는 분석 결과를 내놓았다. 연구의 주제는 인터넷 이용자보다 매체 중심적 연구가 많았고 이론보다 세부 개념을 측정하는 연구가 다수였다고 분석하였다. 그러나 방법론적인 측면에서 인터넷 매체의 특성을 살리지 못해, 인터넷 활용 측면에 치우친 분석이 이뤄졌으며 기존 연구에 대한 비판적 고찰도 부족하다고 평가하였다. 이영주와 조세훈(2004)은 한국언론학의 문화연구에 주목하였다. 문화연구의 전통과 경계를 설정한 뒤 1998년부터 2003년까지 총 65편의 논문을 이론적 논문과 분석적 논문으로 분류해 문화연구에서 나타나는 ‘전도’의 문제를 비판하였다. 김훈순(2004)은 국내 6개 학술지에 게재된 국내 텔레비전 텍스트 연구 논문 24편을 선정해 메타분석을 실시하고 텔레비전 텍스트 연구의 서사 분석의 틀을 파악하였다. 또한, 의미생산의 맥락화를 텍스트 중심적 접근과 맥락 중심적 접근으로 나눠 고찰한 뒤 텔레비전의 서사구조와 형식의 본질을 밝히는 기초단계의 연구가 부족하다고 지적하였다.

국내 언론학의 메타분석이 2004년에 본격화된 이후 지역언론학 분야에서 메타분석이 처음 시도된 것은 2008년이다. 최현주와 이강형(2008)은 1960년대부터 2008년까지 학술지 논문 19종 188편의 논문들을 분석하였다. 지역언론학 연구의 대상이나 주제들이 전통적인 매스커뮤니케이션 모델을 활용하는데 편중되었고 내용분석도 지역 신문과 방송이 내는 메시지에 치중했다고 주장하였다. 그리고 1990년대 들어 양적으로 팽창했으나 질적인 면에서 학문적 정체성 고민이 부족하고 이론적으로 지역 언론 현상을 해석하는 시도가 미흡하다고 비판하였다.

메타분석은 아니지만 지역언론학을 중심으로 연구 흐름을 정리한 국내 사례는 최현주와 이강형(2008) 이전에도 있었다. 김영호(1999)는 1970년대부터 지역언론에 관한 학술적 연구가 국내에서 나오기 시작하였고 1980년대를 거쳐 1990년에 이르는 동안 양과 질에 있어 괄목할 만한 수준의 발전이 있었다고 설명하였다. 하지만 지역 미디어 중심의 연구가 주로 이뤄져 주제가 다양화되지 못했고 우리 실정에 맞는 이론적 틀을 찾는 노력 또한 부족했다고 지적하였다. 이는 연구자들이 지역언론 연구를 주된 전공이 아니라 부수적이라고 인식하기 때문으로 해석하였다. 임영호(2008)는 지역언론 연구의 대상이나 이론적 틀을 지역이나 지역매체에 한정하지 말고 인접한 다양한 분야의 학문과 학제적 실험을 시도하라고 제안하며 기존의 SMCR 중심의 틀에서 탈피해 이론적 주제나 접근 방식의 대안을 주장하였다. 그리고 현실에 대한 이해를 기반으로 규범성과 사회과학적 이론을 조화시키는 노력이 필요하다고 제안하였다.

지역방송을 중심으로 살펴본 한진만(1997)은 1978년부터 1997년까지 국내 학술지와 석박사 논문 180편을 분석하여 연구주제를 지역방송 활성화, 지역사회발전, 지방자치 등 25개로 분류하였으며, 지역방송에서 다뤄진 연구영역이나 적용된 연구방법의 폭이 넓지 못하다고 개선의 필요성을 지적하였다. 앞서 살펴본 세 논문은 지역언론학에서 본격적으로 메타분석이 시작되었다고 보기에는 주제의 범위와 내용적 측면에서 다소 부족함이 있다.

국내 지역언론 연구 동향을 전반적으로 메타분석한 논문은 2016년이 가장 최근이다. 이건혁(2016)은 지역 언론학을 지향하는 국내 학술지 ‘언론학연구’에 게재된 논문들을 ‘초창기(1997∼2001년)’와 ‘부흥기(2007∼2013년)’ 등 두 시기로 나눠 분석하였다. 부흥기에 전체 논문 수가 초창기에 비해 약 2.5배 증가하고 지역 관련 논문 수도 14편 증가하였다. 그리고 지역언론 연구 논문을 수용자, 내용분석, 미디어산업, 정책 등 연구주제와, 규범적 및 산업적 분석, 계량적, 기술적 분석 등 논의 성격으로 구분하여 분석하였다. 그 결과, 연구주제로는 정책(30%)이 가장 많았으며 규범적(43%), 계량적(40%) 논의가 다수였다.

제주 지역언론에 주목한 정용복과 최낙진(2014)은 국내 지역언론의 성과를 일괄하면서 제주라는 특정 지역의 언론 연구를 종합적으로 분석하여 대안을 제시하였다는 점에서 매우 특이하다. 1998년부터 2013년까지 제주지역 언론학 관련 연구논문을 분석하였는데, 분석대상이 지역신문이나 지역방송 등 단일매체에 치우쳐 있고 연구주제는 메시지가 많았다고 밝혔다. 따라서 지역언론 연구가 더 공고해지려면 다차원적인 접근이 필요하다고 제안하였다.

지역방송을 주제로 메타분석한 연구는 원용진과 황상현(2011), 김재영과 양선희(2015), 정용복(2021) 등 총 3편이 있다. 원용진과 황상현(2011)에 따르면 2000년부터 2010년까지 발표된 지역방송 관련 논문들은 지역방송 위기와 극복을 위해 제도적, 정책적 담론을 담고 있으며, 중앙이 지역에 더 많이 배려해야 한다는 지역 중심의 편향성을 띠고 있다고 주장하였다. 즉, 지역방송을 살리려면 중앙정부가 적극 지원해야 한다는 당위적 성격의 제안이 많았다고 밝혔다. 또한, 지역성의 개념을 실천적으로 다루기보다는 선언적 수준에서 머무르는 경우가 다수였고 제도 혹은 정책 중심의 접근에 치우친 한계가 있다고 지적하였다.

김재영과 양선희(2015)는 2014년 10월까지 발표된 지역방송 관련 전체 논문 62편을 종합적으로 분석하였다. 국내 지역방송 연구는 양적으로 부족할 뿐 아니라, 연구 내용 또한 당위적이고 규범적인 차원에 머무르고 있어 실증적이고 체계적인 연구가 현저히 부족한 실정이라고 밝혔다. 이는 한국 학계 전반의 형식과 절차를 중시하는 경향, 그리고 학문 생태계의 구조적 제약에서 비롯된 것으로 판단하였다. 따라서 이러한 문제점을 극복하기 위해 지역방송 연구가 주제 측면에서 다양화되고, 접근 방식과 분석 방법에 있어 참신성과 정교함을 갖추어야 한다고 제안하였다. 이를 통해 지역방송에 대한 실질적 개선 방안이 마련될 수 있음을 강조하였다.

정용복(2021)은 2019년까지 전체 기간에 대해 KCI등재(후보)지에 게재된 지역방송에 대한 연구 경향을 메타분석하였다. 166편의 논문 분석을 통해 2014년과 2015년 지역방송발전지원 특별법 제정이 추진된 시기에 지역방송 논문 게재 건수가 급격히 늘었으며, 지역방송이 제도적 기반 조성과 콘텐츠 제작, 지역성 강화 등 다양한 측면에서 논의되었다고 밝혔다. 특히 지역방송의 위기를 진단하고 이를 극복하기 위한 실천적 연구의 중요성을 강조하고 현장 중심의 연구와 수용자 중심의 접근, 뉴미디어 환경에 대한 대응, 지방정부 및 공동체와의 관계 재정립 등 미래 연구 과제를 제안하였다.

앞서 여러 연구 논문에서 언급됐지만 현재까지 지역언론을 주제로 한 국내 메타분석 연구는 손으로 꼽을 수준이다. 국내 언론학 전반을 다루면서 일부 언급되거나 지역방송 같은 특정 매체를 다룬 연구들이 있기는 하나 양적으로 매우 미미한 수준이다.

기존 메타분석 연구는 대부분 연구자의 판단에 따라 분석 범주를 설정하고 논문을 분류함으로써 주제 선정과 해석에 있어 주관적 개입의 여지가 존재하였다. 반면 본 연구에서 적용한 토픽모델링 기법은 대규모 텍스트 데이터를 기반으로 사전 유목 없이 주제를 자동으로 도출할 수 있다는 점에서 방법론적으로 중요한 차별성을 지닌다. 특히 LDA 기반 분석과 키워드 네트워크 분석은 각 토픽과 키워드 간의 상호 연관성을 시각화할 수 있어 기존 메타분석이 놓칠 수 있는 주제 간 흐름과 구조적 맥락을 입체적으로 조망할 수 있다. 이처럼 토픽모델링은 연구자의 주관을 최소화하고 숨겨진 주제 구조를 통계적으로 추론함으로써 보다 객관적이고 정량적인 메타분석을 가능하게 한다는 점에서 학문적으로도 새로운 통찰을 제공한다.

2) 국내 언론학의 토픽모델링 분석

토픽모델링은 언론보도의 주제 구조를 정량적으로 분석하는 데 강점을 지닌 기법으로, 국내 언론학에서는 2010년대 중반을 기점으로 그 활용이 확대되었다. 그 가운데 이준웅과 김성희(2018)의 연구는 국내 언론학에서 토픽모델링의 본격적 도입을 상징하는 대표적인 사례로 평가된다. 이들은 중앙일간지의 미세먼지 보도를 분석하며 구조적 주제모형(Structural Topic Modeling, STM)을 적용, 전통적인 내용분석 방식과 비교하여 프레임 구성의 데이터 기반 분석 가능성을 제시하였다. 이는 토픽모델링이 언론학에서 이론적 설명력과 실증적 타당성을 동시에 확보할 수 있음을 보여준 선도적 시도이기도 하다.

언론학에서 토픽모델링은 단순한 주제 분류를 넘어, 디지털 시대 저널리즘의 변화와 사회 담론의 흐름을 분석하는 핵심 도구로 자리 잡고 있다. 김현진과 이은별(2022)은 유튜브상 구소련권 여성 관련 콘텐츠를 분석하여 콘텐츠의 반복 재현과 문화적 수용 양상을 토픽 단위로 도출함으로써 성별, 계급, 인종, 지역, 장애, 성적 지향 등 다양한 사회적 정체성에서 동시에 발현되는 ‘다중 억압 구조’를 해석하였다. 이는 디지털 플랫폼 기반 텍스트가 담론을 어떻게 형성하고 재생산하는지를 계량적으로 설명하는 데 토픽모델링이 유효한 도구임을 입증하였다. 특히 다양한 디지털 데이터(댓글, 제목, 키워드 등)의 분석 가능성이 열리며, 정성적 분석의 한계를 보완하는 정량적 접근법의 유용성이 주목을 받았다. 김영욱, 함승경, 김영지, 최지명(2017)은 사드(THAAD) 배치라는 사회적 갈등 이슈를 둘러싼 언론 담론을 분석하기 위해 약 7,000건의 관련 뉴스 기사를 수집하고 빅데이터 기반 토픽모델링과 의미 네트워크 분석을 결합한 비판적 담론 분석을 실시하였다. 보수 언론과 진보 언론이 사드를 바라보는 관점과 보도 프레임에 뚜렷한 차이를 보인다는 점에 주목하였고 보도의 이념적 방향이 특정 키워드와 주제 구성을 통해 담론화되었다고 밝혔다. 한편, 양혜승(2022)은 네이버 뉴스 댓글을 분석하여 전라도 혐오 표현의 구조를 토픽 단위로 추출함으로써 지역 차별과 낙인 담론이 어떻게 구축되는지를 실증적으로 조명하였다. 이처럼 토픽모델링은 담론의 층위, 반복성, 의미 네트워크 등을 분석하는 데 강력한 도구로 작용하고 있다.

시계열적 접근을 통해 뉴스 이슈의 흐름과 주제 전환을 추적하는 데도 토픽모델링이 활용되고 있다. 박영은(2024)은 BERTopic 기반의 동적 토픽모델을 통해 코로나19 백신 보도에서 시간에 따른 주제 변화를 분석하였으며, 보도량과 이슈의 등장 시점 간의 상관관계를 실증적으로 제시하였다. 정원준(2018)은 시계열 토픽모델링을 통해 사드 이슈에 대한 한국과 중국 언론 보도의 갈등 프레임 변화를 분석하였고, 최선영과 고은지(2019)는 『한국언론학보』의 논문 전체를 대상으로 동적 토픽모델링(dynamic topic modeling)을 수행하여 학문적 관심 주제의 변화 양상을 규명하였다. 이러한 연구들은 뉴스 이슈나 학문적 의제가 시간의 흐름 속에서 어떻게 등장·소멸하는지를 추적하였으며 언론학의 시계열 분석 가능성을 확장하는 데 기여하였다.

토픽모델링 기법은 의미연결망 분석과 결합함으로써 담론 내 주요 개념들 간의 관계 구조를 시각적으로 도식화하고 이들 간의 연관성과 의미 맥락을 해석하는 데 유용하게 활용된다. 문안나(2016)는 IR(투자자 관계)에 대한 신문기사 분석에서 LDA와 의미연결망 분석을 접목하여 IR 개념의 시대별 구성과 행위자 간 관계를 구조적으로 설명하였다. 또한 이태준, 이승배, 오창동(2017)은 원자력 이슈 보도에서 정부와 언론 간 커뮤니케이션 전략 차이를 비교 분석하고 토픽모델링 결과를 네트워크 구조로 시각화함으로써 주요 담론 프레임 간의 연결성과 중심성을 파악하였다.

국내 언론학에서 학술지 분석을 통해 연구동향을 파악하고자 토픽모델링을 활용하는 연구는 점차 증가하고 있다. 김문기와 이장석(2024)은 『한국출판학연구』에 수록된 459편의 논문을 토픽모델링으로 분석하고 연구 주제의 변화를 기술 발전 및 교육 담론과 연계하여 해석하였다. 정승혜(2024) 역시 국내 광고학 분야의 텍스트마이닝 활용 연구를 분석하면서 토픽모델링이 주요한 연구 방법으로 자리 잡았다고 밝혔다.

최근에는 토픽모델링을 중심으로 감성분석, 의미연결망, 구조적 분석 등과 결합된 통합적 분석 방법론이 주목받고 있다. 김인혜, 김연신, 백태현, 최영균(2024)은 수단-목적 사슬 이론과 토픽모델링을 결합하여 친환경 소비자 행동의 문화적 차이를 설명하였고, 이혜선, 이경미, 조재희(2022)는 어린이 스마트폰 이용 보도를 토픽모델링과 의미연결망으로 분석해 의제 전환 과정을 구조화하였다. 이처럼 다중 기법의 융합은 텍스트 분석의 심층성과 설명력을 제고하며 언론학의 이론적 해석 수준을 한층 고도화하고 있다.

이종혁(2022)은 정책기사 자동 분류와 투표율의 관계를 분석하며 기계학습과 LDA를 결합한 예측 분석 모델을 제시하였다. 이와 같은 연구는 디지털저널리즘 분야에서도 토픽모델링이 사회 현상 예측과 설명의 수단으로서 데이터 기반 연구의 중심적 위치를 차지할 것임을 예시하고 있다.


3. 연구방법

1) 연구문제

국내 언론학에서 ‘메타분석’은 2004년에 처음 시도되었다. 그동안 국내 지역언론 연구에 대한 분석은 다소나마 지속적으로 수행되었지만 선행연구를 통해 살펴보았듯 지역언론 연구를 전반적으로 검토하고 연구동향을 통합적으로 파악하는 연구는 상대적으로 부족하였다. 과거에 축적된 연구 성과들을 전반적으로 살펴보는 메타분석은 질적인 분석도 있기는 하나 대체로 양적인 내용분석이 주를 이뤘다. 최근에는 컴퓨터를 활용한 텍스트분석(computerized text analysis)이 활발하게 이뤄지고 있으며, 단어 간의 관계를 기반으로 의미를 해석하고 관련성과 주제어를 추출하는 방식은 기존 메타분석의 한계를 상당 부분 보완하고 있다(이준웅, 김성희, 2018). 본 연구 역시 지역언론에 대한 연구를 데이터 분석 기술을 활용해 보다 과학적으로 접근함으로써 기존 메타분석의 한계를 극복하고자 하였다.

가장 최근에 지역언론 연구를 전반적으로 메타분석한 사례는 최현주와 이강형(2008)의 연구이다. 이 연구와 연구 대상의 시기가 일부 겹치기는 하나 본 연구는 2000년대 초반 이후부터 지역언론 연구의 주요 토픽을 추출하고 의미를 해석하는 데 중점을 두었다. 또한 내용적 측면에서도 기존 연구방법을 참조하되 컴퓨터를 활용한 텍스트 분석을 적용함으로써 연구 동향을 정량적으로 분석하고자 연구문제를 다음과 같이 정하였다.

  • ∙연구문제 1. 지역언론 관련 연구의 주요 키워드는 어떠한가?
  • ∙연구문제 2. 지역언론 관련 연구의 주요 토픽은 어떠한가?
  • ∙연구문제 3. 지역언론 관련 연구의 핵심 키워드에 대한 네트워크 분석은 어떠한가?

2) 자료수집

한국학술지인용색인(KCI) 등재 및 등재 후보 이상 학술지의 연구 논문 가운데 2000년 1월 1일부터 2025년 2월 28일까지 발간된 논문을 분석 대상으로 설정하였다. 1960년대부터 2008년까지 지역언론 연구 논문을 분석한 최현주와 이강형(2008)의 연구와 기간이 일부 겹치기는 하나, 2000년대 이후 지역언론 연구가 폭발적으로 증가했다는 점을 감안하여 본 연구에서는 2000년부터 2008년까지 기간을 분석 대상에 포함시켰다.

논문을 수집하기 위한 검색어는 ‘지역언론’, ‘지역방송’, ‘지역신문’, ‘지역미디어’, ‘지역매체’, ‘로컬미디어’, ‘지역뉴스’, ‘로컬뉴스’ 등 방송과 신문 등 기존 미디어 위주로 구성하였다. 검색어가 제목이나 키워드에 포함된 논문들 가운데, KCI에서 설정한 학술지 주제의 대분류가 사회과학이고 하위 소분류가 신문방송학에 해당되는 논문 454편을 우선 추출하였다. 이 가운데 주제가 지역언론과 직접적인 관련이 없거나 마을공동체미디어 등 본 연구의 대상에 포함되지 않는 논문을 제외하고 349편의 논문을 선별하였다. 여기에 KCI의 주제 분류상 사회과학일반, 기타사회과학, 학제간연구, 기타과학기술학에 해당하면서 지역언론을 주제로 다룬 논문 55편을 추가하여 최종 분석 대상 논문을 총 404편으로 확정하였다.

3) 분석방법 및 절차

본 연구는 파이썬(Python) 3.11과 Visual Studio Code를 활용하여 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링과 네트워크 분석을 실시하였다. 토픽모델링을 적용하기에 앞서, 수집한 텍스트 데이터를 분석 목적에 적합한 형태로 정제하고 구조화하기 위해 전처리 과정을 수행하였다. 전처리는 자연어 처리(Natural Language Processing) 기반 분석에서 필수적인 단계로 입력 데이터의 품질과 구성은 분석 결과의 정확도와 해석 가능성에 직접적으로 영향을 미친다. 이에 따라 본 연구는 불필요한 정보의 제거와 의미 있는 단어의 추출, 분석 효율성 제고를 위하여 다층적인 전처리 과정을 거쳤다.

우선, 텍스트를 의미 단위로 분리하는 토큰화(tokenization)를 하기 위해 형태소 분석기 중 하나인 Okt(Open Korean Text)를 활용하였다. Okt는 KoNLPy 패키지 내에 포함된 한국어 형태소 분석기로 어절을 형태소 단위로 분해하고 각 형태소에 품사를 부착하는 기능을 제공한다. 본 연구에서는 Okt를 활용하여 텍스트로부터 기호나 숫자, 공백을 제거하고 명사만을 선별적으로 추출하여 분석에 사용하였다. 이는 명사가 일반적으로 문서의 주제를 구성하는 주요 개념을 포함하고 있어 토픽 분석에 적합하기 때문이다.

또한, 단어의 품질과 분석 정확도를 높이기 위해 불용어(stopwords)를 제거하는 작업을 수행하였다. 불용어란 문서 내에 자주 출현하지만, 해석상 의미가 거의 없는 단어로 주제 간 구분을 흐리게 만들고 모델의 수렴을 저해한다. 본 연구에서는 ‘다음’, ‘점’, ‘분야’, ‘경우’ 등을 불용어 사전에 등록하고 ‘등’, ‘것’, ‘그’, ‘점’, ‘중’ 등 의미 전달력이 낮은 한 글자 단어들도 일괄적으로 제거하였다.

한국어의 특성상 동일한 단어라도 띄어쓰기 방식에 따라 다르게 인식되는 문제를 해결하기 위해 추가적인 통제도 병행하였다. 예를 들어, ‘지역언론’과 ‘지역 언론’은 형태가 다르지만, 의미상 동일한 단어이므로 전처리 과정에서 이들을 하나의 단어로 통합되도록 띄어쓰기를 통일하였다.

이렇게 전처리 과정을 거친 단어들의 출현 빈도를 수치화하여 문서-단어 행렬(Document-Term Matrix)를 생성하였으며, 이를 바탕으로 키워드 네트워크 분석과 주제 분류를 위한 토픽모델링을 수행하였다.

토픽모델링에서는 일관성(Coherance)과 복잡도(Perplexity) 지수, 토픽간 거리 지도(Intertopic Distance Map)를 종합적으로 고려하여 최적의 토픽 수를 결정하였다. 이어 각 논문에서 두 단어가 함께 등장하는 동시 출현 빈도(co-occurrence frequency)를 기반으로 단어의 관계 강도인 엣지(edge)를 산출하고 이를 통해 네트워크 구조를 구성하였으며, 각 노드(단어)의 중요도는 중심성 분석을 통해 파악하였다. 중심성 지표에는 대표적으로 연결 중심성(degree centrality), 매개 중심성(betweenness centrality), 근접 중심성(closeness centrality) 등이 있으나 본 연구에서는 연결중심성을 기준으로 분석하였다. 연결 중심성은 특정 노드가 다른 노드들과 얼마나 직접적으로 연결되어 있는지를 나타내는 지표로, 네트워크 내에서 가장 많은 관계를 형성하고 있는 중심 단어들을 식별함으로써 텍스트의 주요 개념과 의미 구조를 파악하는데 유용하다(정원준, 2018).


4. 분석결과

1) 연도별 연구논문 추이

수집된 논문은 <표 2>와 같이 2000년과 2001년에는 단 한 편도 추출되지 않았다. 지역언론 관련 학술지인 ‘언론학연구’와 ‘언론과학연구’가 1997년과 2001년에 각각 창간되었음에도 당시 언론학 분야에서 지역언론 관련 연구가 활발하지 않았기 때문으로 풀이된다. 또한, ‘언론학연구’는 해당 시기에 논문 키워드를 적용하지 않았고, ‘언론과학연구’는 2004년 이후부터 KCI 데이터베이스에 논문이 등재되어 추출되지 않은 것으로 보인다.

연도별 논문수

연도별 추이를 보면, 2004년을 기점으로 지역언론 관련 연구 논문은 본격적으로 증가하기 시작하였다. 특히 『언론과학연구』에 발표된 논문 수가 2004년 2편, 2005년 6편, 2006년 8편으로 매년 증가한 점이 주요한 원인으로 작용하였다. 이러한 증가세는 2013년에 총 26편으로 정점을 찍었으며, 이는 종합편성채널의 출범과 미디어렙 제도 시행 등 방송환경의 구조적 변화와 맞물려 있다. 당시 지역 언론의 광고 기반은 약화되었고 지역성 구현에 대한 문제의식이 심화되던 시기였다. 이에 따라 지역신문발전법 개정과 지방자치단체의 지원조례 도입 등 정책 환경 변화에 관한 연구가 활발히 진행되었다.

2010년대 전반기까지 연평균 20편 내외를 유지하였으나 후반기 들어 다소 감소세를 보이다가 2024년에 31편으로 다시 급증하였다. 2024년에 지역 언론 연구가 정점을 기록한 배경에는 코로나19 펜데믹 종료 이후 사회적 변화에 대한 조명, 하이퍼로컬 미디어의 성장, 지역공동체 회복에 대한 사회적 관심 증대가 크게 작용하였다. 아울러 포털 중심 유통구조에서 벗어나려는 디지털 전환 전략, 유튜브 채널 운영 등 기술 변화에 대한 지역 언론의 대응 시도가 새로운 연구 주제로 부각된 것도 한몫하였다.

2) 저자 주제어 빈도

총 404편의 논문에서 각 저자들이 제시한 주제어(핵심어, 키워드)는 모두 1,944개로 확인되었다. 여기에는 KCI 논문을 검색할 때 사용한 ‘지역언론’, ‘지역방송’, ‘지역신문’, ‘지역미디어’, ‘지역매체’, ‘로컬미디어’, ‘지역뉴스’, ‘로컬뉴스’ 등이 포함되어 있다.

논문의 주제어가 쉼표가 아닌 ‘#’와 ‘|’ 같은 기호로 구분된 경우에는 별도로 분리 작업을 진행하였다. ‘MBC로컬’, ‘TV토론’, ‘기사의 유형’, ‘AHP’ 등 의미가 유사하거나 동일한 단어는 각각 ‘지역MBC’, ‘방송토론’, ‘기사유형’, ‘계층분석법’ 등으로 통일하였다. 이와 함께 ‘방송 뉴스’와 ‘방송뉴스’와 같이 띄어쓰기가 다른 경우에도 동일한 단어로 간주하여 일관되게 정리하였다.

이러한 정제 과정을 거친 후 중복을 제거한 고유 주제어의 수는 총 1,189개였다. <표 3>에서 나타난 바와 같이 빈도수가 높은 주제어 상위 10개에 ‘지역방송’, ‘지역신문’, ‘지역언론’, ‘지역미디어’가 포함되었다. 반면, 논문 검색 시 입력된 주제어 중에는 ‘지역뉴스’가 5회, ‘지역매체’는 1회 언급되었으며 ‘로컬미디어’와 ‘로컬뉴스’는 전혀 나타나지 않았다.

저자 주제어 빈도

이처럼 검색어로 사용된 단어들(예: 지역, 방송, 신문, 뉴스, 언론, 보도, 미디어 등)을 제외하고 주제어 빈도수를 분석한 결과, ‘지역성’이라는 주제어가 가장 두드러지게 나타났다. 이는 지역언론의 정체성과 관련된 연구가 다수 이뤄졌음을 의미한다. 특히, 지역언론의 생존이 위협받는 위기의 시대에 ‘지역성’은 지역언론의 존재 이유이자 전국 언론과 차별성을 설명할 수 있는 핵심 개념이기 때문에 이에 관한 연구가 집중되었음을 보여준다.

주제어 중 특정 지역명이 포함된 경우는 제주가 8건, 부산 8건, 광주 4건, 전북 3건이었다. 반면, 지역과 대비되는 개념인 ‘중앙’과 ‘전국’은 8건과 3건으로 확인되었다.

3) 학술지별 논문수

분석 대상 학술 논문 중 10편 이상 게재된 학술지는 총 9개로 전체 76.7%를 차지하였다. 가장 많은 논문이 실린 학술지는 『언론과학연구』 111편이었으며, 그 뒤를 이어 『지역과 커뮤니케이션』(구 『언론학연구』) 53편, 『한국언론정보학보』 41편, 『한국언론학보』 35편, 『한국방송학보』 25편 등의 순이었다.

학술지별 논문수

지역언론 전문 학술지인 『언론과학연구』와 『지역과 커뮤니케이션』에 게재된 논문 수가 전체의 약 40% 차지한 점은, 앞서 서술한 바와 같이 두 학술지가 지역언론 연구에 크게 기여해 왔음을 시사한다.

4) 키워드 빈도, TF-IDF

각 논문의 초록에서 외국어, 기호, 한 글자 단어 등 불용어를 제거한 뒤 형태소 분석을 통해 추출된 명사 키워드를 대상으로 TF-IDF(Term Frequency-Inverse Document Frequency) 분석을 수행하였다. TF-IDF는 특정 단어가 개별 문서에서 얼마나 자주 등장하는지를 나타내는 단어 빈도(term frequency)와 전체 문서 집합에서 해당 단어가 얼마나 드물게 나타나는지를 나타내는 역문서 빈도(inverse document frequency)를 결합하여 문서별 핵심 키워드를 정량적으로 파악할 수 있도록 하는 지표이다. 이를 통해 각 연구의 주제와 관련된 주요 담론이 어떤 용어를 중심으로 구성되는지를 파악하고자 하였다.

키워드 TF-IDF

분석 결과는 워드클라우드로 시각화하였으며 분석의 편향을 방지하기 위해 모든 논문의 초록에 공통으로 들어가는 키워드는 제외하였다. TF-IDF 값이 가장 높게 나타난 단어는 ‘방송’, ‘연구’, ‘신문’, ‘분석’, ‘뉴스’ 순이었다. 특히 ‘방송’이 ‘신문’보다, ‘뉴스’가 ‘기사’보다 높은 순위를 기록하였으며, 방송 관련 단어인 ‘프로그램’, ‘콘텐츠’, ‘방송사’, ‘제작’ 등이 상위 20위 내에 포함되었다. 이러한 결과는 지역언론 연구에서 신문보다 방송을 연구 대상으로 삼는 경향이 상대적으로 두드러졌음을 시사한다.

<그림 1>

TF-IDF 워드클라우드

5) 토픽모델링

우선, 가장 적합한 토픽 수를 결정하기 위해 일관성과 복잡도 지수를 분석하였다. 일관성은 개별 토픽 내에 키워드들이 의미적으로 얼마나 잘 어울리는지를 수치화한 지표로 값이 높을수록 주제 응집도가 높고 해석 가능성이 좋은 모델로 평가된다. 반면, 복잡도 지수는 모델이 문서의 집합을 얼마나 잘 예측하는지를 나타내는 지표로 값이 낮을수록 모델의 예측력이 높다고 해석할 수 있다. 그러나 복잡도 지수가 낮다고 해서 좋은 모델이라고 단정할 수 없으며 일관성과 함께 비교 판단하는 것이 바람직하다(문길성, 2021).

<그림 2>의 일관성 그래프를 보면, 토픽 수가 14개일 때 일관성 지수가 0.425로 가장 높았고, 복잡도(log-perplexity)는 10개 이후부터 급격한 하강 곡선을 보였다. 일관성만을 기준으로 보면 14개 토픽이 가장 적합해 보이지만 복잡도 지수와 함께 고려할 경우, 4개(일관성 0.405, 복잡도 -7.039), 8개(일관성 0.410, 복잡도 -7.057), 9개(일관성 0.404, 복잡도 -7.063) 토픽 수 역시 비교적 양호한 수치를 나타내며 적정한 후보로 평가되었다.

<그림 2>

토픽 수에 따른 일관성과 복잡도

최종 토픽 수를 결정하기 위해 <그림 3>의 토픽 간 거리 지도(Intertopic Distance Map)를 분석하였다. 이 지도는 각 토픽 간의 주제 유사성과 연관성을 시각화한 것으로 원의 간격이 가까울수록 유사도가 높고 원의 크기가 클수록 해당 토픽이 차지하는 문서 점유율이 크다는 것을 의미한다. 분석 결과, 토픽 수 4개를 제외한 나머지는 원이 다수 겹치거나 크기가 작은 경우가 많아 주제가 중첩되거나 구분이 모호하고 문서 점유율이 3% 이하인 토픽이 다수 포함된 것으로 나타났다.

<그림 3>

토픽 간 거리 지도

이에 따라 본 연구는 토픽 간의 주제 응집도, 해석 가능성(interpretability), 구별도(distinctiveness)를 종합적으로 고려하여 최종적으로 4개의 토픽을 도출하고(Farea, Tripathi, Glazko, & Emmert-Streib, 2024), 핵심 단어 간의 연계성을 바탕으로 2000년부터 2025년까지의 지역언론 연구흐름을 반영한 토픽명을 지정하였다.

토픽명 및 핵심키워드

(1) 지역성 기반 언론과 미디어 정책의 흐름

<토픽1>은 ‘연구’, ‘방송’, ‘신문’, ‘정책’, ‘지역성’ 등 다양한 미디어 관련 키워드가 중심을 이룬다. <그림 3>에서 해당 토픽의 원이 다른 토픽에 비해 상대적으로 크고 독립적으로 분포된 점은 이 주제가 지역언론 연구에서 매우 높은 문서 점유율(60.4%)을 차지하고 있음을 시사한다. 특히, 지역언론의 기반인 지역성과 지역언론의 지속성을 담보하기 위한 정책적 지원이 핵심 주제이다. 예를 들어, 김덕모와 강철수(2012)는 지방자치단체들이 추진 중인 지역신문지원조례의 현황과 문제점을 분석하면서 지역신문에 대한 지원 필요성에 대해 지역의 공감대가 선행되어야 한다고 주장하고 난립 중인 지역신문을 수용자 중심으로 개혁하는 조례가 추진되어야 한다고 제안하였다. 또, 이진로(2004)는 지역성 구현의 측면에서 방송법을 평가하고 개정 방안을 제안하였다. 방송법의 의미를 해석하고 적용할 때 지역방송의 공공성과 공익성은 지역성에 근거해야 하며, 지역방송의 지위와 역할을 명확히 함으로써 자율성과 책임성을 강화할 필요가 있다고 주장하였다. 오세욱와 정영주(2024)는 지역 일간신문들이 여러 디지털 플랫폼에 진출하고 있으나 수익성과 운영 지속성의 한계로 인해 실질적 경쟁력은 여전히 미흡하다고 지적하고, 포털에 의존하는 형태에서 탈피해 자립적 플랫폼 구축과 디지털 기반 사업 강화를 위해 정책적 지원이 뒤따라야 한다고 강조하였다.

(2) 뉴스 프레임과 사회 갈등 보도의 구조

<토픽2>는 ‘보도’, ‘프레임’, ‘뉴스’, ‘파업’, ‘갈등’ 등의 키워드를 포함하고 있으며, 프레이밍(Framing) 이론을 기반으로 지역언론의 보도가 특정 이슈를 어떤 시각과 구조로 구성하는지에 주목한다. 예를 들어 나미수와 김성진(2014)은 전북지역 방송 3사의 버스파업 보도에 대한 프레임 분석을 통해 지역언론이 사회적 갈등 이슈를 다루면서 원인과 배경에 대해 심층적으로 접근하려는 노력이 부족하다고 지적하였다. 유영돈과 마정미(2015)는 세종시 갈등에 대한 10여 년간의 신문 보도를 프레임 분석한 결과, 언론사의 이념 성향과 지역적 특성이 뉴스 프레임 구성에 뚜렷한 영향을 미친다고 지적하였다. 특히 지역 언론은 ‘지역발전’과 ‘경제적 중요성’ 프레임을, 중앙지는 ‘대립갈등’과 ‘책임귀인’ 프레임을 주로 활용함으로써 언론이 갈등 조정자라기보다 자사 정체성과 독자층에 부합하는 시각을 강조하는 경향을 보였다고 분석하였다.

(3) 지상파 방송사의 프로그램 제작과 콘텐츠 전략

<토픽3>은 ‘방송’, ‘방송사’, ‘프로그램’, ‘제작’, ‘콘텐츠’ 등이 핵심 키워드로 나타났다. 관련한 연구 가운데 이종탁과 정종건(2009)은 지역방송 프로그램의 제작 현황을 살펴보고 지역방송의 자생력 확보를 위해 다른 지역방송 간 공동제작을 늘려야 한다고 제안했고, 주정민(2015)은 제작인력, 제작비 등 제작 역량과 프로그램 시청률 간 상관관계가 높다는 사실을 증명하며 지역방송의 경쟁력 강화를 위한 전략적 개선 방향을 제시하였다.

최근에는 유튜브, SNS 등 디지털 플랫폼을 활용한 콘텐츠 유통 전략이 주요한 연구 주제로 부각되고 있다. 지역방송이 지역 콘텐츠를 바탕으로 전국 단위 시청자와 직접적으로 접촉면을 늘림으로써 물리적 경계를 뛰어넘는 콘텐츠 경쟁력 확보를 모색하고 있는 것이다.

(4) 문화행사와 미디어 수용자 이미지 형성

<토픽4>의 주요 키워드는 ‘문화’, ‘행사’, ‘이미지’, ‘공중’, ‘인식’, ‘관계성’ 등이다. 지역언론이 단순한 정보 전달을 넘어 지역 주민과의 관계를 형성하고 공중의 인식과 이미지를 구성하는 과정을 보여준다.

박하늬(2011)는 지역방송사들이 생존 전략으로서 프로그램 경쟁력 강화에만 머무르지 않고 지역민을 대상으로 다양한 문화행사를 기획·제공함으로써 지역사회와의 관계성을 높이고자 한다는 점에 주목하였다. 이영원(2015)은 전북지역 주민의 신문 구독 여부에 따른 미디어 이용 행태와 뉴스 관심도 차이를 실증적으로 분석하면서 지역언론이 지역 주민의 사회자본 형성에 긍정적인 영향을 미치고 있음을 밝혔다.

이처럼 지역언론은 문화행사와 같은 커뮤니케이션 전략을 통해 지역사회 구성원과의 유대감을 강화하고 공중의 긍정적 인식 형성과 이미지 개선에 노력하고 있다. 또한, 시청자위원회나 독자모니터 제도와 같은 쌍방향 커뮤니케이션은 지역방송과 시청자, 지역신문과 독자 간의 상호작용을 활성화하는 도구로 작동하고 있으며, 이는 지역언론이 수용자 중심의 매체로서 기능하고 있음을 시사한다(정미영, 2020).

6) 네트워크 분석

네트워크 분석은 구성요소(노드) 간의 관계(엣지)를 구조적으로 파악하여 의미 있는 상호작용 패턴을 도출하는 분석 기법으로 본 연구에서는 연결중심성(degree centrality)을 기준으로 분석하였다.

<그림 4>는 최소 동시 출현횟수를 200회 이상으로 설정하여 의미적으로 밀접한 관계를 가진 상위 50개의 키워드를 시각화한 것이다. 네트워크 내 각 노드는 키워드를 나타내며, 해당 노드의 크기와 위치는 연결중심성(Centrality) 값에 따라 달라진다. 중심성 값이 높을수록 해당 키워드는 다른 키워드들과의 연결성이 강하고, 네트워크 내에서 허브(hub) 역할을 수행함으로써 텍스트 의미 구조의 중심에 위치하게 된다. <표 7>과 같이 본 연구에서 도출된 연결중심성 상위 키워드는 ‘방송’(0.764), ‘연구’(0.433), ‘신문’(0.404), ‘뉴스’(0.275), ‘보도’(0.264), ‘분석’(0.242) 등으로, 지역언론 연구의 핵심 논의가 방송 및 신문 보도 콘텐츠를 중심으로 한 분석적 접근에 집중되어 왔음을 실증적으로 보여준다.

<그림 4>

중심 키워드 네트워크(상위 50개)

키워드 연결중심성

반면, ‘정책’(0.067), ‘지역성’(0.067), ‘프레임’(0.034), ‘저널리즘’(0.028) 등은 연결중심성 값이 상대적으로 낮지만 상위 키워드들과의 연결을 통해 연구의 분석 관점을 구성하는 개념적 기반으로 기능하고 있다. 지역언론의 구조적 속성, 언론 담론 형성, 매체의 정체성에 대한 이론적 탐색이 일정 부분 병행되어 왔음을 반영한다.

주목할 점은 ‘지원’(0.045), ‘제도’(0.011), ‘재정’(0.006)과 같이 지역언론의 제도적 기반과 구조적 환경을 직접적으로 지칭하는 키워드들이 전반적으로 낮은 수치를 보인다는 사실이다. 이는 지역언론의 재정적 자립성, 정책적 보호 장치, 제도적 지속가능성 등 구조적 현실에 대한 학문적 관심이 상대적으로 미진했음을 나타낸다. 실제로 지역언론은 광고 수익 저조, 제작비 부족, 인력 유출 등 지속적인 한계 상황에 놓여 있음에도, 이러한 문제들이 실증적으로 분석되기보다는 주변적 논의로 취급되어 온 측면이 있다.

‘디지털’(0.006), ‘인터넷’(0.006) 등 미디어 기술 변화와 관련된 키워드들은 중심 네트워크 내에서 변방에 위치하고, ‘AI’, ‘플랫폼’, ‘데이터 저널리즘’ 등 최근 언론 환경의 핵심 담론을 구성하는 주요 용어들은 연결중심성 상위 목록에 전혀 등장하지 않았다. 이는 지역언론 연구가 디지털 전환과 알고리즘 기반 보도, 플랫폼 저널리즘 등 기술 기반 미디어 환경 변화에 대한 이론적 감수성과 문제의식이 상대적으로 낮은 수준에 머물러 있음을 실증적으로 보여주는 결과라 할 수 있다. 향후 지역언론 연구는 급변하는 미디어 생태계 속에서 기술‧플랫폼 기반 저널리즘 구조를 포함하는 다층적 분석틀을 확장할 필요가 있다.


5. 결 론

본 연구는 2000년부터 2025년까지 KCI 등재 학술지에 게재된 지역언론 관련 논문 404편의 초록을 분석 대상으로 하여, 토픽모델링(LDA)과 키워드 네트워크 분석을 결합해 지역언론 연구의 주요 주제 분포와 경향을 실증적으로 도출하였다. 정량적 텍스트 분석 기법을 활용함으로써 기존의 주관적 범주 설정이나 유목화에 기반한 메타분석의 한계를 극복하고자 하였다.

분석 결과, 전체 논문은 ‘지역성 기반 언론과 미디어 정책의 흐름’, ‘뉴스 프레임과 사회 갈등 보도의 구조’, ‘지상파 방송사의 프로그램 제작과 콘텐츠 전략’, ‘문화행사와 미디어 수용자 이미지 형성’ 등 네 가지 주제로 분류되었다. 이 중 ‘지역성 기반 언론과 미디어 정책의 흐름’은 가장 높은 빈도를 보였으며, 이는 지역언론의 제도적 기반과 지속가능성에 대한 학계의 관심이 집중되어 있음을 반영한다. ‘뉴스 프레임과 사회 갈등 보도의 구조’는 사회 갈등이나 재난 이슈에 대한 보도 경향 및 지역성과의 상관성을 중점적으로 다루었고, ‘지상파 방송사의 프로그램 제작과 콘텐츠 전략’ 주제에서는 제작역량, 편성 전략, 디지털 플랫폼 대응 등 방송사의 내부 역량을 중심으로 논의되었다. ‘문화행사와 미디어 수용자 이미지 형성’ 토픽은 지역언론이 지역 문화자산과 행사를 매개로 지역 구성원 간의 정서적 유대와 공동체 정체성 강화를 도모하는 담론 공간으로 기능하고 있음을 보여준다.

이러한 결과는 지역언론 연구가 단일한 주제에 집중되기보다는 제도, 콘텐츠, 보도관행, 지역문화 등 다양한 하위 영역에서 병렬적으로 전개되고 있음을 보여준다. 이는 지역언론이라는 연구 대상이 다면적 성격을 갖고 있다는 점에서 학제 간 연구의 확장 가능성과 이론적 융합의 잠재력을 시사하며, 나아가 지역언론 연구의 체계화와 이론적 정교화를 도모할 수 있을 것이다.

네트워크 중심성 분석 결과는 ‘방송’, ‘신문’, ‘보도’, ‘연구’ 등의 전통적 매체와 관련된 키워드가 중심에 위치한 반면, ‘플랫폼’, ‘디지털’, ‘AI’와 같은 최근 기술 변화와 연관된 키워드는 거의 나타나지 않았다. 이는 지역언론 연구가 디지털 전환, 알고리즘 기반 저널리즘, 생성형 AI 활용 등 언론 환경의 급격한 변화에 충분히 대응하지 못하고 있음을 보여준다. 지역언론이 이를 어떻게 수용하고 변용할 것인가는 향후 연구에서 중요한 과제로 제기되어야 한다. 또한, 디지털 미디어 생태계에 적합한 지역언론의 생존 전략, 지역 맞춤형 플랫폼 설계, 공공성과 혁신성의 균형에 대한 논의는 기술 기반 융합연구를 통해 적극적으로 모색될 필요가 있다.

그간 지역언론 연구에 대한 메타분석은 특정 매체나 학술지, 지역에 대해서만 이루어졌으나 본 연구는 전공 분야를 넘어 학제 간 연구논문까지 포함하였으며 지난 10년간 거의 부재했던 지역언론 연구 전반에 대한 동향을 정리했다는 점에서 의의가 있다.

하지만 분석 대상이 초록에 한정되었기 때문에 본문에 포함된 이론적 틀, 연구 방법, 분석 수준 등 기존의 유목 분석을 접목한 논의는 시도하지 못하였다. 또한, LDA 모델은 전반적인 주제 분포를 확인하는 데는 유용하지만 개별 토픽의 맥락적 심화나 의미 해석에는 다소 제한이 따른다. 따라서 향후 연구에서는 본문 전반을 포함한 다층적 분석과 함께 계층적 토픽모델링(hLDA)이나 BERT 기반 토픽모델링 기법 등의 확장적 접근이 필요하다.

References

  • 강주현·최창식 (2021). 지역 언론의 구조적 악순환과 전략적 대안. <한국언론학보>, 65(1), 104-147.
  • 강준만·전상민 (2019). ‘경로의존’의 덫에 갇힌 지역언론학. <한국언론학보>, 63(3), 7-32.
  • 김덕모·강철수 (2012). 지방자치단체의 지역신문 지원조례 추진에 관한 연구. <한국언론학회 학술대회 발표논문집>, 2012(5-1), 241.
  • 김문기·이장석 (2024). 텍스트 마이닝을 활용한 출판학 연구 동향과 특성: 『한국출판학연구』를 중심으로. <한국출판학연구>, 50(1), 5-32.
  • 김병국·김영호 (1990). 지방언론연구의 성찰. 한국언론학회(편), <한국 언론학 연구 30년: 성찰과 전망> (71-72쪽). 한국언론학회.
  • 김영욱·함승경·김영지·최지명 (2017). 사회 쟁점에 대한 비판적 담론 분석: 사드(THAAD) 배치 관련 보도에 대한 빅데이터 분석 중심. <커뮤니케이션 이론>, 13(2), 7-40.
  • 김영호 (1999). 한국 사회의 지역화와 지역언론 연구의 성찰과 과제. <한국언론정보학보>, 12, 71-98.
  • 김인혜·김연신·백태현·최영균 (2024). 한·미 소비자의 친환경 제품에 대한 인식과 소비 행동에 관한 탐색적 연구: 수단-목적 사슬 및 토픽모델링의 적용. <광고학연구>, 35(2), 1-35.
  • 김재영·양선희 (2015). 지역방송 연구에 관한 종합적·분석적 메타분석. <언론과학연구>, 15(1), 162-194.
  • 김현진·이은별 (2022). 보이지만 보이지 않는 ‘그들’: 구소련권 여성 관련 유튜브 콘텐츠의 재현과 수용. <미디어, 젠더 & 문화>, 37(3), 51-92.
  • 김훈순 (2004). 텔레비전 서사연구의 메타분석. <방송통신연구>, 2004(12), 167-197.
  • 나미수·김성진 (2014). 버스파업에 대한 텔레비전 뉴스의 프레임 연구: 전북지역 방송 3사의 저녁종합뉴스를 중심으로. <디지털융복합연구>, 12(5), 377-394.
  • 문길성 (2021). 단문의 주제 분석을 위한 LDA와 BTM 토픽모형 평가. <Journal of The Korean Data Analysis Society>, 23(3), 1313-1326.
  • 문안나 (2016). 한국 사회의 IR 개념: 1994~2014년 신문기사 내용분석 및 의미연결망 분석. <PR연구>, 20(1), 50-78.
  • 박영은 (2024). 버트 토픽(BERTopic) 방법으로 분석한 코로나19 백신 언론보도의 특성과 백신 접종자 수에 미치는 영향 연구: 기계학습과 모델링기법의 결합. <광고학연구>, 35(3), 59-90.
  • 박하늬 (2011). 지역방송사의 문화행사가 조직‒공중관계성과 방송사 이미지에 미치는 영향: 지역 KBS를 중심으로. <예술경영연구>, 20, 85-119.
  • 신우종 (2015). 체계적 고찰과 메타분석의 개요. <Hanyang Medical Reviews>, 35(1), 9-17.
  • 양혜승 (2022). ‘홍어’라 호명되는 타자들: 네이버 범죄뉴스 맥락에서 전라도 혐오성 댓글에 대한 텍스트 마이닝 분석. <지역과 커뮤니케이션>, 26(2), 36-70.
  • 오세욱·정영주 (2024). 탈 포털 시대 지역 언론의 디지털 플랫폼 운영과 정책 지원 방안 연구. <언론정보연구>, 61(2), 112-168.
  • 원용진·황상현 (2011). 지역방송 연구의 경향성에 대한 비판적 고찰: 2000년부터 2010년 발표논문을 중심으로. <언론과학연구>, 11(2), 285-332.
  • 유영돈·마정미 (2015). ‘세종시 갈등’에 대한 뉴스 프레임 연구: 7개 전국 일간지 기사 분석을 중심으로. <한국언론학보>, 59(3), 29-59.
  • 이건혁 (2016). 『언론학연구』의 메타분석 연구. <지역과 커뮤니케이션>, 20(1), 29-51.
  • 이영원 (2015). 지역 신문 구독과 보도 내용이 사회 자본 구성에 미치는 영향에 대한 연구: 전북 지역을 중심으로. <언론과학연구>, 15(4), 245-270.
  • 이영주·조세훈 (2004). 한국 언론학에서의 문화연구에 대한 메타분석과 일비판. <미디어, 젠더 & 문화>, 2, 119-162.
  • 이종탁·정종건 (2009). 지역 지상파방송의 프로그램 제작시스템 구축 현황: 대전지역 지상파방송을 중심으로. <한국콘텐츠학회논문지>, 9(4), 172-180.
  • 이종혁 (2022). 선거 보도에서 정책기사 자동 분류 및 투표율과의 상관관계 분석: 토픽모델링과 머신러닝 연계 분석을 통해. <언론정보연구>, 59(4), 5-58.
  • 이준웅·김성희 (2018). 미세먼지 재해 보도의 프레임 분석: 구조적 주제모형(Structural Topic Modeling)의 적용. <한국언론학보>, 62(4), 125-158.
  • 이진로 (2004). 지역방송의 지역성 구현과 방송법의 규제방안. <한국방송학보>, 18(3), 643-678.
  • 이태준·이승배·오창동 (2017). 원자력 이슈에 대한 정부와 언론의 커뮤니케이션 전략 비교연구: 토픽모델링의 적용. <언론과학연구>, 17(3), 172-229.
  • 이혜선·이경미·조재희 (2022). 언론은 어린이의 스마트폰 이용을 어떤 단어로 재현해 왔는가?: 2011~2021 언론보도 대상 의미연결망 분석과 토픽모델링. <한국언론정보학보>, 114, 204-246.
  • 임영호 (2008). 지역언론학의 학문적 정체성: 쟁점과 진단. <언론과학연구>, 8(4), 5-36.
  • 정미영 (2020). 지역시민의 지역언론 이용동기 및 평가를 통한 지역언론의 방향성 연구: 부산지역 수용자 인식을 중심으로. <지역과 커뮤니케이션>, 24(1), 139-178.
  • 정승혜 (2024). 국내 광고학 분야의 텍스트 마이닝 활용 연구 동향. <광고PR실학연구>, 17(2), 155-178.
  • 정용복 (2021). 지역방송의 연구경향 분석과 과제: 학술지 논문에 대한 메타분석적 접근. <한국방송학보>, 35(3), 40-86.
  • 정용복·최낙진 (2014). 제주지역 언론학 연구의 메타분석: 1998~2013년까지 국내 학술지 게재논문을 중심으로. <탐라문화>, 46, 165-203.
  • 정원준 (2018). 사드(THAAD) 이슈를 둘러싼 한국과 중국 간 갈등 쟁점의 변화 추이 연구: 빅데이터를 이용한 시계열 토픽 모델링과 언어 네트워크 분석 기법으로. <한국광고홍보학보>, 20(3), 143-196.
  • 조영미 (2024. 6. 30). 부산이 사라지고 있다 ⋯ 광역시 최초 첫 소멸위험지역. 부산일보, 1.
  • 주정민 (2015). 지역방송 프로그램 제작역량과 시청률과의 관계 연구. <언론과학연구>, 15(2), 46-71.
  • 최선영·고은지 (2019). 메타데이터를 활용한 1960~2018년 『한국언론학보』 논문 분석: 다이내믹 토픽 모델링 방법을 중심으로. <한국언론학보>, 63(4), 7-42.
  • 최재원 (2022). 미국 지역 언론 사막화 희망은 없나. <신문과방송>, 621, 93-96.
  • 최현주·이강형 (2008). 지역 언론학 연구의 동향과 특성: 1960년-2008년까지의 연구논문을 중심으로. <언론과학연구>, 8(4), 37-67.
  • 한진만 (1997). 지역방송 연구 현황에 관한 소고. <한국방송학회 가을철 학술대회 발표논문집>, 1997(11), 83-99.
  • 황상재·박석철 (2004). 국내 인터넷 연구 메타분석: 연구주제와 방법을 중심으로. <한국방송학보>, 18(2), 68-92.
  • Abernathy, P. M. (2018). The Expanding News Desert. Chapel Hill:University of North Carolina Press.
  • Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent Dirichlet Allocation. Journal of Machine Learning Research, 3, 993-1022.
  • Farea, A., Tripathi, S., Glazko, G., & Emmert-Streib, F. (2024), Investigating the optimal number of topics by advanced text-mining techniques: Sustainable energy research, Engineering Applications of Artificial Intelligence, 136(Part A), 1-21. [https://doi.org/10.1016/j.engappai.2024.108877]
  • Stamm, K. R., Emig, A. G., & Hesse, M. B. (1997). The contribution of local media to community involvement. Journalism & Mass Communication Quarterly, 74(1), 97-107. [https://doi.org/10.1177/107769909707400108]

<그림 1>

<그림 1>
TF-IDF 워드클라우드

<그림 2>

<그림 2>
토픽 수에 따른 일관성과 복잡도

<그림 3>

<그림 3>
토픽 간 거리 지도

<그림 4>

<그림 4>
중심 키워드 네트워크(상위 50개)

<표 1>

국내 지역언론 연구 관련 메타분석

제목 저자 분석유목 분석 논문
지역언론학 연구의 동향과 특성(2008) 최현주, 이강형 연구주제, 분석매체, 분석단위, 논의성격(규범적, 산업분석적, 계량적, 기술적, 비판적), 중심이론, 방법론 293건(학술지, 정기간행물)
지역방송 연구의 경향성에 대한 비판적 고찰(2011) 원용진, 황상현 주제, 연구방법, 연구대상, 관점(생산관리자, 수동적 수용자, 능동적 수용자) 116편
제주지역 언론학 연구의 메타분석(2014) 정용복, 최낙진 연구주제, 연구목적, 연구방법, 분석대상 44편
지역방송 연구에 관한 종합적·분석적 메타분석(2015) 김재영, 양선희 지역방송 자체에 대한 관심, 메시지/수용자, 영향/효과, 개선 62편
(5개 학술지)
‘언론학연구’의 메타분석 연구(2016) 이건혁 논의성격, 연구주제, 분석매체, 방법론, 저자 수, 외부기고 여부, 지역연구 여부, 외부지원 여부 159편
‘언론학연구’
지역방송의 연구경향 분석과 과제(2021) 정용복 저자 수, 연구비 지원 여부, 연구주제(지역방송 자체, 이용자, 효과, 개선방식), 연구방법(양적, 질적), 연구대상, 지역단위 166편(학술지)

<표 2>

연도별 논문수

2000년 2001년 2002년 2003년 2004년 2005년 2006년 2007년 2008년
0 0 5 2 12 12 15 10 19
2009년 2010년 2011년 2012년 2013년 2014년 2015년 2016년 2017년
18 23 20 24 26 25 24 19 16
2018년 2019년 2020년 2021년 2022년 2023년 2024년 2025년
15 10 18 21 17 18 31 4

<표 3>

저자 주제어 빈도

순번 주제어 빈도수 비중(%) 순번 주제어 빈도수 비중(%)
1 지역방송 127 6.5 6 내용분석 10 0.5
2 지역성 72 3.7 7 뉴스프레임 10 0.5
3 지역신문 63 3.2 8 취재원 9 0.5
4 지역언론 55 2.8 9 지역신문발전
지원특별법
9 0.5
5 저널리즘 15 0.8 10 지역미디어 9 0.5

<표 4>

학술지별 논문수

순번 학술지명 편수 비중(%) 순번 학술지명 편수 비중(%)
1 언론과학연구 111 27.4 6 한국콘텐츠학회 논문지 13 3.2
2 지역과 커뮤니케이션 53 13.1 7 언론정보연구 11 2.7
3 한국언론정보학보 41 10.1 8 정치커뮤니케이션연구 11 2.7
4 한국언론학보 35 8.6 9 한국소통학보 10 2.5
5 한국방송학보 25 6.2 10 사회과학연구(충남대) 9 2.2

<표 5>

키워드 TF-IDF

순번 단어 TF-IDF 순번 단어 TF-IDF
1 방송 20.75462 11 지역성 10.22019
2 연구 14.93533 12 콘텐츠 10.08704
3 신문 14.55819 13 방송사 9.471322
4 분석 13.829 14 제작 8.908911
5 뉴스 13.24375 15 미디어 8.900747
6 보도 12.38737 16 정책 8.506173
7 결과 12.02243 17 인식 8.481304
8 프로그램 11.10503 18 방안 8.204085
9 사회 10.98747 19 변화 8.129841
10 언론 10.836 20 기사 8.101376

<표 6>

토픽명 및 핵심키워드

순번 토픽명 핵심 키워드 가중치 순번 토픽명 핵심키워드 가중치
1 지역성 기반 언론과 미디어 정책의 흐름 연구 0.0197 2 뉴스 프레임과 사회 갈등 보도의 구조 보도 0.0498
방송 0.0169 프레임 0.0331
신문 0.0168 뉴스 0.0306
언론 0.0102 분석 0.02
지역성 0.0101 결과 0.0171
분석 0.0098 파업 0.0146
결과 0.0094 갈등 0.014
미디어 0.0084 기사 0.0126
정책 0.0068 연구 0.0108
사회 0.0065 중심 0.0107
3 지상파 방송사의 프로그램 제작과 콘텐츠 전략 방송 0.0753 4 문화 행사와 미디어 수용자 이미지 형성 문화 0.0446
방송사 0.0563 행사 0.0334
프로그램 0.0555 이미지 0.0298
제작 0.0456 공중 0.0225
콘텐츠 0.0268 인식 0.02
편성 0.022 관계성 0.0182
지상파 0.0206 이용 0.016
확대 0.019 영향 0.0155
경쟁력 0.0167 방송사 0.0151
자체 0.0167 요인 0.0148

<표 7>

키워드 연결중심성

순번 키워드 연결
중심성
순번 키워드 연결
중심성
순번 키워드 연결
중심성
1 방송 0.764 16 정책 0.067 31 중앙 0.039
2 연구 0.433 17 지역성 0.067 32 차이 0.039
3 신문 0.404 18 문화 0.062 33 특성 0.039
4 뉴스 0.275 19 기자 0.062 34 기사 0.039
5 보도 0.264 20 영향 0.062 35 대상 0.039
6 분석 0.242 21 역할 0.056 36 문제 0.039
7 결과 0.197 22 인식 0.051 37 발전 0.039
8 프로그램 0.140 23 채널 0.051 38 제주 0.034
9 사회 0.129 24 방안 0.051 39 매체 0.034
10 방송사 0.112 25 광고 0.051 40 독자 0.034
11 언론 0.096 26 중심 0.051 41 부산 0.034
12 콘텐츠 0.090 27 요인 0.051 42 의미 0.034
13 미디어 0.073 28 지원 0.045 43 정보 0.034
14 이용 0.067 29 유형 0.045 44 평가 0.034
15 제작 0.067 30 내용 0.045 45 프레임 0.034