보고서 요약 (by ai)

ai요약 : [BOK 경제연구] 서범석, 이영환, 조형배 [제2022-15호] Machine-Learning-Based News Sentiment Index (NSI) of Korea- 발행 : 2022.09.26

Sam_Park 2024. 11. 20. 11:53

- 출처 링크 : https://www.bok.or.kr/imer/bbs/P0002456/view.do?nttId=10072850&searchCnd=1&searchKwd=&depth2=500535&depth=500535&pageUnit=10&pageIndex=5&programType=rsrchrData&menuNo=500789&oldMenuNo=500216

 

 


- 출처 링크 본문

제목: 한국의 기계학습 기반 뉴스심리지수
저자: 서범석(경제통계국 통계연구반), 이영환(경제통계국 통계연구반), 조형배(경제통계국 통계연구반)

<요약>
 본 논문은 인터넷에서 스크랩한 뉴스기사를 일별로 분석하여 국내 경제주체들의 경제심리를 추정하는 한국의 뉴스심리지수(news sentiment index, NSI) 개발방법을 제시하였다. 이를 위해 일련의 자연어처리 기법들을 활용하였으며 NSI 작성에 적합하도록 트랜스포머(transformer) 인공신경망 모형을 기반으로 감성분류 모형을 구축하였다. NSI는 월별 서베이에 의존하는 공식 통계보다 고빈도로 신속하게 작성하는 것이 가능하며 따라서 공식통계 발표전에 경제 심리변화를 포착하는 데 유용하다. 또한, NSI는 경제심리 변화 요인을 키워드 분석과 부문별 지수 작성을 통해 파악 가능한 점도 장점이다. NSI는 사람의 개입 없이 자동으로 추계되도록 설계되었다. 본 논문은 작성한 NSI의 타당성과 유용성을 여러 각도에서 평가하였다. 평가 결과는 NSI가 선행 지표로서 유용하며 경제심리의 변곡점 포착에 유용한 정보를 제공할 수 있음을 시사한다.


 We develop the Korean news sentiment index(NSI) that measures the economic sentiment of Korea by computing it daily from the news texts scrapped from the internet. We use a set of natural language processing techniques and develop a state-of the-art transformer-neural-network-based sentiment classifier particularly designed for computing NSI of Korea. The proposed model handles large news samples effectively and computes NSI efficiently. NSI is more frequently and immediately compiled than official indices based on monthly surveys, and hence, helps to identify changes in economic sentiments before the official statistics are released. Also, NSI provides explanations for why the economic sentiments fluctuate via its keyword analysis and sector indices. NSI is designed to be compiled automatically. We assess the validity and utility of NSI from multiple perspectives. The assessments support our findings that NSI is useful as a leading index and informative to find inflection points in economic sentiments.

 

 

---

chat GPT 4o 요약 프롬프트 

PDF 파일의 내용을 요약해 주세요. 요약은 다음 기준을 따르세요: 1. 전체 문서의 주요 목적과 결론을 포함하세요. 2. 각 섹션의 핵심 내용을 간략히 설명하세요. 3. 중요 데이터나 통계가 있다면 포함하세요. 4. 기술적 용어는 가능한 쉽게 설명해 주세요. 5. 요약 길이는 500 단어 정도로 해주세요

---

 

 

문서 "BOK 경제연구 제2022-15호 합본"은 일간 인터넷 뉴스 데이터를 머신러닝을 통해 분석하여 한국의 경제 심리를 측정하는 한국 뉴스 심리지수(NSI)의 개발과 검증을 다루고 있습니다. 한국은행이 개발한 NSI는 기존의 설문 기반 지표보다 더 신속하고 비용 효율적인 대안으로, 경제 변동을 조기에 파악할 수 있도록 돕습니다.

주요 섹션 및 요약:

  1. 서론: NSI는 자연어 처리(NLP) 기술과 트랜스포머 신경망 모델을 활용해 한국어 경제 뉴스 기사를 분석하여 실시간으로 경제 심리를 측정합니다. 이를 통해 월간 설문 기반 지표보다 빠르게 경제 변화를 감지할 수 있는 선행 지표를 제공합니다.
  2. NSI 작성 과정: NSI는 매일 뉴스 기사에서 긍정적, 부정적 문장을 분석하여 경제 심리를 측정합니다. 트랜스포머 모델은 한국어 텍스트에 맞춰 조정되어 뉴스 문장을 웹 스크래핑과 토큰화 과정을 거친 후 분석합니다. 하루에 10,000개의 문장을 샘플링하여 특정 날짜의 감정 편향을 피하고 있습니다. 전처리 과정에서 텍스트가 구조화된 숫자 데이터로 변환되어 모델이 이해할 수 있게 합니다.
  3. KoNS 감정 분류기: KoNS(한국 뉴스 심리) 분류기는 트랜스포머 신경망을 기반으로 설계되었으며, 문장의 감정을 보다 정확하게 평가하기 위해 멀티헤드 어텐션을 적용합니다. 이 구조는 비정형 텍스트의 특성과 경제 뉴스 주제의 다양성을 고려하여 예측 정확도를 높입니다.
  4. 모델 학습과 데이터: 학습 데이터는 훈련된 담당자들이 분류한 40만 개 이상의 문장으로 구성되어 있으며, 80%가 중립으로 분류되고 20%는 긍정 및 부정으로 나누어집니다. 주식 가격이나 정부 정책과 같은 경제 주제에 따라 감정을 일관되게 분류할 수 있도록 최소한의 가이드라인이 제공됩니다. 머신러닝 모델은 감정 분포의 불균형을 고려하여 예측력을 개선합니다.
  5. NSI 계산 방식: NSI는 특정일로부터 7일 동안의 긍정 문장과 부정 문장의 비율을 통해 계산되며, 일간 변동을 완화하기 위해 일주일 평균을 사용합니다. 월간 NSI도 동일한 방법으로 주간 단위로 평균을 내며, 일간 및 월간 감정 지표를 제공합니다. 표준화 과정을 통해 과거 감정 수준과의 비교가 용이하며, 100 이상은 긍정적, 100 이하일 경우 부정적 경제 심리를 나타냅니다.
  6. 유효성 및 유용성: NSI의 유효성은 소비자심리지수(CSI) 및 경제심리지수(ESI)와 같은 전통적인 지표와 비교하여 입증되었으며, NSI가 경제 감정의 선행 지표로 효과적임을 보여줍니다. 벡터 자기회귀(VAR) 모델을 사용한 추가 분석에서도 NSI 변동이 거시 경제 변수와 연관성이 있는 것으로 나타나, NSI가 신뢰할 수 있는 경제 심리 지표임을 확인했습니다.
  7. 자동화 및 효율성: NSI는 주간 자동 업데이트되도록 설계되어 설문 방식에 비해 효율적이고 노동 비용이 절감됩니다. 자동화된 데이터 수집 및 분석을 통해 감정 지수를 지속적으로 업데이트할 수 있으며, 한국은행의 경제 모니터링 역량을 강화합니다.

결론:

NSI는 대규모 뉴스 텍스트에서 NLP와 머신러닝을 활용하여 한국 경제 심리를 측정하는 선행 지표를 제공합니다. 이는 특히 중앙은행 정책 수립에 유용한 경제 심리 모니터링 도구로써, 실시간으로 경제 동향을 예측하는 데 도움을 줍니다. 또한, 다른 분야에서도 실시간 공공 심리 분석에 활용할 수 있는 좋은 선례가 됩니다.

이 문서는 NSI가 경제 분석에서 중요한 역할을 할 수 있음을 강조하며, 자동화된 실시간 통찰을 통해 경제 동향을 조기에 파악할 수 있는 유용한 도구임을 보여줍니다.

원문 링크의 요약 파일에 나오는 그림