국립부경대학교 | 빅데이터융합전공

Big data 관련기사

작성자,작성일,첨부파일,조회수로 작성된 표
[경향신문. 2022.05.]“경제기사 데이터로 썼더니, 경기 예측 정확도 높아져”
작성일 2022-05-18 조회수 151
첨부파일

경제 기사를 데이터로 활용해 경제 지표를 만들었더니, 전망의 변화를 실시간으로 잘 포착해 공식 통계에 선행하고 예측의 정확도도 높아지는 것으로 분석됐다. 

한국은행 경제통계국 통계연구반 서범석 과장은 16일 ‘뉴스텍스트를 이용한 경기 예측: 경제 부문별 텍스트 지표의 작성과 활용’ 보고서에서 2005년 1월부터 2022년 3월까지 인터넷 포털사이트에 게재된 기사 100만건(연평균)을 분석해보니 이같이 나타났다고 밝혔다. 

예를 들어 주가전망 텍스트 지표의 경우 ‘코스피’, ‘상승’과 같은 특정 단어를 포함하는 문장이 등장하는 기사를 추출하고 이들 기사가 전체에서 차지하는 비중을 계산하는 방식이다. 생산, 물가, 고용, 주택가격 등 15개 부문에 단어군을 선정해 각각의 경제지표를 산출했다. 

보고서에 따르면 이렇게 작성된 뉴스 텍스트 기반 경제지표를 기존 예측모형에 추가하면 ‘국내총생산(GDP) 전년동기대비 증가율 예측’ 평균오차는 기존 0.743에서 0.681로 낮아졌다. 예측 정확도가 향상됐다는 뜻이다. 서 과장은 “텍스트 지표는 조사대상 기준일에 즉시 작성 가능해 주로 익월 중순 이후 발표되는 공식 통계보다 입수 시점이 빠르다”면서 “전문가의 전망 등을 반영해 통계적으로 선행성을 갖기 때문에 GDP 예측력 향상에 기여한 것으로 판단된다”라고 말했다. 

코로나19 영향이 컸던 2020년 6월 말을 살펴보면 텍스트 지표를 공식 통계에 추가한 경우 2020년 2분기 GDP 예측치가 실제에 더 근접하고, 경제 변수들의 변화를 더 잘 포착했다고 설명했다.

또 작성한 텍스트 지표 대부분은 공식 통계와 높은 상관관계를 보였으며, 0∼9개월 선행하는 것으로도 나타났다. 서 과장은 “기존 정량적 통계 모형만으로는 신속한 경기 예측이 어렵다. 보통 대상 시점과 공표 시점이 달라 한 달 이상 지연이 발생하기 때문”이라며 “그래서 최근 많은 연구가 뉴스텍스트 빅데이터의 중요성을 강조하고 있다”라고 말했다. 그는 “뉴스 텍스트는 다양한 전문가의 견해와 전망 등 정성적 정보를 포함하고 있고 실시간으로 입수할 수 있기 때문에 이를 종합하고 정량화해 경기 예측에 활용할 필요가 있다”고 덧붙였다.

 

출처 : 경향신문 2022.05.16. 이윤주기자

다음 [뉴시스. 2022.05.] 과기부, 내달 13일까지 데이터 전문가 육성 교육생 모집
이전 [한국금융 21.08] 신한카드, '데이터 거버넌스팀' 신설…데이터 경제 선도