연구성과물검색
유형별/분류별 연구성과물 검색
HOME ICON HOME > 연구과제 검색 > 연구과제 상세정보

연구과제 상세정보

수리모형 기반 모수적 계량분석 기법과 딥러닝 기반 비모수적 통계 기법을 이용한 금융 네트워크 계층 구조 및 시스템 리스크 예측과 분석
The analysis on the hierarchial structure of a financial network and the systemic risk by parametric econometric and deep-learning methods
  • 연구자가 한국연구재단 연구지원시스템에 직접 입력한 정보입니다.
사업명 신진연구자지원사업& #40;인문사회& #41; [지원년도 신청 요강 보기 지원년도 신청요강 한글파일 지원년도 신청요강 PDF파일 ]
연구과제번호 2017S1A5A8022379
선정년도 2017 년
연구기간 2 년 (2017년 05월 01일 ~ 2019년 04월 30일)
연구책임자 유재인
연구수행기관 아주대학교
과제진행현황 종료
과제신청시 연구개요
  • 연구목표
  • 본 연구에서는 금융 시장 자산 위험성들을 측정하고, 미시적인 위험 요소들 간 상호작용을 측정하여 금융 네트워크 구조를 밝힌다. 미시적 위험 요소들 간 상호 작용 메카니즘을 밝히기 위하여 먼저 물리학 및 수학 관점에서 바라본 독립적인 개체들이 이루는 군집의 특성을 모형화 한 수리 모형을 참고한다. 본 연구에서는 고빈도 자산 거래 데이터를 활용하여 고빈도 자산 수익률의 변동성 및 위험성을 측정한 후, 자연과학 빅데이터 분석 대상 현상들로만 여겨졌던 Herding, Flocking, Time-delay 등에 대한 통계적 특성들을 분석하여 기존 금융공학실증연구의 접근방법과는 차별성을 꾀한다. 특히 본 연구에서 집중적으로 밝히고자 하는 네트워크의 구조는 계층적(hierarchial) 구조이다. 구체적으로 어떤 특성을 가진 개체들이 군집의 평균적인 움직임을 리드하는지, 앞서 나가는 리더를 쫓아 추종하는지, 그리고 군집의 평균적인 움직임과 관련이 없는 위험요소들은 어떤 것인지 밝힌다. 계층을 구분 짓는 것은 군집의 평균적인 움직임과의 선형관계(상호 거리 및 상호선형 관계) 혹은 인과관계(예컨대, 그랜저 인과관계)이며 전염병의 확산 경로를 연구하는 물리학 및 전염학 논문들의 수리 모형을 바탕으로 통계적 특성을 살펴본다. 나아가 계층을 이루는 요소들의 변화뿐만 아니라 계층 간 관계성 변화 분석을 통해 금융 네트워크의 구조적 역동성을 분석한다.
    네트워크 이론을 연구한 주요 논문들이 자연현상의 군집적 특성을 바탕으로 모수적 계량 분석을 시행한다. 그러나 기존 네트워크 구조 모형들이 금융 네트워크 구조 분석에도 적합한지에 대해서는 알 수 없기 때문에 모수적 통계 분석 기법이외에도 비모수적 기법을 활용한다. 본 연구에서 활용할 비모수적 분석 기법은 빅데이터를 분석하기에 적합한 딥러닝 기반 데이터 분석 기법이다. 여러 뉴런(Neuron)과 신경망으로 구성된 심층 신경망(Deep Neural Network)을 구성하여 딥러닝을 위한 환경을 조성한다. 이 비모수적 분석 기법에 의한 분석에서는 요소들을 추출하거나 특이한 위험을 갖고 있는 요소들의 특징을 정리하기보다는 심층 신경망을 통해 학습한 빅데이터의 요소들을 바탕으로 샘플 외 기간의 시스템 리스크의 크기와 변동성을 예측하는 데 집중한다.
    모수적 및 비모수적 분석을 시행한 후, 각 분석 방법의 예측 오차 비교 분석을 통해 두 분석 방법의 실효성을 비교하고 각 방법의 분석 단계 별 선택적 접근을 통해 하이브리드 형 분석 기법을 개발한다. 분석 기법의 개발 과정에서의 목적 함수는 1) 금융 네트워크의 시간에 따른 변화를 효율적 감지 2) 시스템 리스크 추세의 정확한 예측력으로 구성된다. 구체적으로 딥러닝에 기반한 비모수적 분석의 예측 오차가 모수적 통계적 접근에 의한 예측 오차에 비해 어떤 값을 갖는지 비교를 통해 금융 빅데이터 분석 최적화 작업을 시행한다. 이후 하이브리드 형 금융 빅데이터 분석 방법을 통해 금융 네트워크 내 계층적 구조 및 실시간 변화하는 계층 간 관계와 계층 간/계층 내 결속력의 변화를 분석하여 금융시장의 시스템 리스크를 유발하는 외부충격의 원천과 전이 경로 등을 추적하는 데 새로운 방법을 제시한다.
  • 기대효과
  • 본 연구에는 통시·종합적인 안목이 필요한 만큼 연구 분석도구와 범위를 비단 금융/재무의 전통적인 이론에 치우치지 않고, 학제 간 융합연구를 추구하여 융합연구사례로서 가치를 지닌다. 융합연구의 구체적인 계획으로서 시장 메카니즘 분석을 진행하며 과학적인 수리모형과 수치 분석을 가지고 객관적인 정보 분석을 수행하는데 필요한 자연과학/기계공학 전공자들의 문헌조사 및 연구 결과를 흡수할 수 있도록 적극적인 연구교류를 수반하며 응용수학, 물리학에도 사회과학연구의 파급효과를 기대할 수 있다. 본 연구의 방법론은 기존 수리통계 및 계량재무학에서 벗어나 빅데이터 현상적인 접근을 추구하므로 데이터 분석 기법 발전에도 이바지 할 것으로 기대된다. 나아가 금융 빅데이터에 적합한 심층 신경망을 밝혀내는 연구에도 이바지 할 수 있어 딥러닝의 금융데이터 분석에도 이바지할 수 있을 것으로 보인다. 본 연구의 현상 분석 기법은 금융시장의 현 실무진들이 이해할 수 있는 직관적인 패턴으로 정리될 수 있으며, 이를 누구나 확장하여 사용할 수 있도록 패턴분석 프로그램을 제공하고, 시장 참여자들의 피드백을 받아 더욱 발전시킬 계획이다.
  • 연구요약
  • 본 연구는 금융 시장 내 개별 자산들의 위험 혹은 변동성 간 역학관계에 대한 이해를 도와 군집 혹은 시장 전반의 리스크를 측정하는 데 목적을 두고 있다. 다양한 형태의 군집 현상을 해석하는 데 도움이 되는 패턴들을 뽑아내고 이로부터 예측에 용이한 특성을 추출하는 데 수리모형에 기반한 모수적 계량분석과 심층신경망을 이용한 기계학습(딥러닝)기법을 적용한다. 먼저 수리 모형을 기반으로 한 모수적 방법을 이용한 네트워크 내 개별 위험성 간 상호 연관 구조 형태를 모형화하기 위해 자연과학 현상 – 예컨대, 새와 양의 무리, 전염병의 전달 경로 등 – 의 물리적 원리를 설명한 메카니즘을 응용한다. 다양한 자연 네트워크 내 개체 간 정보교류 패턴을 설명하기 위해 상호교류비중 및 개체 간 연결 강도 모수가 중요한 역할을 한다. 상호교류비중모수는 개체들 간 거리 및 관계, 상호 교류 횟수 등과 함수관계를 가지며 실시간 변화하는 네트워크의 결속력을 대표한다. 이 결속력 함수에 따라 상호 교류가 가능한 네트워크 반경 내 위치한 개체들은 끊임없는 일대일 상호작용을 통하여 금융 시장 충격 및 뉴스들을 공유한다. 본 연구에서 주목하는 것은 네트워크의 계층적 구조이다. 즉, 네트워크 안에서 충격을 선도적으로 흡수하고 기타 개체들에게 적극적으로 전파시키는 리더 그룹과 수동적으로 (때로는 시차를 두고) 반응하는 잠복기(incubation period)에 머무르고 있는 추종 그룹을 구분하는 특성을 파악한 후, 이 구조에 따라 충격이 시스템적으로 어떻게 전이되는지 살핀다. 이 구조를 실증검증하기 위하여 고빈도 거래 자료를 일정한 길이의 윈도우 별로 여러 자산들의 수익률 및 위험성으로 구성한 다음 긴 시간동안 윈도우를 계속 회전시켜 빅데이터를 구성한다. 데이터를 바탕으로 자연현상에서 관찰되는 군집의 패턴 – Clustering, Herding, Flocking등 – 의 특성이 있는지 통계적 특성을 정리한다. 군집현상의 패턴을 반영할 수 있는 모수적 수리모형을 세우고, 이 수리모형에 따라 그랜저 인과관계를 따진다. 통계적으로 유의한 인과 관계를 갖는 요소들을 바탕으로 벡터자기오차수정모형 혹은 벡터자기상관모형을 통해 시스템적 리스크를 예측하는 데 기여하는 미시적 위험성 개체들을 선별한다. 모수를 추정하고 계층적 구조를 입증하는 실증 근거를 찾아낸다. 나아가 모수적 계량방법으로 측정하기 힘든 미시적/거시적 충격 및 이에 따른 미시적 위험도들의 상관관계를 심층신경망 구조에 입각한 딥러닝 메카니즘에 의하여 밝혀내고, 그룹 간 상관관계의 변화도 추적한다. 이 비모수적 분석 기법에 의한 분석에서는 요소들을 추출하거나 특이한 위험을 갖고 있는 요소들의 특징을 정리하기보다는 심층 신경망을 통해 학습한 빅데이터의 요소들을 바탕으로 샘플 외 기간의 시스템 리스크의 크기와 변동성을 예측하는 데 집중한다.
결과보고시 연구요약문
  • 국문
  • 본 연구는 금융 위기를 겪는 동안 금융 시장 자산 수익률이 예상 밖의 움직임을 보이면서 부각된 변동성 간 상호 작용 및 시장의 시스템 적 위험성 측정과 예측의 정밀도를 높이는 데 목표를 두고 진행되었다. 전통적으로 자산 변동성 및 위험을 측정 및 예측하는 연구들은 주로 Engle(1982)의 변동성 자기 상관 관계성(클러스터링(Clustering) 현상) 연구 이후 하나의 개별 자산의 변동성 패턴을 설명하는 데 중점을 두었다. Engle (1982)의 조건부 이분산성을 기반으로 여러 변동성과 위험성의 흐름을 동시 추적하는 모형(예컨대, Kroner and Ng (1998))도 소개되었는데 다변량 조건부 이분산성 관련 연구는 조건부 공분산 행렬의 비대칭성이 통계적으로 유의하다는 것을 보였다. 이는 Ang and Chen (2002)의 다양한 시장 포트폴리오들이 비대칭 선형관계를 갖는다는 결론과도 일맥상통한다. Baillie and Bollerslev (1996), Bollerslev and Engle (2010) 와 Bollersleve (2013)에서는 다변량 조건부 이분산성을 연구하였으나 조건부 이분산성을 일으키는 변동성들 간의 성질에 대해 이론적인 원리를 연구하기 보다는 통계적으로 유의한 패턴을 찾아내는 데 주목하고 이 패턴 분석을 통해 수익률 흐름의 예측력을 높이는 모형 개발에 중점을 두었다.
    관련 연구들은 변동성의 패턴을 다양한 각도에서 분석하고자 하였으나 기본적으로 대표 자산의 일정 기간 평균 가격을 중심으로 수익률을 산출하고, 잔차의 분산 혹은 변동성이 독립적이라는 가정을 바탕으로 분석을 진행한다. 기존 연구들은 주로 자산 수익률 확률분포를 특정 고정 분포로 가정하고 있기 때문에 각기 다른 변동성 간의 교류 혹은 선형관계를 0으로 가정한다. 이러한 제약적인 가정들 때문에 다양한 변동성 간의 교류를 감안한 네트워크 구조 및 시스템 차원의 분석이 불가하고, 실질적인 시스템 리스크를 측정하는 데 한계를 갖는다. 그러나 본 연구의 결과물들에 따르면 실물 주식 수익률 및 변동성은 다른 수익구조를 지닌 기업들의 주식 발행관련 요인들에 의해 영향을 받으며 나아가 한 변동성에 영향을 끼치는 요인이 기타 변동성의 미래 흐름에 영향을 끼치기 때문에 시장 외부 충격에 민감한 변동성이 지속적으로 충격을 받으면서 시장 전체에 피로감을 불러일으키는 현상을 관찰할 수 있다. 지난 2년 간 본 연구에서는 금융 시장 자산 위험성들을 측정하고, 시장을 교란시키는 특정한 자산 및 애널리스트들의 예상 주가 등을 포함한 미시 정보 제공자들의 상호작용을 측정하여 금융 네트워크 구조를 분석하였다. 특히 다양한 금융 자산들의 개별 수익률 혹은 변동성 간 상호 작용 메카니즘을 밝히고 이를 바탕으로 거시 경제 환경 및 금융 시장의 시스템 위험도를 정확히 측정하는 데 궁극적인 목적을 두고 연구가 진행되었다.
    미시적 위험 요소들 간 상호 작용 메카니즘을 밝히기 위하여 먼저 물리학 및 수학 관점에서 바라본 독립적인 개체들이 이루는 군집의 특성을 모형화 한 수리 모형을 참고한다. 본 연구에서는 고빈도 자산 거래 데이터를 활용하여 고빈도 자산 수익률의 변동성 및 위험성을 측정한 후, 자연과학 빅데이터 분석 대상 현상들로만 여겨졌던 Herding, Flocking, Time-delay 등에 대한 통계적 특성들을 분석하여 기존 금융공학실증연구의 접근방법과는 차별성을 꾀하였다. 본 연구는 두 가지 분석 방법을 중점으로 진행하고자 하였다. 먼저 수리 모형을 기반으로 한 모수적 방법을 이용한 네트워크 내 개별 위험성 간 상호 연관 구조 형태를 모형화하기 위해 자연과학 현상 – 예컨대, 새와 양의 무리, 전염병의 전달 경로 등 – 의 물리적 원리를 설명한 메카니즘을 응용하는 연구이다. 다양한 자연 네트워크 내 개체 간 정보교류 패턴을 설명하기 위해 상호교류비중(communication weight) 및 개체 간 연결 강도(Coupling strength) 모수가 중요한 역할을 한다. 상호교류비중모수는 개체들 간 거리 및 관계, 상호 교류 횟수 등에 따라 변화한다. 상호 교류가 가능한 네트워크 반경 내 위치한 개체들은 끊임없는 일대일 상호작용을 통하여 개별 충격 및 뉴스들을 공유한다. 본 연구에서는 특히 Cucker and Smale (2007)의 수리모형을 주요 모티브로 삼아 금융 시장 데이터에 반영하고, 이를 통해 응용 수리 모형을 개발하고자 하였다.
    본 연구의 i) 연구와 같이 수리모형에 입각한 데이터 분석 방법은 통계량에 대한 강한 가정을 바탕으로 정보를 제공하는 만큼 금융 시장에 관한 미시적 특성이 생략되는 경우가 빈번히 발생한다. 본 연구에서는 이러한 수리 모형에 입각한 계량 분석의 한계점을 극복할 수 있는 ii) 딥러닝(Deep learning) 기법도 활용하고자 하였다. 특히 본 연구에서 주목하고자 하는 금융 데이터의 특성은 시계열 및 횡단면의 고빈도 빅데이터에서 추출할 수 있는 금융시장 내 네트워크 구조이다. 예컨대 수익률이 내포하고 있는 변동성 간 역학 관계의 구조 및 금융 기관 간 유동성 거래를 통해 나타나는 특히 기타 변동성 관련 모형과는 달리 주식 수익률의 변동성 간 네트워크 구조를 설명하기 위해 실시간 실현 변동성(realized volatility)의 네트워크 형태와 연결 집중도의 변화에 대한 추적 및 분석이 가능하다. 금융 네트워크의 변화하는 형태 및 연결 강도를 자동으로 생성해 내는 심층신경망 생성 모델연구는 학술적인 기여뿐만 아니라 산업현장에서도 많이 사용될 수 있을 것으로 기대하고 있다.
  • 영문
  • Understanding volatility dynamics is critical in asset valuation and risk management for investors. Soaring volatilities across asset classes particularly during a nancial crisis have led more discussions on how accurately we can predict and explain volatility dynamics. Most volatility forecasting models focus on mapping the current information set into a volatility forecast under the assumption that the set underlying conditional expectations are not directly measurable. Autoregressive conditional heteroskedasticity (ARCH) model (Engle (1982)) is one of them, which has advanced the analysis of a nancial time series by taking the size of previous time period variances into account when estimating the variance of the current error term. In this study, we study the role of multi-volatilities' network structure in volatility prediction by proposing a simple but intuitive approach: detecting the dynamics in the pairwise distances between stock return volatilities to nd volatilities' dynamic commonalities. A relative position of a volatility, as a member of a volatility network provides useful information. In designing time-varying impact of pairwise distances in volatility dynamics, we refer to a mathematical model based on Vicsek et al. (1995) and a more general particle dynamics model introduced by Cucker and Smale (2007). This investigation of time-dependent distance allows us to detect the mechanism by which volatilities form a phase of flocking while heterogeneous volatilities retain their short-range communication even when each rm's volatility is treated like an autonomous particle. The structure of this short-range communication species the path of a future volatility. That is, a future volatility is conditional on multi-volatilities' autoregressive processes with time-varying pairwise distance between volatilities in their community.

    In another branch of the study, we use a LSTM network with lagged individual stock returns to predict future S&P 500 Index composite returns. We compare the performance of the features selected and trained by an autoencoder (AE) and a LSTM with that of factors selected by principal component analysis (PCA).
    We test the predicting performance of features extracted by different AEs – an AE, a denoising autoencoder (DAE), and a contractive autoencoder (CAE). Additionally, we contribute to developing the integrated system of an AE and a LSTM. In consolidating an AE and a LSTM, we establish two architectures. The first architecture is built consecutively by extracting features from a selected AE and then transferring the features into a LSTM network. In this system, a LSTM trainable layer refers to the fixed features and provides the loss function from the last layer. We compare the loss function of this end-to-end AE+LSTM system with that of an integrated system. Our second architecture is so-called a multitasking AE+LSTM because the features can be updated and shared by both an AE and a LSTM network simultaneously. Consequently, the multitasking AE+LSTM trains itself to achieve the objective function, which consists of two loss functions. We show that the features estimated in a combined AE+LSTM network, either an end-to-end or a multitasking network, outperforms the ordinary least squares (OLS) regression by principal components of Granger-causing individual stock returns in predicting S&P 500 composite return.
연구결과보고서
  • 초록
  • 본 연구의 목표는 다양한 금융 자산들의 개별 수익률 혹은 변동성 간 상호 작용 메카니즘을 밝히고 이를 바탕으로 거시 경제 환경 및 금융 시장의 시스템 위험도의 정확한 측정 및 효율적 예측이다. 본 연구가 기존의 타 연구와 차별되는 점은 한 시스템 안에서 제시된 수리 모형은 기존 자연과학, 물리학적인 현상에서 흔히 관찰할 수 있는 독립적인 개체들의 - 이를테면, 물고기, 새, 입자 등 - 군집현상이다. 군집 현상을 설명하기 위하여 개체들끼리의 대칭적 다중 교류뿐만 아니라 소규모 그룹 단위 교류 및 한 개체가 일방적으로 영향을 주고 그 효과가 순차적으로 전이되는 비대칭적 교류 등 다양한 형태의 상호작용 메카니즘을 분석한다. 이러한 메카니즘을 모형화 한 이론을 바탕으로 금융 시장 안에서의 독립적개체 간 상호 작용을 설명할 수 있을 때, 거시 경제 환경에 영향을 주는 다양한 요인의 변화에 따라 시스템 리스크가 어떻게 발화하는지도 본 연구의 중요한 연구 대상이다. 시스템 리스크 측도를 찾기 위하여 시계열적 위험과 횡단면적 위험 두 가지 측면에서 실증 분석을 시행한다. 예컨대 주식 수익률 혹은 변동성 간 상호 연계 강도의 시간에 따른 추이 분석과 한 시점에서 상호 연계 강도의 구도를 분석하는 작업이 동시 시행된다.
    나아가 보다 정확하고 시의 적절한 시스템 리스크 측정을 위해 다양한 상품과 수많은 자산들이 거래되는 시장의 특성을 반영할 수 있도록 시스템 리스크가 민감하게 반응하는 시장 지표의 선별을 통해 종합 지표를 구성하기로 한다. 지표들의 민감성 테스트에서는 실증 분석 데이터를 가지고 로짓, 프로빗, 최대우도추정 방법 등 다양한 모수/비모수 추정 방법을 비교 분석한다. 시스템 리스크와 밀접한 관련성을 지닌 시장 지표 선별 후 금융 위기로 분류되는 기간들의 상호 연계 강도 및 구도의 특징을 잡아내고 비대칭성 등을 파악하여 미시적 개체들의 움직임이 어떤 파급력을 얼마동안 가지는지 보여줄 수 있을 것으로 기대된다.
  • 연구결과 및 활용방안
  • 본 연구의 1년 차에서는 자산 가격의 수익률과 변동성 데이터를 분석하였고, 2차 년도 에서는 시장 참여자들의 계층적(hierarchial) 구조를 분석하였다. 2개년도 연구를 수행하는 동안 i) 수리 모형 기반 분석 방법과 ii) 데이터의 딥러닝 분석 기반 비모수 추정 방법을 동시에 활용하였기 때문에 2개년도 모두 양 방법을 활용한 연구를 동시적으로 진행하였다. 먼저 다우존스에 상장한 기업들의 다년간 수익률을 바탕으로 수익률 간 일대일 상호 교류가 대칭적으로 진행된다고 가정하고 Cucker and Smale (2007)의 뭉침 현상을 분석한 논문의 수리 모형을 바탕으로 거래일 1일 기준으로 확률적 뭉침 메카니즘을 설명한다. 나아가 비대칭적으로 상호 교류가 이루어지는 경우를 상정할 수 있다. 현재까지의 실증 데이터 분석 결과 비대칭적 상호 교류가 수익률과 가격 변동성의 네트워크 형태를 좀 더 잘 투영하는 것으로 나타났다. Cucker and Smale (2007)과 Bae et al. (2015)의 논문을 바탕으로 수익률과 변동성을 개체로 삼아 상호 교류 네트워크의 단순화 된 모형을 선보인 후 이를 확장시켜 종합적인 모형을 설립하며 각 모형 별 가상 데이터 시뮬레이션 결과를 정리하였다. 각 모형 마다 설명가능 한 현상이 다르므로 시뮬레이션 결과 치를 시장 별 실증 데이터 분석 결과와 비교하여 연구 대상 별 가장 적합한 모형을 찾아내기로 한다.
    2차 년도에는 1차 년도 연구를 수행하면서 필요했던 금융시장 데이터들을 보충하고, 이 데이터를 분석하는 데 집중하였다.
    위 연구에서 진행하였던 애널리스트들의 예측 가격은 수리모형의 시뮬레이션 결과처럼 장기적으로 갈수록 한 데로 뭉치는 현상을 보인다. 애널리스트 대이터 분석은 애널리스트 특성을 고정효과로 고려한 연구를 진행할 필요가 있기에 I/B/E/S 데이터를 확보하여 이를 바탕으로 시장 환경 변화에 따른 애널리스트 의견 뭉침 현상 및 관련 예측 주가들의 분포도 변화를 추적하는 연구를 계획하고 있다.
    한편으로 실제 참여자들의 주문 스타일을 분석하기 위해서는 매도, 매수 주문 가격과 주문량에 대한 분석이 보충되어야 한다. 따라서 본 연구에서는 1초에도 수많은 주문 가격과 주문량을 포함한 고빈도 거래 데이터를 Thomsen Reuters의 Tick History 데이터에서 수집하였고, 이를 통해 매도, 매수 주문시점과 주문량으로 빗대어 볼 수 있는 참여자들의 시장 참여 행위 관련 데이터와 고빈도 자산 수익률 데이터를 매칭하여 구체적으로 어떤 특성을 가진 개체들이 군집의 평균적인 움직임을 리드하는지, 앞서 나가는 리더를 쫓아 추종하는지, 그리고 군집의 평균적인 움직임과 관련이 없는 위험요소들은 어떤 것인지 밝히는 연구를 계속하고 있다.
  • 색인어
  • 변동성, 수리모형, 군집현상, 비모수추정, 딥러닝
  • 연구성과물 목록
데이터를 로딩중 입니다.
데이터 이용 만족도
자료이용후 의견
입력