파이썬의 sklearn 모듈은 회귀분석 툴을 제공하며, matplotlib 모듈은 결과를 시각화 하는데 사용할 수 있다.
회사의 주가와 관련 원자재 사이의 관계가 궁금한데, 대표적인 것이 석유와 석유화학회사이므로 S-OIL의 주가와 국제유가 사이의 회귀분석을 해 본다.
2000년 이후 연도별 평균 주식가격과 평균 유가는 다음과 같다.
연도별 주식가격은 KRX에서 가져왔고, 평균유가는 산업통계분석시스템(ISTANS)에서 가져왔다. 영업이익은 KIND사이트에서 찾을 수 있다. RAWDATA는 엑셀로 약간의 가공이 필요하나, 손쉽게 얻을 수 있었다.
평균유가는 두바이유, 브렌트유, 서부텍사스중질유 가격을 단순평균해서 구했다.
1. 연도별 평균유가와 평균주가 회귀분석
matplotlib으로 시각화 해 보면 아래와 같다.
그래프로 보니까 애매하다. 직접적인 상관관계가 있는 것 같지는 않다. X축과 Y축 자료의 상관계수(R²)를 확인할 수 있다.
reg = linear_model.LinearRegression()
reg.fit(X,y)
print(reg.score(X,y))
결과는 0.43 가량이다.
높은 상관관계가 있다고 하기는 어렵겠다.
2. 유가와 영업이익 회귀분석
이것도 뚜렷한 관계는 보이지가 않는다. 상관계수를 확인해 보자.
reg = linear_model.LinearRegression()
reg.fit(X,y)
print(reg.score(X,y))
결과는 0.069 가량이다. 상식적으로 높은 상관관계가 있을 것으로 보이는데, 그렇지 않다는 점이 의외였다(기존에는 정유회사들은 원재료 가격이 떨어지는 사업연도에 높은 이익을 본다고 생각하고 있었다).
분석 과정에서 이상치라거나 수정해야 할 것들이 있는 것으로 보인다. 이 부분은 다른 분석 사례들을 보면서 보완해 나가도록 해야겠다.
3. 유가와 주가 시계열분석
시간 흐름에 따른 유가와 주가 사이의 변동을 확인해 보자
'주식 투자하기 > 종목데이터분석' 카테고리의 다른 글
(데이터분석)버밀리온 에너지 주가와 유가 시계열 분석(Vermillion Energy, VET) (0) | 2021.10.08 |
---|
댓글