본문 바로가기
주식 투자하기/종목데이터분석

(데이터분석)S-OIL 주가와 국제유가 회귀분석

by Say_Young 2021. 10. 4.

파이썬의 sklearn 모듈은 회귀분석 툴을 제공하며, matplotlib 모듈은 결과를 시각화 하는데 사용할 수 있다.

회사의 주가와 관련 원자재 사이의 관계가 궁금한데, 대표적인 것이 석유와 석유화학회사이므로 S-OIL의 주가와 국제유가 사이의 회귀분석을 해 본다.

2000년 이후 연도별 평균 주식가격과 평균 유가는 다음과 같다.

연도별 주식가격은 KRX에서 가져왔고, 평균유가는 산업통계분석시스템(ISTANS)에서 가져왔다. 영업이익은 KIND사이트에서 찾을 수 있다. RAWDATA는 엑셀로 약간의 가공이 필요하나, 손쉽게 얻을 수 있었다.

평균유가는 두바이유, 브렌트유, 서부텍사스중질유 가격을 단순평균해서 구했다.

 

1. 연도별 평균유가와 평균주가 회귀분석

연ㄷ별 평균주가와 평균유가, 영업이익

matplotlib으로 시각화 해 보면 아래와 같다.

유가와 S-OIL 주가 산점도 및 회귀선

그래프로 보니까 애매하다. 직접적인 상관관계가 있는 것 같지는 않다. X축과 Y축 자료의 상관계수(R²)를 확인할 수 있다.

reg = linear_model.LinearRegression()
reg.fit(X,y)
print(reg.score(X,y))

결과는 0.43 가량이다.

 

높은 상관관계가 있다고 하기는 어렵겠다. 

 

2. 유가와 영업이익 회귀분석

 

유가와 S-OIL 영업이익 산점도 및 회귀선

이것도 뚜렷한 관계는 보이지가 않는다. 상관계수를 확인해 보자.

 

reg = linear_model.LinearRegression()
reg.fit(X,y)
print(reg.score(X,y))

결과는 0.069 가량이다. 상식적으로 높은 상관관계가 있을 것으로 보이는데, 그렇지 않다는 점이 의외였다(기존에는 정유회사들은 원재료 가격이 떨어지는 사업연도에 높은 이익을 본다고 생각하고 있었다).

분석 과정에서 이상치라거나 수정해야 할 것들이 있는 것으로 보인다. 이 부분은 다른 분석 사례들을 보면서 보완해 나가도록 해야겠다. 

 

3. 유가와 주가 시계열분석

 

시간 흐름에 따른 유가와 주가 사이의 변동을 확인해 보자

댓글