こんばんは
データサイエンスの重要性をひしひしと感じている今日この頃です。。。
普段は実験系の研究職としてサラリーマンをやっていますが、今後はただの実験科学者よりもデータサイエンティストが求められる時代だということで最近は独学でプログラミングやデータサイエンスの勉強を始めました。
まえがき
PS4がハードで、メタルギアがソフトであるということしかわからない超初学者でしたが、1ヶ月ほど勉強して少しずつデータ解析ができるようになってきました。
今日はPythonを使って財閥化学系銘柄の2019年の株式データ解析をやってみたのでご報告します。
なお、プログラミングはこちらのプログラムで独学で勉強しました。
【世界で5万人が受講】実践 Python データサイエンス・オンライン講座
各社の株式データ
はじめに日本の化学銘柄の代表株である三菱ケミカル、住友化学、三井化学の株式のデータについて、各社の2019年分のデータを取得しました。例えば三菱ケミカルの場合以下のようなデータとして取得できています。
High:高値、Low:低値、Open:始値、Close:終値、Volume:出来高、Adj Close:調整終値です。
三菱ケミカルの株価推移の確認
ここで、三菱ケミカルの1年間の株価について横軸に日付、縦軸に調整終値および10,20,50日移動平均線を記載すると以下のようになります。(図左)
右の図が実際にweb上に公開されている株価の推移ですが、ピークの形状が同じなので、計算は合っていそうですね。


各社の値動きに相関はあるのか
次に各日の調整終値の変化率(日ごとの値動き率)を計算して、三菱ケミカル、住友化学、三井化学各社の日々の値動きの相関を図示してみました。
なお、対角線上の同じ会社のデータには値動き率のヒストグラムを表示させています。
結果を見ますと、各社とも結構綺麗な右肩上がりのグラフになっており、財閥化学各社は「正の相関」をもってることがわかりますね。
そのため、三菱ケミカルの株価が上がる日には住友化学も同じように上がる日が多かったことがわかります。
これは財閥化学メーカー同士は事業領域が被っており、外的要因を同じように受けるためと考えると理解しやすいですね。
各社の値動きはどの程度相関しているのか
さらに各社の値動きがどの程度相関しているのかをヒートマップで表現してみました。
数字は相関係数を表しており、相関係数が1だと完全に同じデータということになります。
そのため、1により近い「三菱ケミカル」と「住友化学」は強く相関している一方で、三井化学は他の財閥化学との相関が小さいことがわかります。
これは三井化学が三菱ケミカルや住友化学と違い、製薬事業を持っていなかったりと被っている事業領域が少ないからでしょうかね。
各社の2019年度のコストパフォーマンス推定
最後に2019年に各社に投資した場合のリスクとリターンを「リスクを株価の変動の標準偏差」「リターンを株価の変動の平均値」と仮定して計算してみました。横軸が予測リターン、縦軸がリスクを表現しています。今回のシミュレーションではインカムゲインを考慮していないものの、解析結果から2019年の株式相場においては三井化学は値上がりは大きいが変動幅も大きいハイリスクハイリターン銘柄、一方で住友化学はローリスクローリターン銘柄であったことが推定されます。
あとがき
少しずつですが、自己研鑽のために勉強しているPythonが使えるようになってきました。
今後も練習を兼ねて各社の株価を分析してみたいと思います。
特に機械学習を用いた株価の予想やインカムゲインも考慮したリスク管理モデルを考えてみたいですね。
※上記の結果は著者が独自に解析したもので、結果を保証するものではありません。←これ書いてみたかったです笑
ではまた!