こんばんは
データサイエンスの重要性をひしひしと感じている今日この頃です。。。
普段は実験系の研究職としてサラリーマンをやっていますが、今後はただの実験科学者よりもデータサイエンティストが求められる時代だということで最近は独学でプログラミングやデータサイエンスの勉強を始めました。
まえがき
今日はPythonを使って自動車メーカー5社の2019年の株式データ解析をやってみたのでご報告します。(トヨタ、ホンダ、日産、マツダ、スズキ)
なお、プログラミングはこちらのプログラムで独学で勉強しました。
【世界で5万人が受講】実践 Python データサイエンス・オンライン講座
各社の株式データ取得と確認
はじめに日本の自動車銘柄の代表株であるトヨタ、ホンダ、日産、マツダ、スズキの株式のデータについて、各社の2019年分のデータをネットから取得しました。
ここで、トヨタの1年間の株価について横軸に日付、縦軸に調整終値を記載すると以下のようになります。(図上)
下の図が実際にweb上に公開されている株価の推移ですが、ピークの形状が同じですし、正確に取得できていますね。
各社の値動きに相関はあるのか
次に各日の調整終値の変化率(日ごとの値動き率)を計算して、トヨタ、ホンダ、日産、マツダ、スズキ各社の日々の値動きの相関を図示してみました。
なお、対角線上の同じ会社のデータには値動き率のヒストグラムを表示させています。
結果を見ますと、各社ともぼんやりと右肩上がりのグラフになっており、自動車会社各社は「正の相関」をもってることがわかりますね。
そのため、トヨタの株価が上がる日にはホンダも同じように上がる日が多かったことがわかります。
これは自動車メーカー同士は事業領域が被っており、外的要因を同じように受けるためと考えると理解しやすいですね。
各社の値動きはどの程度相関しているのか
さらに各社の値動きがどの程度相関しているのかをヒートマップで表現してみました。
数字は相関係数を表しており、相関係数が1だと完全に同じデータということになります。
そのため、1により近い「トヨタ」と「ホンダ」は強く相関している一方で、スズキは他の自動車メーカーとの相関が小さいことがわかります。
これはスズキの主力がトヨタや日産と違い、軽自動車やバイクであるからでしょうかね。
正直日産はゴーンショックなどがあったため、他社との相関はもっと低いと思っていました。
事件や業績よりも原油価格等の外的要因にリンクしているのでしょうか。
各社の2019年度のコストパフォーマンス推定
最後に2019年に各社に投資した場合のリスクとリターンを「リスクを株価の変動の標準偏差」「リターンを株価の変動の平均値」と仮定して計算してみました。横軸が予測リターン、縦軸がリスクを表現しています。今回のシミュレーションではインカムゲインを考慮していないものの、解析結果から2019年の株式相場においては日産は値上がりは小さく変動幅も大きいハイリスクローリターン銘柄、一方でトヨタは順当に値上がりしたローリスクハイリターン銘柄であったことが推定されます。
あとがき
少しずつですが、自己研鑽のために勉強しているPythonが使えるようになってきました。
今後も練習を兼ねて各社の株価を分析してみたいと思います。
特に機械学習を用いた株価の予想やインカムゲインも考慮したリスク管理モデルを考えてみたいですね。
ではまた!