ここでは個別株ではなく株の指数を分析してみます。
指数は下記のサイトからダウンロードしました。
日経平均の日足csvデータ、期間は19651/1~としています。
yahoo.comでは日経平均以外にもダウやナスダックなど有名な指数がcsvでダウンロード可能なので落としておくといいでしょう。
上記リンクのDownload Dataよりダウンロード可能です。
2002年まで出来高のデータがありません。また途中でnullになっている個所がありますが祝日で取得できていないだけかと思いましたが1/11など祝日でないのでなぜ取得できていないかは不明です。
pythonではデフォルトでsqliteというデータベースが使用できるのでデータベースにcsvデータを格納して使用します。
sqliteはanacondaで下記のコマンドで空のデータベースファイルを新規で作成します。
sqlite3 n225.db
次にCSVモードに切り替えます。
.mode csv
最後に^N225.csvをpriceという名前のテーブルに読み込みます。
.import ^N225.csv price
これで作成したn225.dbにcsvファイルが読み込まれました。試しに以下のコマンドで正しく読み込まれるか確認してみます。
select * from price
データ数が多いので時間がかかりますがただしく読み込まれていることが確認できます。
欠損値(null)は下記のコードでpandasで読み込み⇒削除⇒^N225mとして保存することで削除します。
df1 = pd.read_csv(‘^N225.csv’)
df1.dropna()
df2.to_csv(‘^N225m.csv’ , index=False)
jupyter notebookで終値でプロットします。
今までanacondaプロンプトでコードpyファイル実行してましたがjupyter notebook便利ですね。対話型ですぐに結果が出てくるので作業効率が段違い。もう少し早く使用していればよかった・・
とりあえず今日はここまでにします。
コメント