Twitterの銘柄コード画像を一括で楽天証券口座に登録

Python

こんにちはMNF(@MNF_5321)です。

四季報が発売されましたがTwitter上ではありがたいことに注目銘柄を一覧で掲載してくださる方がおります。

Twitterでは140文字の文字数制限があるため下記のような画像でまとめられることが多いと思います。今回は画像から楽天証券の銘柄インポート用のCSVに変換する方法をまとめておきます。

画像~文字に変換する

まずは画像をOCRで文字に変換します。例としてミニミニさん(@miniminimusic)のツイートしている画像を変換します。変換にはAdbe scanというアプリを使用します。使い方は簡単でアプリで文字を読み込むと自動的にOCR処理をしてくれます。

コピーしてPCに文字列を送ります。

Pythonでコピーした文字列をCSVファイルに変換する

下記のコードで文字列を変換します。Pythonを実行したフォルダにCSVファイルが作成されます。

####画像⇒CSVまとめ
import pandas as pd
import re

#ここに貼り付け
code='コードの入った文字列をコピペ'
#↓例
#code='建設1450.1911.1939.5070.5074鉱業1605食料品2001.2211.2588サービス2130.2146.2150.2153.2418.4293.4763.60 35.6061.6067.6171.6193.6580.7050.7072 卸売業2667.3132.7480小売業2678不動産2987.3245.3291.3294.3465.3482.3486.3 496.3498.3772 繊維3002.3401.3402.3612金属製品3431.3433.5941情報3762.3793.3798.3853.4299.4481.4499 化学4091.4216.4980ガラス5310.5334.5344鉄鋼5401.5411.5698機械6254.6323.6358電気機器6619.6626.6967.7735輸送用機器7203その他製品7816海運9101.9104.9107電気ガス9519.9522'


#不要な文字を削除
code_new = re.sub('[ぁ-んァ-ヶ一-龥]', ',', code)

#スペースとーを削除
code_new=code_new.replace(' ','')
code_new =code_new.replace('ー','')

#ピリオドをカンマに変換
code_new=code_new.replace('.',',')

#カンマを一つにして先頭のカンマを削除
code_new=re.sub(',+', ',', code_new)[1:]

#カンマで区切る
code_new=code_new.split(',')


#文字列に変換
code_new=[int(n) for n in code_new]

#STKリスト作成
list = ['STK']*len(code_new)

#DF作成
df=pd.DataFrame({'MS2': list,
                    '2': code_new})

#CSVで保存
df.to_csv('stock_list.csv',index=False)

楽天証券の銘柄一覧にインポートする。

インポートの仕方は前回の記事を参照してください。

まとめ

銘柄一覧は画像でまとめられることが多いですが銘柄コードを手打ちしていくのは地味に時間がかかります。投資に直接関係ない作業はできるだけ省略して銘柄を分析するところに時間を使いたいですね。

コメント

タイトルとURLをコピーしました