データの収集

  • はじめに 
    株価データを分析するのにデータが無ければ話にならない。「python+株価」でググれば、jsmに行き当たる。今度は「jsm」でググってみると、実に様々な人たちが自分と同じことをやっていることに気づく。要するにそんなに新しいことでもないわけだし、ほとんどjsmの拠るところが大きいわけだ。作者に感謝だ。感謝ばかりしていても先に進まないので、jsmで何ができるか(=どんなデータが取れるか?)を考えてみる。

  • 何を支援するか?
     今回のシステムはどんなのが出来るか自分でもよくわかっていない。基本的には株式売買の支援システムなので、それに見合ったデータを取得することを考える。システムを導入する第一義は業務の見直しである(よく「戦略的なIT」とか呼ばれていたりもする)。はっきり言ってこんな業務をしていないわけだから見直しも何もあったものではないが、どんなことをしているかをツラツラ考えてみる。

    1. 口座の開設
    2. 口座へ入金
    3. 銘柄を決める
    4. 買う
    5. 適当に判断して売る
    6. 3に戻る
  • 収集データ
    「買い」から入ればこんな感じだろう。「空売り」というのもあるが、ここでは考えないことにする。基本的には現物の取引なので、口座にあるお金でしか株式を買うことができない。また、株式は日経のボードに出ている株価をそのまま買えるわけではなく、単元株といって買うためのロットが必要になる。もちろん、一株で買えるものもあるが大抵は100, 1000株が単位になっている。さらに取引をするためには証券会社を通すことになるわけだが、この手数料もかかってくることを忘れてはいけない。どの証券会社にするかを決めるために、口座開設時に比較のためググると思う。解説ページには様々な比較が出ている。自分の条件を考えて、適当に決めればいいと思う。
    整理すると、

    • 軍資金
    • 株価
    • 単元数
    • 手数料

    現物取引においては、軍資金<株価x単元数+手数料は必須である。また、軍資金以外の項目は自分で決めることではない。つまり、これがデータ収集の対象となるわけである。

  • データの収集頻度
    データの収集頻度について考えてみる。更新頻度の高いモノ順に並べると、

    1. 株価
    2. 軍資金
    3. 手数料
    4. 単元数

    となる。株価に対しては毎日の収集が必要になる、売買が発生すれば軍資金も変化する。その他の項目は大きくは変動しないので、都度更新すればよい。(on demand)

  • データの依存性
    データの依存性についても考える。ここで言うデータの依存性とはデータ同士の結びつきが強いものを言う。順番に見ていく。

    1. 株価
      他に全く依存しない。

    2. 軍資金
      依存しない。

    3. 手数料
      証券会社に依存する

    4. 単元数
      その会社に依存する。

    単元数はその会社に依存するので会社をキーにしたテーブルを作成して求めるようにする。株式を売買できる会社、つまり上場企業は一意に会社を指定できる証券コードを持っている。これをidとして利用する。

Leave a Reply

Your email address will not be published. Required fields are marked *