目次
第2回 競馬データベースを作ろう!(全体像)
3週間強、時間が開いてしまいましたが、「競馬データベースを作ろう!」連載の第2回!
今回は、競馬データベースソフト全般をまとめて、その中から具体的に何をどうするか、という話を書き進めます。 (若干、導入要素が残っているので、すぐに作り始めたい人には不要かもしれません)
競馬データベースは別に作らなくてもよい
データベース(以下"DB")を『作る』と銘打ってはいますが、別に作らずともすでにあるものをダウンロードして使えば、自身のPCなどに競馬DBを入れることは可能です(ある程度以上の質のものはいずれも有料ですが…)。
(「作らなくても別によい」とか言っちゃうと企画倒れですが…そこはスルー、)
競馬のデータベースソフトとしては、『TARGET frontier JV』なるソフトが有名です。↓
競馬DBといえば TARGET !!
TARGETは、競馬ソフトとして圧倒的な人気を誇る競馬DBソフトです。
TARGETは、JRA公式データ配信サービスのデータラボ(月額約2000円)会員↑になることで利用できます。
位置づけ的には、TARGETはサービスの中の1製品にすぎないのですが、圧倒的1番人気が故データラボ内で猛プッシュを受ける競馬ソフトでもあります。
機能としては、データ分析機能はもちろんのこと、出馬表機能・高い操作性やデータ出力など広範囲の利用性を高いレベルで実現しています。
(結論じみた話になりますが、)「データベース言語を用いることなく使えるDBソフト(敷居の低さ)」「高い性能」を同時に実現している点で、TARGETは孤高の存在です。
(↑別にボク TARGETやJRAデータラボの回し者ではありませんぜww)
もちろん、世の中(データラボの他DBソフト)に、TARGET同様の機能を持ったソフトが多数存在しますが、もはや存在していないかの如き扱いとなっています。
TARGETのスピード性能
その理由をざっくり挙げると、1つ目に「TARGETのスピード性能」があげられます。とにかく速い!
(TARGETはデータをテキスト形式で格納しているから。Excel等よりテキストの方が開くの早いから)
TARGETの複合性
2つ目に、「複合性」(複数データ間の関連性の調べやすさ)です。
例えば、"ディープインパクト産駒"の成績だけではなく、産駒の"東京芝"での成績や、"良馬場"でのレースに限定するなど、各データ間の関連性を考えやすいソフトとして作られています。
TARGETの弱点:自由度に欠ける
しかし、TARGETにも弱点はあります。「自由度に欠ける」ことです。
スピード性能を上げるにはソフトの使途を限定する必要があるため、これは仕方がないことで、そこんところはトレードオフです。(スピード速いけど自由度がない(小回りが利かない)という意味では、マリオカートのクッパやドンキーみたいなものです)
TARGETのデータ分析画面を見ると、分析できる要素が固定化されており、これ以外の要素での分析ができません。(これらの項目以外のデータ分析は、基本的に不可能…)
(例えば、"外国産馬"という括りは設定されているから分析できるが、"米国産""豪州産"などは設定されていないため、(一から設定をしない限り)"外国産馬"の深堀りができません。)
TARGET以外の競馬DBソフト
世の中に出ている競馬DBソフトで、TARGET以外(の中でもTARGETより自由度高いもの)を紹介していきます。
馬王
馬王(バオウ)は、TARGET同様にデータラボで提供されている競馬DBソフトです。
こちらもデータ分析機能だけなく出馬表機能を備えたソフトです。(下画像はデータ分析画面。計算式を直接打ち込み、その検索結果が下部に出ている状態。)
ソフト・データのインストールさえ済めばすぐに使える点で敷居は低い方だと思いますが、自ら条件式を書き込む必要がある点においてTARGETより「敷居が高く」、その分「自由度が高い」ソフトであると言えます。
現在最新バージョンの「馬王Z」(無料)は、データラボ(月額約2000円)会員であれば自由に利用ができ、ソフト作者のオリジナル指数を利用したい場合には別途5000円(!、どのくらい使えるかは不明)ほどかかるようです。
ちなみに、このソフト、数年前に巷を賑わせたソフトでもあります。
というのは、馬券裁判男なる人物がこのソフトを用いて1億5000円の利益を叩き出していたことが報じられたからです。
夢のある話ですね~(自身の著作↓でも公表しています。)
PC-keiba
このソフト自体が競馬DBではなく、DBを作るためのデータ取得を簡略化するソフトになります。こちらもデータラボ提供ソフトです。
MySQLや、PostgresSQLなど、DB言語用のデータ形式で簡単にJRAの公式データをダウンロードすることが出来ます。
データの分析や加工は、MySQLなどの環境下で行うことになるので、それらの専門知識が必要となります。
(Jv-downloader)
Jv-downloaderは、データラボのデータをダウンロードするために必要なソフトになります。
TARGETにせよ馬王にせよPC-keibaにせよ、いずれもこのソフト経由でデータの取得をします。
()でくくっているのは、厳密に言えば競馬DBソフトではなく、ダウンロード用のソフトだからです。
TARGETはTARGETで、Jv-downloaderを設定し、TARGET用のデータ形式・データ型でダウンロードしています。
このソフトを用いる、ということは、完全にイチから(どのデータをどんな形式で持ってくるか、という段階から)設定していくことになりますので、骨の折れる作業になります。その代わり、かなり高い自由度が得られる、という感じです。
DBソフト比較
もちろん他にもDBソフト自体は存在していますが、上記ソフト以上に手間がかかりそうなので紹介は割愛します。
さて、ここまでの4つのソフトを簡単に図にまとめてみます。
図式化すると…
イメージ的には、下表のような感じです。
縦軸が労力の有無、横軸が分析の自由度。
データ形式の違い
(少し前述しましたが、)各ソフトで用いているデータ内容は一緒ですが、データの形は違っていて、TARGET用の保存の仕方・馬王用の保存の仕方をしています。なので、TARGET・馬王のいずれもPCに入れている人は、同じ内容のデータを、異なる保存形式で2つ保存していることなります。(別にそれはしょうがないこと。)
なんやかんやで、TARGETには勝てない(笑)
ここまで来ておいてなんですが、TARGETはすごいです(笑)。調べれば調べるほどに素晴らしさに気づくww
(普通の)競馬DBソフトを時間かけて作成するくらいであれば、絶対にTARGETダウンロードした方がいい。リアルに10倍は得だと思います。
しかし、TARGETを用いることで競馬に勝てるようになるかと言われると、そんな簡単でもない…。
デフォルトでTARGETに出来ないこと
TARGETでのデータ分析では、決定的に足りていないことがあります。
それは、『予想の根幹を握っているデータに限って分析できない!』ということです。
(言い方を換えれば…)
「〇競馬場で×産駒を買えばプラス収支」はすぐに調べられますが、実際の予想がそれだけで完結することはありません...。
デフォルトのTARGETでは、JRAのHPで閲覧できるようなデータの分析しかできません。しかし、ふつうの馬券購入者は競馬新聞の"調教""指数""厩舎コメント""馬場状態"などを総合的に考慮したうえで馬券を購入するはずです。
具体的には、「△コースで某競馬新聞の☆指数が出走メンバー中1位の馬は儲かる」「◎という条件下では、某新聞の調教評価がAの馬をひたすら買い続ける」「前走レベルが高くて凡走したが▼指数的には好走できるレベルだろう」といったような(より現実的な)予想フォームを、TARGETでは分析することができません。
TARGET用形式のデータを出力できるDBを作成します!
と、いうことで、今回採用した競馬DBの方向性は!……
『TARGET用のデータを出力できるDBを作成』すること!!
この工程を採る理由
まず、前提としてTARGETは使います。スーパーソフトなので。
TARGETに出来ないこともできる、全く新しい競馬DBソフトの開発が理想ではありますが、そんなことしてる暇は社畜にはない訳で…(運営者の中で天皇の会社が、実は一番ブラック企業な気がする今日この頃……)。
TARGETに出来ないことは、工夫を加えれば、TARGETにしてもらえるようになります。
その出力をしてくれるDBソフトを作るイメージです。
作業の流れイメージ
概略のイメージとしては…、
①「DBの作成」→②「データの検証」→③「オリジナル予想ファクターの精製」
具体的な手法としては…、
①DB言語・(競馬に限らない)DBソフトを用いてデータ収集→②TARGETを用いてデータ分析・戦術検証(→勝てる理論や指数を作る)→③"オリジナル新聞を作成する"なり、"このサイトで配信する指数を作成"なりいろいろ
何だか偉そうにここまで書いてますが、プロ予想家の中でもこのような使い方をしている人は結構いるみたいです(亀谷さん、須田鷹雄さん、竹内裕也さんetc…)
こうすれば、少ない労力で最大限の効果が得られる!!!(予定。)
補足、まとめ・今後の展望
(まずは弁明、)前回記事にて『アクセスを使う』と書きましたが…、あれは使いません(笑)(詳細は第3回以降に書きますが、(他のDB言語に比べ)アクセスの方が完成までの工程が楽で、その分完成物の自由度・クオリティが低めです)。
ここまでに述べたことで、競馬DBソフトのすべての語ることができたわけでは全くありません。網羅性に欠ける面はありますが、全体像の中から、個人的にやりたいことを最短距離で説明したつもりです。
その辺は、もっと調べればもっと出てくるはずです。例えば、個人からオリジナル競馬ソフト作成を請け負いそれを生業としてる個人事業者の人がいたり、JRAデータラボではなく競馬道OnLineからデータを取得するパターンでの競馬DBの作成方法もあります。
次回記事では、「どんなDB言語を用い」、「どこからデータを取得し」、「どのようにしてTARGETに落とし込むのか」という話をしていきたいと思っています(ようやく具体的な話!!)
導入の第1回記事は↓こちらより!
競馬中毒者随一の指数使い、社畜猫の指数予想記事↓はこちら!!