2016年3月18日金曜日

第70夜 競馬データの種類と加工(5)性別、年齢、馬名


66夜から続く話題である。
今夜は、性別、年齢、馬名について触れる。



項目

データ

備考

12.性別


 

13.年齢

4

単位=歳

14.馬名

ワンアンドオンリー

血統データ付加

12.性別

性別は、2種類にしている。
牡は「1」、雌は「2」である。
せん馬は「1」としている。
せん馬とは、去勢された牡馬のことである。
牡馬とせん馬のパフォーマンスに大きな差異があると仮定する人なら、牡馬と独立した番号を振るべきだろう。
その場合でも、前夜(69)に触れた外枠発走のように、性別欄の「1(牡馬)は残して、新しいデータ()として「せん馬」欄を設け、該当馬に「1」を記録するという方法をお勧めしたい。



項目

データ

備考

12.性別


 

33.性別コード

1

 

 

13.年齢
いわゆる「馬齢」である。
日本では2001年から現在の国際表記に倣った年齢を使用している。
2000
年までは、生まれたときに当歳(1)とする、人間の数え年と同じ数え方であった。
2001
年には、朝日杯3歳ステークスをはじめ数多くのレース名が変更になる大改革だったが、もう昔の話になってしまった。
1
1日に年齢が上がるのは、昔も今も同じである。

14.馬名
馬は、さまざまなデータを付加する。
わたしは、馬については別途データベースを作っているのだが、そこから馬固有のIDや血統情報を転記している。
リレーショナル型データベースにして整理し活用することもできるが、ここでは表計算ソフトを利用するために、出走のたびに何度でも同じデータを転記することとした。
まず、馬固有のIDとして、10桁の番号を用意する。
例題のワンアンドオンリー号は、2011105072である。
2011
年生まれということもわかる。
馬名だけは同名が何度も出てくる可能性があり、そのまま使わず番号で分析しなければならないと思っている。
次に、ワンアンドオンリー号の誕生日を記す。
同馬は、2011223日生まれである。
シリアル値に直すと40597である。
ここから、有馬記念出走日の「日齢」も2次的に算出できる。
2015
年の有馬記念は、1227日で、シリアル値は42365である。
42365
40597を計算して、ワンアンドオンリー号は生まれてから1768日目、すなわち「日齢」は1768とはじき出す。
1768
さえわかれば、「週齢」や「月齢」なども自在に算出できるようになる。
次に、血統情報である。
父馬は、ハーツクライである。
わたしのオリジナル種牡馬番号では、956番としている。
わたしの場合、サイアーラインを遡らないので父馬データはここまでである。
最後に母馬である。
母馬は、ヴァーチュ。
わたしの場合は、母馬は直接データとして使わず、オリジナルの「祖先馬」というファミリーラインを使用している。
わたしのルールでは、原則として1900年より前の馬を祖先馬とし、そこで遡ることをやめる。
じつは、このあたりでデータの信憑性がなくなってくるので、このあたりがちょうど潮時ということである。
祖先馬は第10夜、第11夜、第12夜のブログを参照してほしい。
ファミリーラインを遡っていくと、次のようになる。
ヴァーチュ[2002年生]→サンタムール[1996]→アンブロジン[1988]→バラダ[1982]Courtly Dee[1968]Tulle[1950]Judy-Rae[1944]Betty Derr[1928]Uncle’s Lassie[1916]Planutess[1908]Countess Wanda[1902]Wanda[1882]
以上のように祖先馬はWandaという1882年生まれの牝馬である。
11夜のリストにも真ん中あたりに顔を出している優秀な牝系のようである。
2006
年から2014年に延べ2361回出走し、203勝した。
勝率は8.6%で平均より高い。
ちなみに、Wandaは、わたしのオリジナル祖先馬番号817である。



項目

データ

備考

14.馬名

ワンアンドオンリー

血統データ付加

34.馬番号

2011105072

 

35.誕生日

40597

 

36.日齢

1768

出走日(42365)-誕生日(40597)

37.父名

ハーツクライ

 

38.父番号

956

 

39.祖先馬名

Wanda[1882]

 

40.祖先馬番号

817

 

データベースを作っていると、この血統情報に一番時間がかかる。
見方を変えると、ここを乗り越えれば一気にゴールが近づいてくるのだ。

(SiriusA+B)

ブログ アーカイブ