2019年9月29日日曜日

第252夜 表計算ソフトによる血統データ管理


データベースを先ず作成しよう
血統に限らず、パソコンでデータ管理することは便利だ。
表計算ソフトを使ってさまざまな形に表わしたり、集計作業に利用したりするとき、良く作られたデータベースほど重宝するものはない。
一方で、表計算ソフトを使いこなしている人も思いの外少ない気がしている。
そこで、今夜は、血統データベースを用意してみたい。
地道な作業だが、「一度作成したらあとは新しいデータを加えていくだけ」であることをご理解いただきたい。
わたしも競走記録と別に血統データを作成している。
この簡略版である。

最低限必要なデータを並べると次のようになる。
馬名、父、母
これに生年をそれぞれ加える。
わたしは性別も加えているが、統計上必要になることが多いので、全部で7つになる。

生年はなぜ必要なのか、少し触れておく。
ご存知のように、馬名には「重複」問題がある。
ミスターシービーですら、過去に同名馬がいた。
「初代」が有名になればそれを避けてくれるようになる(G1級勝ち馬の名前を付けることは禁じられている)が、2代目や3代目が歴史に名を残すこともあるのだ。
この問題を回避するのに生年を加えている。
わたしは[西暦]で馬名の後ろに生年を加えて。
(
)ウオッカ[2004]
馬名も生年も同じケースは極めて稀で、通常はこれで対応できる。
では、1行に1頭とし、各列に入れていくデータを決めていこう。
A
列 馬名+生年
B
列 馬名
C
列 生年
D
列 性別
E
列 父名+生年
F
列 父名
G
列 父生年
H
列 母名+生年
I
列 母名
J
列 母生年
以上である。
このうち、AEH列は簡単な計算式で入力する。
5代血統表を作るんじゃないの」という声が聞こえてきそうだが、このデータベースからVLOOKUP関数を使って作成するのである(わたしは普段作らないけど)
データベースを先ず作成しよう。
netkeiba
さんで40万頭から50万頭のデータがあるというから、あとは地道に収集していけばよい。
ときどき間違いもあるけれど、そこは注意深く見ていけば気がつくだろう。
仔より若いお母さん、は稀にある。
牡が仔を産むことも、稀にある。
血統好きの話では几帳面な人が多いように思うが、最初から完璧を目指さず、気がついたときに修正していけばいい。
A B C D E F G H I J
1 馬名+生年 馬名 生年 性別 父名+生年 父名 父生年 母名+生年 母名 母生年
2 ウオッカ[2004] ウオッカ 2004 タニノギムレット[1999] タニノギムレット 1999 タニノシスター[1993] タニノシスター 1993

セルA2の計算式=B2&"["&C2&"]"
セルE2の計算式=F2&"["&G2&"]"
セルH2の計算式=I2&"["&J2&"]"

A B C D E F G H I J
1 馬名+生年 馬名 生年 性別 父名+生年 父名 父生年 母名+生年 母名 母生年
2 ウオッカ[2004] ウオッカ 2004 タニノギムレット[1999] タニノギムレット 1999 タニノシスター[1993] タニノシスター 1993
3 タニノギムレット[1999] タニノギムレット 1999 ブライアンズタイム[1985] ブライアンズタイム 1985 タニノクリスタル[1988] タニノクリスタル 1988
4 タニノシスター[1993] タニノシスター 1993 ルション[1981] ルション 1981 エナジートウショウ[1987] エナジートウショウ 1987
A B C
1 馬名 ウオッカ[2004]
2 タニノギムレット[1999] ブライアンズタイム[1985]
3 タニノクリスタル[1988]
4 タニノシスター[1993] ルション[1981]
5 エナジートウショウ[1987]
6
7

セルA2=VLOOKUP(B1,Sheet1!A:E,5,FALSE)
セルB2=VLOOKUP(A2,Sheet1!A:E,5,FALSE)
セルB3=VLOOKUP(A2,Sheet1!A:H,8,FALSE)
セルA4=VLOOKUP(B1,Sheet1!A:H,8,FALSE)
セルB4=VLOOKUP(A4,Sheet1!A:E,5,FALSE)
セルB5=VLOOKUP(A4,Sheet1!A:H,8,FALSE)

血統表
わたしは血統表など以下のもので充分だと思う。
馬名|父名|母名|2代母名|3代母名|4代母名|5代母名|
サイアーラインとファミリーライン以外はあまり有用ではないと考えているからである。
せいぜい、生年と母父名を加えればよい。
クロスとかアウトブリードなどの情報は不要だとわたしは考えている。
その理由は過去の記事に綴っているけれど、端的に言えば「遺伝学の知見に基づいていない」からである。
ニックスでさえほぼ偶然と思っている。
わたしは専門家ではないから詳しくないが、こうした血統理論は似非科学と断じてもいいくらいらしい。
もちろん酒席で興醒めするようなことは言わないし、話を合わせるだけの知識は持っている。
ただ、真剣な馬券検討には使用しないだけである。

横道に逸れたが、VLOOKUP関数を使った血統表は上のようになる。
血統データベースは「Sheet1」に格納されているものとして算式を示す。
もしも、罫線を引いて枠を作り、そこに1頭ずつ手打ちで入力されているのであれば、騙されたと思ってぜひ試してもらいたい。
これが表計算ソフトの使い方である。
仕事でも使える、いや、仕事レベルでデータ管理すべきなのである。
(SiriusA+B)

ブログ アーカイブ