TableauでViz(ダッシュボード)を作る際にどういう思考で作成しているのか、その思考をまとめてみるのも面白いのではないかと思い執筆しています。ネタはこちらのViz。
以下の5回にわたりお送りいたします。
- 第1回:何を作ろうか(題材選び)
- 第2回:どう作ろうか(データの入手や表現方法)
- 第3回:どう整理しようか(データやレイアウト)
- 第4回:どう改善しようか(作成後の話)
- 第5回:今後どうするべきか(理想の未来)
さてネタが決まったら「どう作ろうか」
前回の続きですが、大体作る必要があるもの洗い出してから、もう少し深く次のステップ考えます。こんな感じ↓
他の人と比べて何がすごそうなの? 意外と僅差じゃないの? |
勝ち負け数をそれぞれ比較してみたいなぁ、ただグラフで並べると情報多いし、人数も多そうだから絞り込めるようにするとか、並べると見にくいだろうから何のグラフ使うかは要検討だな (後にグラフは当時案件で利用しようと思った「ダンベルチャート」を利用することを思いつきます) |
---|---|
最近強いだけなんじゃないの? 昔はどうなの? |
毎年将棋は大会やっていると思うので、大会結果の年度別データが見れたら良いなぁ、そもそも藤井さんは最初は弱かったとか、どこら辺から強くなったのかとか見たいし、5年くらいのタイトル別結果並べるのがいいかも (当時はタイトルを争う大会のみのVizをかんがえていて、そのため大会の記録くらいはデータがあるだろうと考え始めていた) |
将棋って年取った人の方が 達人で強いんじゃないの? |
なんとなく年齢別にも勝率がわかれば良いなぁ、おそらくだんだん強くなるはずだ、名人とかおじいさんのイメージがあるし(、、、ってのはイメージだけでした、データ見える化ってすごい!) |
意外と対局数が少なくて 勝率が高いとかじゃないの? |
強い強いといいつつ、藤井さん若いから対局自体が少なかったりで勝率が高いって可能性あったりするのか?他の人より勝負回収が少なければ勝率上がるしな、、、なんで勝ち負け数もそうだけど勝率も必要だな (あくまでもプロ将棋知らなくイメージで考えているので大変失礼な感じでもありました) |
といったような事を考えながら、必要なデータ探しへ進みます。
主なデータは上記より「勝敗データ」「棋士プロフィールデータ」あたりが思い浮かんでおり、このデータは誰かWEBでまとめているだろうと考えて探し始めました。
ネタが決まったら具体的に空想し始めるのだ
データを探す
ビジネスにおいてVizを作る際、データはクライアントから提供されることが大半だと思うのでデータ探すことはあまりないのかなと思います(あるとしたら政府系のオープンデータくらいでしょうか)
で、今回の将棋に関するデータはサクッと見つかったのですんなり進めました。物によってはここで断念することも多いと思います。パターンとしては3パターンかなと。
- 知りたいネタのデータがない
(こればかりはどうにもならない) - 集計されたグラフデータはみつかるが、元の数値データはない
(グラフから数値を拾いデータ作ることもできるが、そこまでしたくないので基本断念) - 数値データがあるにはあるが、加工しがたい
(データファイルがない状態だったりフォーマット等が駄目すぎるなどで、正規表現での置換やマクロ、簡易的なクローラーなどの方法論が使えず対応しがたい)
検索ワードは「将棋 データ」あたりから調べたところ以下のようなサイトがありました。
1)個人サイト
以下のような個人の方が作られているデータサイトですね。
こういう個人で色々な勝敗をまとめられている方、結構いらっしゃいます。麻雀とか競馬とかのギャンブルや野球やサッカーなどのスポーツなどが多いイメージがあります。自身としてもプライベートで本Viz作っていてなんですが、趣味でよくやるな―という感じで公式以上のデータ集も多数見受けられます。すばらしい。
2)公式サイト
で、調べていくと公式データがっつりありました。
ただし残念ながら一覧のようなデータはなく、HTML上の表から自身でデータ持ってきて取り込む用の独自フォーマットで作らないとなといった感触です。
目的のデータとしては以下の2つ
- 「勝敗データ」
当初タイトルの大会データがあればと思ってましたが、こちらは「今年度棋士成績・記録」として全対局のデータがあるのでそちらを使うで方針変更してます。 - 「棋士プロフィールデータ」
年齢は各自のプロフィールにありましたが、どこかに一覧でないかなーと探したところ「棋士番号順一覧」にまとめて掲載されてました。ラッキー。ただし段位のデータ取得場所がここしかない……※なければ別サイトさがして拝借しようと考えていたりいなかったり…… - また棋士には「棋士番号」というユニークな会員番号があるようで結合キーにつかえる!と思いました、が各ページには名前はあるが棋士番号がないので名前で文字列結合かぁとちょっと懸念が(あとで案の定困ったことも発生しました)
データは探せば何かしらある、データ断片なら結合するすべも考えよう
ここまでが「どう作ろうか(データの入手や表現方法)」です、今回はサクッと公式サイトに必要なデータ見つかったのですがデータ探すに時間かかりますかね、ここも大体トータル30分~1時間!なイメージです。
※ちなみに私の将棋知識、漫画の方がインプットは多いです。「月下の棋士」「ハチワンダイバー」「3月のライオン」「龍と苺」あたりを読んでます。まあ深く読んでるわけではなく「ノリ」で読んでいるだけなので、振り飛車とか穴熊とか戦法や妙手の話も出てきますが、未だピンと来ていません。