前回、DNA 鑑定に確率論の計算が使われていることを記述しました。なので、今回は私の妄想で起きた事件のDNA 鑑定の計算をやってみたいと思います。加えて、確率計算にフォーカスするために遺伝子表現型多型の名前等は適当に命名しています(詳しい方向けに書くと、STR 検査のアンフルスターアイデンティファイラーキットを想定しています)。また、生命科学的実験法の部分は省略しています。
事件概要
ある老夫婦が家を留守にしている間に強盗が入り、ガラスを割られた上に現金や時計などが奪われた。ガラスには血液が付着していた。その後、防犯カメラの情報や聞き込みから犯人と思われる人物Aさんが逮捕された。Aさんには事件発生時に怪我したと思わしき切り傷があり、それがガラスを割った際にできたものと推測される。Aさんはこれは料理中にできた切り傷だと主張し、事件への関与を否定している。ガラスに付着していた血液がAさんのものなのかどうかを確かめるためにDNA 鑑定が行われた。
解析
ガラスに付着していた血液とAさんの筋組織の DNAが一致しているかを確認するためにこれら試料の遺伝子型 15種類(α,β,γ,δ,ε,ζ,η,Θ,ι,κ,λ,μ,ν,ξ,ο)を増幅した。これらの遺伝子型はそれぞれ異なる染色体に位置する。そしてそれらの遺伝子表現型を調べたところ、15種類全てで一致した。そこで、この遺伝子型15種類が偶然一致するかどうかを確かめるために遺伝子型頻度の計算を H-W 平衡に基づいて行った。なお、遺伝子の頻度は次の表通りとする(十分なサンプル数から得られた確率値とする)
遺伝子型 | α | β | γ | δ | ε | ζ | η | Θ | |
a | 0.121 | 0.053 | 0.350 | 0.541 | 0.415 | 0.485 | 0.238 | 0.319 | |
b | 0.143 | 0.335 | 0.243 | 0.221 | 0.199 | 0.240 | 0.061 | 0.203 | |
その他 | 0.736 | 0.612 | 0.407 | 0.248 | 0.686 | 0.275 | 0.701 | 0.478 | |
遺伝子型 | ι | κ | λ | μ | ν | ξ | ο | ||
a | 0.020 | 0.053 | 0.262 | 0.490 | 0.222 | 0.252 | 0.073 | ||
b | 0.163 | 0.300 | 0.354 | 0.354 | 0.070 | 0.272 | 0.138 | ||
その他 | 0.817 | 0.647 | 0.384 | 0.156 | 0.708 | 0.476 | 0.789 |
例えば、αの遺伝子表現型が[a,b] であるときの遺伝子頻度は 2×0.121×0.143=0.035 となり、[a, a] のときは 0.121×0.121=0.015 となる。得られた遺伝子表現型それぞれに対して遺伝子頻度を計算すると
遺伝子型 | ガラスに付着した血液の遺伝子表現型 | Aさんの筋組織の遺伝子表現型 | 遺伝子頻度 |
α | [a,b] | [a,b] | 0.035 |
β | [a,b] | [a,b] | 0.038 |
γ | [a,b] | [a,b] | 0.017 |
δ | [a,a] | [a,a] | 0.293 |
ε | [a,b] | [a,b] | 0.165 |
ζ | [a,a] | [a,a] | 0.235 |
η | [a,b] | [a,b] | 0.029 |
Θ | [a,b] | [a,b] | 0.13 |
ι | [a,b] | [a,b] | 0.0065 |
κ | [a,b] | [a,b] | 0.0318 |
λ | [a,b] | [a,b] | 0.185 |
μ | [a,a] | [a,a] | 0.24 |
ν | [a,b] | [a,b] | 0.031 |
ξ | [a,a] | [a,a] | 0.064 |
ο | [a,b] | [a,b] | 0.032 |
そして、これらの遺伝子型(α,β,γ,δ,ε,ζ,η,Θ,ι,κ,λ,μ,ν,ξ,ο)はそれぞれ異なる染色体に位置するため独立性が成り立つので、総合頻度はそれぞれの遺伝子頻度を積算して、5.6×10^(-18)となる。これは約17.9京分の1である。よって、ガラスに付着していた血液とAさんの筋組織の DNA が偶然一致するとは考えられないためガラスに付着していた血液とAさんの筋組織の DNA は同じ、すなわちガラスに付着していた血液はAさんのものと考えてよいことが示された。
結果
老夫婦の家に強盗に入ったのはAさんである可能性が高い(少なくとも、ガラスを割ったのはAさんである)
実際には、確率の信頼性や実験再現性、他の要素も踏まえて総合的に判断することになると思いますが、DNA 鑑定が個人識別でかなり有力になるのが分かった気がします。私は分析官なので実際にこういったことをする機会はないと思いますが、色んなケースで数学が使われていて、データサイエンスの領域が拡大しているのを感じました。後、こんな感じで痕跡から絶対ばれるので滅多なことは考えないようにしましょう(笑)。最後まで読んでいただきありがとうございました。