| 二対立遺伝子座(SNPのようなもの)の連鎖不平衡の尺度 |
| I) 基本的考察 |
連鎖不平衡の尺度については、別の項目でも解説した。しかし、我々は常に、これらが集団の中での頻度ではなく、サンプルから推定されたものであることを記憶しなければならない。それぞれ二つの対立遺伝子を持つ(SNPのようなもの)二つの遺伝子座についての連鎖不平衡について考える。
第一の遺伝子座の多型を1,2、第二遺伝子座の多型を1,2とすると、次の4つのハプロタイプが可能である。表1 ハプロタイプの種類
第一遺伝子座-第二遺伝子座 1-1 1-2 2-1 2-2 n個の染色体のサンプルがあるとする。それぞれの染色体に上のハプロタイプが対応するが、その数を数えると
表2 ハプロタイプの個数
ハプロタイプ
(第一遺伝子座-第二遺伝子座)個数 1-1 n11 1-2 n12 2-1 n21 2-2 n22 であったとする。
これらはサンプルの中での個数である。
連鎖不平衡を考える上では、集団の中での頻度を考えなければならない。
即ち、表3 集団のハプロタイプ頻度
ハプロタイプ
(第一遺伝子座-第二遺伝子座)頻度 1-1 p11 1-2 p12 2-1 p21 2-2 p22 そして、それぞれの遺伝子座ごとに考えると、対立遺伝子の頻度は次のようになる。
表4 対立遺伝子頻度
対立遺伝子 頻度 第一遺伝子座の対立遺伝子1 p1・=p11+p12 第一遺伝子座の対立遺伝子2 p2・=p21+p22=1-p1・ 第二遺伝子座の対立遺伝子1 p・1=p11+p21 第二遺伝子座の対立遺伝子2 p・2=p12+p22=1-p・1 これらの集団内のパラメターは通常はわからない。しかし、通常はサンプルのなかの割合から次のように推定される。
p1・=(n11+n12)/n
p2・=1-p1・
p・1=(n11+n21)/n
p・2=1-p・1
| II) 種々の尺度の比較 |
もし、このp1・、p・1を用いてD、D'、Δ2などの連鎖不平衡の尺度を計算するとするとどうなるであろう。
![]()
1) p1・=0.5の場合
まず、n=100、p1・=0.5の場合を考える。染色体の総数は100で、第一遺伝子座については50%の頻度で1,2の対立遺伝子がある場合である。
表5 ハプロタイプ数
第一遺伝子座 第二遺伝子座 1 第二遺伝子座 2 1 n11 50-n11 2 n21 50-n21 n11(1-aの数)を横軸にn21(2-aの数)を縦軸にDを表示すると、
n11(=1-a)、n21(=2-a)とDとの関係
![]()
Dは正と負の両方の値を取ることがわかる。この場合はn11=n21であればD=0であり、Dの最高値はn11=50、n21=0となるとき、即ち、以下のような表の時、
表6 ハプロタイプ数
第一遺伝子座 第二遺伝子座 1 第二遺伝子座 2 1 50 0 2 0 50 であり、この時、D=0.25
Dの最低値はn11=0、n21=50となるとき、即ち、以下のような表の時、
表7 ハプロタイプ数
第一遺伝子座 第二遺伝子座 1 第二遺伝子座 2 1 0 50 2 50 0 であり、この時、D=-0.25
それでは、Dの最高値は常に0.25であろうか。
今度はn (totaln)とn1=n12+n11を変数にして、n21=n12=0の条件、即ち、以下の表のような場合、
表8 ハプロタイプ数
第一遺伝子座 第二遺伝子座 1 第二遺伝子座 2 1 n1 0 2 0 n-n1 で最高のDを調べると、
n(=total_n)、n1とD(max)との関係
![]()
Dは最高値0.25であるが、nが固定されていてもn1=n12+n11の値によってDの最高値は低下する。つまり、多型の頻度p1・によりDの最高値は0.25以下の値に変化する。
nを固定してn1を横軸に取り、Dの最高値を調べると、
n1とD(max)との関係(nは固定)
![]()
n1=n/2、即ち、多型が50%、50%の時が最大のDを得る。
それではD'の値はどうであろうか。
同様に、n=100、p1・=0.5の場合を考える。染色体の総数は100で、第一遺伝子座については50%の頻度で1,2の対立遺伝子がある場合である。表9 ハプロタイプ数
第一遺伝子座 第二遺伝子座 1 第二遺伝子座 2 1 n11 50-n11 2 n21 50-n21 n11(1-aの数)を横軸にn21(2-aの数)を縦軸にD'を表示すると、
n11(=1-a)、n21(=2-a)とD'との関係
![]()
D'の最高値は1である。D'はDと違って正の値をとる。n11=n21であればD'=0となる、などはDと同じであるが、大きな違いは縦軸、横軸上のD'の値で、これらはすべて1となっている。即ち、n11=50または0であればn21の値にかかわらずD'=1であり、n21=0 or 50であればD'=1である。
例えば、以下のような例があるとする。
表10 ハプロタイプ数
第一遺伝子座 第二遺伝子座 1 第二遺伝子座 2 1 50 0 2 49 1 これは、遺伝子座1では50%、50%の多型があるが、遺伝子座2では1%、99%にすぎず、第二遺伝子座が2の多型の1個はたまたま遺伝子座1について多型2の染色体に起きたにすぎない。当然、連鎖不平衡と呼ぶべきものではない。しかし、D'=1となる。
即ち、D'を用いる場合は、片方、または両方の多型の頻度が極めて小さい時には高く出るので注意が必要である。
次に、Δ2を考えてみる。
これは2 x 2 表についてχ2/nを計算したものに等しい。同様に、n=100、p1・=0.5の場合を考える。染色体の総数は100で、第一遺伝子座については50%の頻度で1,2の対立遺伝子がある場合である。
Δ2の値は、
n11(=1-a)、n21(=2-a)とΔ2との関係
![]()
Δ2も同様に正の値であり、最高値は1である。
2) p1・=0.2の場合
次に、n=100、p=0.2の場合を考える。即ち、第一遺伝子座について20%、80%の頻度で1,2の対立遺伝子が存在する場合である。
表11 ハプロタイプ数
第一遺伝子座 第二遺伝子座 1 第二遺伝子座 2 1 n11 20-n11 2 n21 80-n21 Dの値をn11、n21の関数として表すと、
n11(=1-a)、n21(=2-a)とDとの関係
![]()
即ち、最高になるのはn11=20、n21=0の時であるが、D<0.25である。
次に、同様の条件でD'を調べると、
n11(=1-a)、n21(=2-a)とD'との関係
![]()
即ち、p1・=0.5と同じような図形であることがわかる。しかし、依然として四つのへりがすべてD'=1となる問題が残る。
同様の条件で、Δ2の値をしらべると以下のようになる。
n11(=1-a)、n21(=2-a)とΔ2との関係
![]()
| III) 結論 |
Pair-wiseに二対立遺伝子座の連鎖不平衡の程度を比較する場合は、それぞれの尺度の性質を良く知ったうえで行うべきである。
すべての尺度について考慮することが最も望ましい。