Fine-scale detection of population-specific linkage disequilibrium using haplotype entropy in the human genome
manuscript - ENIGMA
水野英明1,2,3Gurinder Atwal4、Haijian Wang1,5Arnold J Levine1,6Alexei Vazquez6
1プリンストン高等研究所、2中外製薬、3九州工業大学、4コールド・スプリング・ハーバー研究所、5復旦大学、6ニュージャージー癌研究所

原生人類は約20万年前にアフリカに出現し、ここ10万年の間に異なった環境に適応しながら世界中へ移住していった。ヒト進化の歴史は、有益な遺伝子座に近接するサイトの配列パターンが保持される”selective sweep”と呼ばれる過程によって、連鎖不平衡(Linkage disequilibrium; LD)という形でゲノム中に反映されることが知られている。近年、個人間の一塩基多型(Single nucleotide polymorphisms; SNPs)データを複数人種にわたって大規模に収集するHapMap等の国際プロジェクトが進展し、ヒトゲノムの連鎖不平衡解析から進化の痕跡を明らかにする機会が提供されるようになった。

連鎖不平衡の強さの指標として、r2やD'などの古典的な手法が良く知られている。しかし、これらペアワイズのアルゴリズムは複数アリルの関連性を一度に考慮することができないため、検出力が限られていた。新たに登場したExtended haplotype homozygosity (EHH)やComposite likelihood ratio (CLR)といったアルゴリズムは、複数アリルの関連を考慮することができ、従来の手法より高い検出力がある。けれども、それらの手法にも、頻度が小さいSNPを扱うのが不得手である、あるいは、アリルの極性(祖先型/派生型)の推定を必要とする、などの弱点があった。結果としてこうした手法では、ノイズから区別できるシグナルを得るには比較的大きいウィンドウ幅が必要となり、ヒトゲノムは100kb以下の解像度では解析されてこなかった。一方、ヒトにおいては、染色体の組換えホットスポットが少なくとも60kbおきに一つの頻度で存在すると考えられている。これを踏まえると、進化に関してより詳細な洞察をするためには、さらなる高分解能でゲノム走査を行うことが望ましい。

我々の研究室は、以前の研究で、ハプロタイプ(連鎖するSNPsの組み合わせ)の出現頻度からエントロピーを計算し、これを連鎖不平衡の強度の指標とする方法を考案した。ハプロタイプエントロピーは複数アリルの関連性を一度に捉えることができ、頻度の低いSNPを扱うのにも優れており、且つアリル極性の情報を必要としない。こうした特徴により、短い領域における連鎖不平衡を検出する道が開けた。この研究では、ハプロタイプエントロピー法を実際にゲノム走査に適用するための方法論を確立し、HapMapデータからアフリカ/コーカサス人種にそれぞれ特異的な連鎖不平衡領域を平均21kbの高解像度で検出した。得られた領域群には多数の既知被選択遺伝子が含まれていた。さらなる精査では、進化に関する考察がまだされていない体色責任遺伝子も見つかった。ハプロタイプエントロピーを用いた高解像度ゲノム走査の方法論、および、それを使うことで検出できる未知連鎖不平衡領域は、今後、ヒト進化の研究に貢献をしていくものと期待される。
Hideaki Mizuno - IAS