・機械学習アルゴリズムに基づく新しいツールは、遺伝子コードを調べることで人の身長を予測できます。
・このツールは、かかとの骨の密度と、将来的に到達する教育レベルについても教えてくれます。
生物の機能のほとんどは、DNAによって制御されています (発生、生存、繁殖の方法を含む)。したがって、遺伝暗号を使用して生物の性質を予測することができます。
ミシガン州立大学の研究者が、数千人の情報を含むデータを使い、独自の遺伝子型や特徴を含む、人々の身長を正確に予測し、心臓疾患、癌や重篤な病気のリスクを評価できる新しいツールを初めて開発しました。
このツールは、ゲノムを分析して人間の特徴を予測する機械学習アルゴリズムで動作します。ヒトのかかとの骨密度と、到達する教育レベルを含む、固有のデータを出すことができます。もちろん、適用先はそれだけではありません。
データと検証
これらのデータセットはどこで入手したのでしょうか。英国の約 50 万人の成人の遺伝子構成全体を収集し、このデータを機械学習アルゴリズムに入力しました。データは、国際的な健康情報リソースであるUK Biobank から取得されました。
従来の遺伝子検査技術は、人の染色体または遺伝子の特定の変異を探しますが、このモデルは複数のゲノム変異を分析し、何万もの違いに基づいて予測プログラムを組みます。
アルゴリズムは、遺伝子コードと各個人の身長を分析します。各人のデータから学習し、パターンがあるかどうかを識別します。最終的に、アルゴリズムは学習を完了し、人のゲノムを見て身長を判断できるようになります。
これまでのところ、このアルゴリズムは3つの結果 (身長、骨密度、到達する教育レベル) に対して検証されており、乳がんや糖尿病など、健康リスクに関連する他の複雑な特性の予測に適用できるようになりました。
検証テストでは、モデルは平均約1インチ誤差で人の身長を予測できました。
骨密度と教育レベルの達成度予測因子はうまく機能しませんでしたが、骨粗鬆症 (骨密度が低下する状態) を発症するリスクが高い人や学校で困難になる人を検出するのに十分な精度でした。
この技術の応用先は?
このツールにより、医師はできるだけ早く患者のケアに介入し、病気を遅らせたり予防したりして、予防医療の実践を進めることができます。研究者は、より多様なデータセットを利用して精度を高めることを計画しています。これにより、医師は病気のリスクと重要な形質の遺伝的構造を正確にマッピングできるようになります。
将来、ゲノム検査は血液型検査と同じくらい簡単になるかもしれません。研究者によると、50ドル程度でできるとのことです。成功すれば、早期の介入により何百万人もの命が救われ、何十億ドルもの治療費が節約されます。