・アミノ酸配列に基づくタンパク質の3D構造を図式化するには、同じパターンのモデルがよく使われます。
・一度習得してしまえば、特別な知識がなくてもほとんどのタンパク質の構造を図式化することが可能です。
人体を構成する主な部分は、タンパク質で出来ています。細胞の生成や生命を維持する働きをもっていて、水素、炭素、酸素、窒素、硫黄などのアミノ酸で構成されています。
タンパク質は、他の分子との相互作用しつつ3D構造に組み込まれていき、生命維持に必要な基本的な活動をすべて担っています。
タンパク質の働きやあらゆる病原体への反応は構造によって大きく異なるため、絶えず生体保護や医学の発展のための研究を行うことが重要です。
当然、それは容易なことではありません。過去50年を振り返ってみると、いかにタンパク質の研究が生物学者にとって難しい課題であったかが分かります。最近はコンピュータによる研究が進み、タンパク質がどのように構成されているか様々な仮説が立てられてきました。しかし、まだはっきりとした配列は発見されていません。
そこで、ハーバードにある医学学校では、タンパク質の3D構造を図式化するためにAIモデルが起用されました。これは、現段階の最新技術の6?7程度スピードの点で優れている最新のAIモデルです。
細部が異なるモデルの応用
最先端のアルゴリズムでは、アミノ酸の複雑な物理を模倣したブルートフォース技術が使われています。コンピュータの負担を減らすために、過去のデザインテンプレートに新しいタンパク質構造のアルゴリズムが並列されていきます。
Google AlphaFoldを筆頭に、タンパク質のゲノム情報を大量に解析しているAI団体はいくつか存在します。しかし、アミノ酸配列を発見してもそれらを図式化することは出来ません。過去の研究に前例のない構造であったとしても、進化過程の特殊なタンパク質を図式化することは出来ないのです。
それゆえ研究チームは、Google TranslateやApple Siriなど、有名なアプリで証明されている技術を利用してきました。
幾何学ネットワークと呼ばれるこのシステムがタンパク質には必要不可欠で、何千もの配列や構造に組み込まれています。
各アミノ酸配列では、結合している分子の周りの回転角度と同じように、隣接する酸と化学結合する位置がアルゴリズムによって割り出されています。
神経ネットワークによってこれらの処理(分子同士の相互作用は、各アミノ酸の位置によって調整されます)が行われ、タンパク質の構造が完成します。そして、システムがその構造(直接記録されます)を再度適合させることにより、その精度がチェックされます。
結果
あらゆるタンパク質にこのプロセスが実行され、システムの精度が増すことでさらに活発に相互作用が発生します。そのネットワークを構築するには数カ月を要しますが、一度完成させてしまえば、特別な知識がなくとも全ての技術に応用することが出来ます。
しかし、タンパク質の原子構造を解明するには十分な精度があるとは言えません。医薬品の設計や研究に利用するにはまだ早いでしょう。
現段階では、他の技術と合わせて使うことにより、以前よりも幅広い範囲でタンパク質構造の仮説を立てることが出来ます。物理学と化学の法則を組み合わせることで、そのモデルを改善していく機会も今後ますます増えるでしょう。もし興味をお持ちであれば、GitHubを検索してコードや結果を参考にしてみてください。