・GoogleはDeep Neural Networkを使用してケプラーのデータを分析しました。
・彼らは2つの新しい太陽系外惑星、Kepler-90iとKepler-80gを発見しました。
・彼らが開発したモデルは、惑星と非惑星を区別するのに約96%正確です。
何世紀にもわたって、人々は星を見上げ、いくつかのパターンに気づき、観測を記録してきました。 宇宙で発見された初期のものの1つは惑星でした。惑星は不規則な動きをするので、ギリシャ人は「放浪者」または「planētai」と呼んでいました。 次第に、太陽系の惑星が太陽の周りを回っていることがわかりました。
デジタルカメラ、宇宙飛行、望遠鏡の光学系、コンピューターなどの最新技術を使って、自分たちが住んでいる太陽系を超えて知識を拡張し、地球から数千光年離れた惑星を検出/識別できます。 それらは太陽系外惑星と呼ばれ、宇宙のはるか遠くにある別の太陽系の一部です。
しかし、太陽系外惑星を見つけることは非常に難しい作業です。 ホスト星とは異なり、小さく、寒くて暗いです。 現在、太陽系外惑星を正確に見つけるために機械学習技術を使用しています。 その手法の1つをGoogleが使用しており、黄色の矮星であるケプラー90の周りを周回するケプラー90iという名前の2つの外惑星と、ケプラー80を中心に回転するケプラー80gを検出しました。
過去のデータ
太陽系外惑星を検索するには、手動分析と自動ソフトウェアの両方を使用して、NASAのケプラー宇宙望遠鏡によってキャプチャされた膨大な量のデータを分析します。 望遠鏡は4年間で約20万個の星を観測し、30分ごとに画像を撮影しました。
ケプラーの科学機器である光度計は、視野を固定し、145,000を超える主系列星の明るさを継続的に監視します。 これらのデータは地球に送信され、ホスト星の周りを回転することによって引き起こされる太陽系外惑星の周期的な減光を特定するために詳細に調べられます。
これはすべて約140億のデータポイントを生成し、これは約2兆の惑星軌道に相当します。 最も強力なコンピューターでさえ、これらの大量のデータを処理するのに非常に長い時間がかかります。 このプロセスをより速く、より効率的にするために、Googleはディープラーニングのツールとテクニックを使用しました。
機械学習アプローチ
機械学習は、特定のパターンを認識するようにコンピューターに教える人工知能です。 これは、特に大量のデータを理解するのに役立ちます。 ここでは、特定のルールでプログラミングするのではなく、トレーニングと例によってマシンが学習できるようになっています。
画像元: NASA
機械学習の一種である深層学習は、計算層を使用して、複雑な分類を簡単にする機能があります。 たとえば、深層画像分類モデルは、モデルの最終的な特徴層が複雑なオブジェクトを区別できるようになるまで、コーナーや曲線を検出するためにさらに使用できる単純なエッジ特徴を最初に認識します。
ディープニューラルネットワーク(ディープラーニングモデルの一種)は、画像分類を含むいくつかのタスクで最先端です。 ほとんどの場合、手動で設計されたモデルよりもパフォーマンスが優れています。 ニューラルネットワークは、その予測がトレーニングセットの真のラベルからどれだけ離れているかを測定するコスト関数を最小化するように組み込まれています。
Google AIチームは、15,000を超えるケプラー信号のデータセットを使用して、惑星を他の天体から区別するためのTensorFlowモデルを作成しました。 これを行うには、実際の惑星のパターンと、連星や恒星黒点などの他の物体によって引き起こされたパターンを検出して認識する必要がありました。
彼らは、ケプラーのしきい値交差イベント(TCE –検出された周期的信号と通過する惑星が一致する可能性がある)を自動的に調べるためのディープニューラルネットワークを開発しました。 これは光度曲線を使用し、人間が分類した一連のKeplerTCEでトレーニングされます。
入力のビューは、個別の畳み込み列を介しています。これは、以前の画像分類で成功した方法です。 宇宙体を適切な精度で区別することができます。実際の通過する太陽系外惑星と、機器のアーティファクト、食変光星、恒星の変動などの誤検知との微妙な違いです。
結果
信号でテストしたとき、惑星と他の非惑星によって生成された信号を96パーセントの精度で正しく区別しました。 さらに、98.8%の確率で、もっともらしい惑星の信号が誤検知の信号よりも高くランク付けされました。
検索を絞り込むために、彼らはすでに2つ以上の太陽系外惑星がある670個の星を観測しました。 処理中に、2つの新しい太陽系外惑星–Kepler-90iとKepler-80gを発見しました。
ケプラー90i惑星は、7つの通過する惑星をホストすることが以前に知られている星であるケプラー90を中心に回転します。 一方、Kepler-80gは、Kepler-80星の周りにある5つの惑星チェーンの一部であり、公転周期は3体のラプラス関係で予測したものとほぼ一致しています。
画像元: Google blog
Kepler-90iは地球より34%大きく、軌道周期は14。45日です。 星座りゅう座の地球から2,545光年離れています。 ケプラー90c(8.7日)とケプラー90d(59.7日)の間にあり、表面温度は436°Cと非常に高温です。
今後の展開はどうなるのか?
ディープニューラルネットワークの可能性は、空までです。 200,000個の星のうち、そのうち670個のみ検索されます。 ケプラーのデータではまだ発見されていない数十万の太陽系外惑星が存在する可能性があります。 ディープラーニングのような新しい技術は、天文学者や物理学者が人間の手の届かないものを発見するのに役立ちます。
このモデルは、その精度を向上させ、既知の種類の誤検知を減らすために後から修正することができます。 例えばこのような事ができます
・シミュレートされたデータまたは非標識データを組み込んだトレーニングセットを増やします(現在のモデルは約15,000のラベル付きの例です)。
・惑星の変動性による信号数を減らすことができる惑星の信号数を減らす。
・ターゲットスターではなくバックグラウンドスターの経過を分類するシステムの能力を向上させるために、いくつかの形式の重心を追加します。
・ローカルビューを複数のセグメントに分割して、システムの異なるセグメント間の流れを分析できるようにします。