ライティングと読みやすさは、SEO対策をする上で非常に重要です。
ユーザーのニーズを満たすテキストを書くことは、検索のランキングを上げることにもつながります。しかし、Googleや他の検索エンジンがどのようにテキストを読み、理解しているかは、ほとんど明かされていません。
この記事では、Googleがオンラインテキストを分析する方法について、私達が知っていることを探っていきましょう。
Googleは本当にテキストを理解しているのか?
人間ではないGoogleが「テキストを理解する」というのは少し変ですが、Googleはある程度、テキストを理解しているようです。
考えてみましょう。
Googleの仕事で最も重要なことの1つは、ユーザーが検索バーに入力した言葉(フレーズ)に沿った検索結果に表示させることです。しかし、こうして入力されるいくつかの単語だけでは、これを実現できません。さらに、Googleはあなたのテキストの文脈を、あなたがテキストで使わなかったフレーズによってランク付けすることも可能なようです。
ということは、Googleがテキストを理解するために、つまり、テキストを読んだり評価したりするために、『何か』をしていることは明らかです。
現在の状況は?
正直に申し上げましょう。 Googleがテキストの文脈をどのように理解しているのか、実際にはわかりません。その情報は簡単に自由に入手できるものではないのです。また、検索結果から判断して、他にも多くの『何らかの作業』が行われていることがわかります。
しかし、結論を引き出すための手がかりはあちこちに残されています。テキストの文脈を理解することに関して、Googleは大きな一歩を踏み出したことが知られています 。
また、Googleは言葉と概念がどのように関連し合うかを、機械的に判断する方法を探っているようです。
このようなGoogleの目論見が、どうして分かったのでしょうか?
根拠の一つは、長年にわたってGoogleが提出してきたいくつかの特許を分析したことです。 もう一つの根拠は、実際の検索結果ページの変遷を考慮したことです。
単語と単語の関連性を判断する「単語埋め込み」
Googleが特許を出願したテクニックの中で興味深いものの1つは、「単語埋め込み(word embedding)」と呼ばれています。 ここでは詳細を割愛しますが、基本的な目標は、ある単語が密接に関連しているのはどの単語か、を見つけることです。
これは次のようにして実現可能です。
まず、コンピュータプログラムに一定量のテキストが供給されます。次に、そのテキスト内の単語を分析し、どの単語が一緒に出現する傾向があるかを判断します。それから、テキスト中全ての単語を「数字の羅列」に翻訳します。 こうすることで、単語を数値化し、ダイアグラム内の空間内の点(散布図など)として表すことができるようになります。
こうして作られる散布図は、個々の単語がどのように関連し合うかを示しています。もっと正確に言えば、それは単語と単語間の距離を表しており、言葉でできた銀河のようなものです。
これによって例えば、「キーワード」のような単語は、「キッチン用品」よりも「コピーライティング」に近い、と機械的に判断できるようになります。
興味深いことに、これは単語だけでなく句や節、文、段落と、より大きな言葉の単位でも可能なのです。プログラムに供給するデータ量が大きいほど、単語を分類して理解し、それらの用法や意味を理解するのが簡単になります。
そして、私達が知ってのとおり、Googleはインターネット全体という巨大なデータベースを持っています。このようなデータセットを使用すると、テキストや文脈を予測し評価することのできる、信頼性の高いモデルが作成可能となるのです。
関連エンティティ
単語埋め込みは、「関連エンティティ」という概念への小さな一歩に過ぎません。「関連エンティティ」が何であるかを説明するために、検索結果を見てみましょう。
Google検索で「パスタ 種類(types of pasta)」と入力すると、下のような画面が検索結果の一番上に表示されます。
「パスタの種類(Pasta varieties)」と書かれた見出しで、さまざまな種類のパスタが並んでいます。よく見るとこれらのパスタは、「リボンパスタ」「チューブ状パスタ」など、いくつかのサブカテゴリに分類されています。
他のフレーズで検索した場合でも同じように、検索結果では言葉と文脈の相互関係を反映した一覧が表示されます。
Googleが提出した関連エンティティに関する特許は、関連しあう個々のエンティティをデータベースの索引に利用する方法について言及したものです。これは、例えば「パスタ」の例で見たような、単語が示す概念を収納するデータベースです。
「ラザニア」を例に説明しましょう。ラザニアはパスタの一種です。それは小麦の生地でできており、そして食べ物です。このように、単語の示す概念が持つ特徴を分析することによって、単語をさまざまな方法でグループ化および分類することができます。
これにより、Googleは単語がどのように関連しているのかをより良く理解し、さらには文脈を読み取ることが可能となっているのです。
結論
以上から、とても重要な2つの結論が導き出されます。
1. Googleは「何らかの方法」を使ってテキストの文脈を理解しているらしく、テキストの文脈もSEO的に重要となっています。
テキストの文脈がGoogleの考える文脈の概念に一致しているほど、検索結果で優位になる可能性が高まります。テキストを作成する際は、トピックを徹底的にカバーすべきでしょう。関連する概念をより大規模にカバーすること、サイト全体を使ってあなたの専門とする仕事を表現することは、専門とするトピックでのあなたの発言力を強化するでしょう。
2. 概念どうしの関係を明確に反映した簡単なテキストは、ユーザーだけでなく、Googleにとっても分かりやすいものとなります。
難しい、矛盾する、構造の良くないライティングは、人間にとっても機械にとっても理解するのが困難なものとなります。
以下は、テキストを検索エンジンに理解してもらうための工夫です。
・ 読みやすさ……メッセージを損なわない範囲でテキストをできるだけ読みやすくする
・ 良い構造……明確な小見出しや、話題の転換を示すつなぎの言葉を追加する
・ 良い文脈……あなたのテキストと、そのトピックについて他で書かれていることとの関連性を示す明確な説明を加える
ライティングが上手くなればなるほど、あなたのテキストが伝えようとする内容はユーザーとGoogleにとって理解しやすいものとなります。Googleは、私たち人間が言語や情報を頭の中でどのように処理しているかを模したモデルを作ろうとしているようです。つまり、あなたのテキストに適切なキーフレーズを追加することは、Googleがあなたのページを検索結果上位に表示させるのを手助けするのです。
Googleは「読者」になりたい
この記事で伝えたいのは、ようするにこういうことです:
グーグルは人間の読者がするのとまるで同じように、テキストを理解しようとし、実際にそうなりつつあります。うまく構造化され、読みやすく、トピックの文脈に沿ったコンテンツを作成することは、検索結果でのチャンスを増やすことに繋がるのです。