編集という立場で原稿をチェックしていると、しばしば見つけてしまうのが「コピペ原稿」。
コピペを見抜くのが簡単なケースは、Wordファイルで送られてきた原稿の一部だけ字体やフォントサイズや文調が異なるケース。もしそのライターとの付き合いが長いなら「あれ?こんな言い回しする人だっけ?」という違和感など……。
こうした「コピペ」のすべてが必ずしも悪意に基づいているとは思いませんし(弊サイトもキュレーション記事にてコピペさせていただいています)、「じゃあ『てにをは』を変えたらOKなんですか?」という議論も不毛でしょう。
しかし「それでもやはりコピペは……」という時、編集者/校正者も所詮は人の子。すべてのコピペを見抜けるわけではありません。そんな時に役立つのが「コピペチェックツール」です。
今回はせっかくなので現在サービス提供されている主要なコピペチェックツール3つを実際に使って、「どのくらいの精度で検出できるのか?」を実験してみることにしました。
ちなみに今回実験に使用したのは「Webエンジニア・デザイナーのためのモーター「Webmo」登場!Webの知識でプロダクト開発だってできる!」の原稿です。
こちらはプレスリリース(メディア関係者に配信される公開情報)を元に起こした原稿なので、「製品説明」の表現に関してのみプレスリリースからのコピペが含まれています。
3つのコピペチェックツールによる検証結果
【こぴらん】のコピペ検出結果
まずは無料かつ登録なしでお手軽に利用できるコピペチェックツール【こぴらん】で解析してみました。
冒頭の書き出し部のみ「類似数1」として検出されています。
ですが、この部分はコピペではありません。「Web制作の開発を行っているとふと我に返ることって、ありますよね」というやや特異な書き出しかですが、類似した文章があったようです(逆にすごい偶然の一致ですが……)。
実際にプレスリリースからコピペしたのは「(さらに、)Wi-Fi やモータードライバ(中略)IoT サービスへのアイデアの検討に集中できる」の部分でしたが、今回の【こぴらん】の実験では、残念ながら検出することはできませんでした。
【影武者】のコピペ検出結果
続いて、会員登録を行えば利用回数制限つきで無料利用できる【影武者】の検出結果です。
もしコピペが検出されると左側の「解析結果」の箇所にコピペ元と見られるWebサイトが一覧で並びますが、今回の結果で検出されたのは弊サイト「SeleQt」のみ。
残念ながら【影武者】も今回の実験ではコピペを見抜くことはできませんでした。
【CopyDetect】でのコピペ検出結果
最後にコンテンツマーケティング事業を展開する株式会社Coreがリリースした【CopyDetect】の検出結果です。
かなりのWebサイトがヒットしていますね。一番上の類似「96.3%」は弊サイトですが、「類似10%」程度でプレスリリース配信元、また記事として同じリリースを取り上げた大手Webメディアがズラズラと検出されました。
今回の実験では【CopyDetect】がかなり優秀なコピペ検出能力を見せたと言っていいのではないでしょうか。
今回実験に使ったコピペ箇所はかなり短いので、【こぴらん】【影武者】が採用している検出アルゴリズムと相性が良くなかった可能性も考えられます。一方で【CopyDetect】の検出能力の高さはやはり十分評価できますね。
いずれにしても安易にコピペすると検出される可能性は思っている以上に高いようです。もちろん悪質なコピペは自身の信用問題になる可能性もありますが、コピペ依存はライターとしての技量も向上しなくなってしまいます。それよりも多少文章が拙くても自身の言葉で語るライターはあまりある魅力があると思いますよ!