以下の内容はhttps://www.sem-r.com/entry/20251005/1759655890より取得しました。


Google検索のフォーラム優遇、Redditの独占と深刻なスパム汚染の実態が明らかに

Google検索のフォーラム優遇、Redditの独占と深刻なスパム汚染の実態が明らかに

Google検索のフォーラム優遇、Redditの独占と深刻なスパム汚染の実態が明らかに

 

SEO・検索トレンドの分析ツールを提供する米Detailed.comが2024年7月に発表した調査レポートにより、Google検索における「ディスカッションとフォーラム(Discussions and forums)」機能の実態、特にRedditの圧倒的な優位性と、それに伴う深刻なスパム汚染の問題が浮き彫りになった。この調査は、製品レビュー関連の10,000キーワードを対象に行われたもので、検索関係者にとって看過できない現状を示している。

 

調査の概要と主要データ

本調査は「最高の電動歯ブラシ」や「友人へのプレゼント」といった製品レビュー関連のキーワード10,000件を分析したものである。主な調査結果は以下の通りである。

  • フォーラム機能の高い表示率: 調査対象の10,000件の検索結果のうち、7,085件(約71%)で「ディスカッションとフォーラム」機能が表示された。これは2024年2月時点の7,702件からは8%の減少を見せたものの、依然として非常に高い表示率である。

  • Redditの圧倒的独占: フォーラム機能が表示された7,085件の検索結果のうち、Redditは7,020件(約99%)に表示されていた。さらに、1つの検索結果ページに複数のRedditリンクが表示されるケースも多く、総掲載数は9,532回に上った。

  • 二極化する可視性: RedditとQuoraの2サイトだけで、他のすべてのフォーラムサイト(合計923サイト)を合わせた掲載数の約2倍の表示回数を占めていた。一方で、表示されるサイトの種類は2月の766サイトから925サイトへと20.7%増加しており、多様性はわずかに向上しているものの、依然として上位2サイトへの集中が際立っている。

項目 2024年2月 2024年7月 変化
フォーラム機能の表示数 7,702 7,085 ▼ 8%
Redditの表示SERP数 7,509 7,020 ▼ 6.5%
Quoraの表示SERP数 3,513 3,800 ▲ 8.2%
表示されたサイト総数 766 925 ▲ 20.7%

フォーラムサイトが調査対象の検索結果に平均で何回表示されたかを示す。2月は平均6回だったが、7月には19回へと3倍以上に増加している。これも、RedditやQuora以外のサイトの露出が増えていることを示唆している。

Redditが表示された検索結果の数。2月の7,509件から、7月には7,020件へと減少している。
Quoraが表示された検索結果の数。2月の3,513件から、7月には3,800件へと増加している。



深刻化するスパム問題と検索品質の低下

レポートが最も警鐘を鳴らしているのが、Googleが優遇するRedditスレッドのスパム汚染である。2月の調査では、上位に表示されるRedditスレッドの51%で、最も目立つトップコメントが自己宣伝的なアフィリエイトリンクを含むスパムであったことが指摘されていたが、7月の調査でもこの問題は依然として深刻であることが確認された。

スパムの手口は巧妙で、スレッドが作成されてから数ヶ月後に、購入した高評価(Upvote)によって意図的にトップに表示されたコメントにアフィリエイトリンクを仕込むというものである。これにより、ユーザーは信頼できる本物の推薦ではなく、金銭目的のリンクへと誘導されてしまう。

レポートの筆者であるGlen Allsopp氏は、「現在の検索結果は、私が見てきた中で最悪の状態だ」と断言。Googleが信頼性の高い情報源としてRedditを優遇した結果、皮肉にも検索結果の品質を著しく低下させていると強く批判している。

 

メディア企業と独立系フォーラムの動向

RedditとQuora以外に目を向けると、興味深い動向が見られる。

  • 独立系サイトの健闘: 上位100フォーラムのうち、70サイトが独立したウェブマスターによって運営されており、メディア巨大企業による独占状態ではないことが判明した。これはSEO業界にとって明るい兆しと言える。しかし、前述の通り、これらのサイトの表示回数はRedditなどに比べて微々たるものである。

  • メディア企業の存在感: 一方で、Future Plc(Tom's Hardware等)やZiff Davis(What To Expect等)といったメディア巨大企業も多数のフォーラムを運営し、上位にランクインしている。特に、1,200以上のコミュニティを抱えるVerticalScope社は、上位100サイトのうち13サイトを所有しており、この領域における主要プレイヤーとなっている。

 

新規フォーラムの参入は可能か?

レポートでは、新規に立ち上げたフォーラムがこの機能で上位表示される可能性についても分析している。結論として、上位100フォーラムの中に新しいサイトや投稿数の少ないサイトは一つも確認できなかった。最も新しいドメインでも2020年または2021年に登録されたものであり、Googleが権威性や歴史を重視していることが示唆される。

このことから、レポートは「このSERP機能での表示だけを目的としてフォーラムを始めるべきではない」と結論付けている。

 

今後の予測とSEO担当者への示唆

筆者は、このスパム問題が看過できないレベルに達していることから、Googleは今後この「ディスカッションとフォーラム」機能に対して何らかの対策を講じると予測している。考えられる変更は以下の通りである。

  1. 機能自体の廃止または大幅な変更

  2. 表示されるリンクの多様性を高め、Redditへの集中を緩和する

  3. Redditの複数リスティングを減らす

7月のデータでRedditの占有率がわずかに低下し、表示されるサイトの多様性が増したことは、この予測が現実になりつつある兆候かもしれない。

SEO担当者にとって、この動向は重要な示唆を含んでいる。Googleがユーザーの「本物の声」を求めてフォーラムを優遇する姿勢は続く可能性があるが、現状のスパム汚染は、アルゴリズムやSERP機能が常に変動するリスクを改めて示すものである。特定のプラットフォームに依存した戦術(例:Redditでのアフィリエイトマーケティング)は危険であり、検索エンジンの動向を注視し続ける必要があるだろう。

 

The Discussion Forums Dominating 10,000 Product Review Search Results
https://detailed.com/forum-serps/

 

解説

日本ではあまり報じられていないが、SEO・検索業界においてReddit はたびたび話題となるトピックである。

Reddit、Google以外の検索エンジンクローラを拒否

2024年2月にReddit は Googleと年間およそ6,000万ドル相当のデータライセンス契約を締結した。この契約によりGoogleはReddit の持つコンテンツをAIモデルの学習に利用できるようになった*1。AI開発企業がインターネット上のコンテンツを無断で学習データとして利用し、著作権侵害の可能性が指摘される中で、コンテンツ所有者と正式に契約を結ぶという新しい流れを象徴するものだった。

その後、2024年6月に Reddit は robots.txt を変更し、原則として全てのボットを拒否する姿勢を鮮明にした。 robots.txt には「Redditはオープンなインターネットを信じているが、公開コンテンツの不正利用は信じていない」との声明が追記されている。

# Welcome to Reddit's robots.txt

# Reddit believes in an open internet, but not the misuse of public content.

# See https://support.reddithelp.com/hc/en-us/articles/26410290525844-Public-Content-Policy Reddit's Public Content Policy for access and use restrictions to Reddit content.

# See https://www.reddit.com/r/reddit4researchers/ for details on how Reddit continues to support research and non-commercial use.

# policy: https://support.reddithelp.com/hc/en-us/articles/26410290525844-Public-Content-Policy

User-agent: *

Disallow: /

https://www.reddit.com/robots.txt

Redditの広報担当ティム・ラッシュミット(Tim Rathschmidt)氏はThe Vergeへの声明で、「これは我々とGoogleとの最近のパートナーシップとは全く関係ない」と述べた上で、次のように説明した。「我々は複数の検索エンジンと協議を続けてきた。しかし、一部の企業はRedditのコンテンツ利用、特にAIへの利用に関して、強制力のある約束をすることができない、あるいはしたがらないため、全ての企業と合意には至っていない」。

“This is not at all related to our recent partnership with Google,” Reddit spokesperson Tim Rathschmidt says in a statement to The Verge. “We have been in discussions with multiple search engines. We have been unable to reach agreements with all of them, since some are unable or unwilling to make enforceable promises regarding their use of Reddit content, including their use for AI.” [Reddit is now blocking major search engines and AI bots — except the ones that pay, The Verge, July 25, 2024]

つまりRedditは、AI学習へのデータ利用を明確に制限する契約を結ばない限り、検索エンジンによる自由なクロールを認めないという強硬な姿勢を示している。Redditの最高法務責任者であるベン・リー氏も、「これは我々と契約のない者がRedditのデータにアクセスすべきではないというシグナルだ」と語っており、商業利用には対価が必要であるとの立場を明確にしている。

一方、ブロックされた検索エンジン側からは、競争の阻害を懸念する声が上がっている。Mojeek CEOのコリン・ヘイハースト (Colin Hayhurst)氏は、「我々は20年間、敬意を払ってクロールしてきた。AIの学習も行わない純粋な検索エンジンだ」と述べ、一律にブロックされたことへの不満を表明している。

“We've always crawled respectfully and we've done it for 20 years. We're verified on Cloudflare, we don't train AI, we're like genuine, traditional genuine searching, we don't do ‘answer engine’ stuff,” Hayhurst said. “Answer engine” is Perplexity’s name for its AI-powered search engine. “The whole point about Mojeek, our proposition is that we don't do any tracking. But people also use us because we provide a completely different set of results.” [Google's Exclusive Reddit Access, 404 media, July 24, 2024]

近年、AIが生成した質の低いコンテンツがウェブに溢れる中、多くのユーザーは信頼できる人間の意見を求めて、検索ワードに「Reddit」を追記するようになっていた。この手法は、実体験に基づいた有益な情報にたどり着くための有効なハックとして知られていたが、今後はGoogle(あるいはGoogleのインデックスを利用する検索エンジン)でしか機能しなくなる可能性が高い。

一方、2025年9月のブルームバーグの報道によると、RedditはGoogleとの契約更新交渉において、データ提供料の増額に加え、Google検索からRedditへのユーザー送客を強化するよう求めているとされる。これは、AIに答えを要約されることで自サイトへのトラフィックが減少することを懸念しており、コンテンツを生み出すユーザーコミュニティそのものを維持するための要求である。

 

”優遇”されているように見えるUGCは悪用されやすい

RedditとGoogleの契約が自然検索の可視性にどのように影響しているのかは不明だ。GoogleもReddit も否定しているうえ、その否定を覆すようなエビデンスは特に見当たらない。Google検索部門の独立性を考慮すれば、これらは単なる陰謀論に過ぎないだろう*2。ただ、それを差し置いても実際にRedditがGoogle検索で露出されていると多くのSEO専門家が指摘していることも事実である。

Googleはコアアップデート実施時に「Experience(経験)」「Expertise(専門性)」「Authoritativeness(権威性)」「Trust(信頼性)」の頭文字を取った E-E-A-T のコンセプトのなかでも人間の実際の経験や体験を重視しているかのようなアルゴリズム調整を行っている節がある。Reddit はまさにその経験や体験が集合したデータベースであり、結果として検索の可視性を高める理由になっているともいえよう。つまりRedditと利用者との共創によって生まれた、Reddit の持つプラットフォーム価値が検索の露出度を高めているのだ。

一方、第三者的に”優遇”されているように見えるUGC (User Generated Content) は、ウェブスパマーの標的になりやすい側面もある。それが今回紹介したDetailed.com の指摘である。

掲示板やフォーラムといったUGCや、外部の第三者が投稿・発信できる機能を有するメディアが検索のために悪用されることは今に始まったことではない。かつてYahoo!検索キーワード入力補助やGoogleオートコンプリートといった、いわゆる「キーワードサジェスト」を人為的に操作するために 2chや5ch、Yahoo!知恵袋や OKWAVEといったUGCに不正な書き込みが行われていたことがある。はてなブックマークは長年にわたり自作自演ブクマによりホットエントリーを目指す不正行為が観測されているし、今年に入ってからは、LLMO対策と称してnote.com にてスパムコンテンツが増加している。外部リンク全盛だった2000年代まで遡ると、某大手IT系メディアが運営していた専門家ブログサービスで不正なリンク埋め込み事例、メルマガ配信サービスのプロフィール欄を活用(悪用)した被リンク推奨事例など、枚挙に遑がない。

 

機械翻訳したページで海外からの自然検索流入増を狙うReddit

2024年末頃から日本語検索結果に Reddit の掲示板スレッドへのリンクが表示されるようになった。Reddit は海外比率を高めようとしており、その一環として機械翻訳による多言語化およびその翻訳したページをGoogleにインデックスさせることで検索集客を強化している。

かつては2chのスレッドがヒットしたような検索語句でも2025年現在は Reddit の日本語翻訳ページがヒットする機会が増えたと感じている方も多いのではないだろうか。

Googleは少なくとも2010年当時は機械翻訳したページをそのままインデックスさせることはウェブスパムに該当する可能性があると指摘していた。2025年10月現在も多言語のウェブサイト関連のドキュメントのなかで「自動翻訳したページがインデックスに登録されないようにすることをおすすめします」と記載している。

 

多言語のウェブサイトのクロールとインデックス登録
自動翻訳したページがインデックスに登録されないようにすることをおすすめします。自動翻訳は意味が通じない場合があり、スパムとみなされる可能性があります。さらに重要な点として、多言語のウェブサイトを作成する目的は、有益なコンテンツを複数の言語で提供してより多くのオーディエンスに見てもらうことです。ユーザーが自動翻訳されたコンテンツを見て、理解できない場合や不自然に感じる場合は、そのようなコンテンツを本当に提供したいかどうか考えてみてください。[Google検索セントラル]

ただし、その理由は「自動翻訳は意味が通じない場合があり、スパムとみなされる可能性があります」である。実際、Googleは SEO専門家のGlenn Gabe氏の質問に対し、コンテンツの質が高く役立つものであればAI翻訳を使用しても問題ないと回答している*3

要するに、コンテンツの質が高く役立つものであれば、規模を拡大するためにAI翻訳を使用しても問題ありません。また、Googleは特定のサイトを優遇することはないと述べています(つまり、Redditを特別扱いしたわけではないのでしょう)。そして、Googleは多言語サイトに関するドキュメントから「自動翻訳されたコンテンツをブロックする」という項目を削除しました。

https://bsky.app/profile/did:plc:wuhxbvkum7vuk4ofug36ffro/post/3lrdqw6zy2k26

 

Reddit が翻訳品質をどのように管理しているか不明であるが、少なくとも筆者が目にする限り(多少おかしい表現があるが)スレッドの趣旨も個々の投稿の意味もおおよそ理解できる程度の品質だと考えている。現在の機械翻訳は2010年当時と比べて性能が飛躍的に向上していることも踏まえると、一定のモデレーションが行われているコンテンツであれば問題がないのだろう。

[補足] Reddit は Googleに事前に相談したとのこと

そしてそのブログ投稿だけでなく、Redditは決算説明会で機械翻訳について大々的に取り上げました。彼らは、AI翻訳コンテンツをどのように拡大しているか、それがどのようにして彼らの認知度向上を牽引しているか、さらにはGoogleがそのプロジェクトでどのように協力しているかについて説明しました。

ええ、彼らは文字通りGoogleに(彼らのパートナーシップから推測するに)AI翻訳による規模拡大が問題ないかを尋ねるためにアプローチしたのです。Googleはおそらく問題ないと回答し、Geminiを使ってその実現を支援しているのでしょう。Redditは「(Googleによって)完全に承認されている」とさえ述べました… すごいですね。その部分については、以下の動画(37分38秒の箇所)で聞くことができます。Is it safe? Does Google’s evolving view of auto-translated content, and lack of action with Reddit’s AI translations, open the floodgates for site owners? [GSQi, May 5, 2025]

 

To grow outside the US, we're using machine translation to unlock our mostly English corpus. We believe this will not only drive growth in the near term, but also over time will allow users from all over the world to connect, regardless of the languages they speak.

米国外で成長するために、私たちは機械翻訳を利用して、大部分が英語である我々のコーパス(テキストデータ)を解放しています 。これにより、短期的な成長が促進されるだけでなく、将来的には世界中のユーザーが話す言語に関わらず繋がれるようになると信じています 。[Reddit Q1'24 Earnings Call(2024年第1四半期 決算説明会)より]

Redditのスレッド自動翻訳ページの懸念点は、そのコンテンツ品質面だろう。

Reddit のスレッドをそのまま日本語に翻訳しても、日本のユーザーにとって必ずしも有益とは限らないケースもある。国による文化や慣習、法律の違いが存在するためだ。たとえば個人の信用度を数値化したクレジットスコアや不動産賃貸契約、転職面接や恋愛、医療・健康関連などのスレッドは、米国ユーザー同士の会話を見ても日本人には役に立たないケースもあるだろう。

こうしたスレッドは少なくとも日本在住の日本人にとって品質に難ありといえる状況であり、GoogleやReddit はこうした問題にどう対処していくのか気になるところだ。

 

 

Reddit is one of the largest places for authentic connection and conversation online, and more and more people are discovering and appreciating this. We believe Reddit is more important now than ever before, not only as an alternative to traditional social media, but as we enter the Al era where the value of our corpus continues to grow. The paradox I see is that as more content on the internet is written by machines, there's an increasing premium on content that comes from real people, and we have nearly two decades of authentic conversation, unique perspectives, earnest advice, honest reviews, and answers to questions about every topic imaginable.


Redditは、オンラインで本物のつながりと会話ができる最大の場所の1つであり、ますます多くの人々がこれを発見し、評価しています。我々は、Redditが従来のソーシャルメディアの代替としてだけでなく、我々のコーパスの価値が増し続けるAI時代に入る中で、これまで以上に重要になっていると信じています。私が感じるパラドックスは、インターネット上のコンテンツがますます機械によって書かれるようになるにつれて、実在の人物から生まれるコンテンツへのプレミアムが高まっているということです。そして我々には、約20年にわたる本物の会話、ユニークな視点、真摯なアドバイス、正直なレビュー、そして想像しうるあらゆるトピックについての質問への答えがあります。[Reddit Q1'24 Earnings Call(2024年第1四半期 決算説明会)より]

 

 

 

*1:Redditは2024年3月21日にニューヨーク証券取引所(NYSE)に上場している。この上場直前にGoogleと契約をしていることから注目を集めた。

*2:Googleとnote.com が業務資本提携をしたからGoogleがnote を優遇しているといった主張と同じくらいの妄想に過ぎない。

*3:ちなみに2024年時点のGoogle ウェブ検索のスパムに関するポリシーには「自動ツールで翻訳されたテキストが、人間によるチェックや編集を経ずに公開されたもの」という一文が記載されていたが、2025年10月時点の同ドキュメントからは削除されている。




以上の内容はhttps://www.sem-r.com/entry/20251005/1759655890より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます

不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14