検索エンジンが結果の順位を決定する上では、それぞれ独自のアルゴリズムが用いられるが、その詳細は公開されていない。このため、辻のような専門家が様々なツールを使って膨大な検索エンジンの動きを観察し、どのようにウェブサイトが評価されているのか、その特徴や基準を調査する。SEOの世界では、辻は知らない人はいないほどの実力を持ち、ツイッターでは3万人以上のフォロワーがつぶやきを注視する。「検索の番人」とも呼ぶべき辻が、検索市場におけるグーグル支配の状況を、絶望的な顔で「もう手遅れではないか」と言うのである。
『膨張GAFAとの闘い』の著者・若江雅子氏が、この10年間の変化を辻氏に尋ねた。
*この記事は中公新書ラクレ『膨張GAFAとの闘い――デジタル敗戦 霞が関は何をしてきたか』(若江雅子著)の一部を抜粋・再編集したものです。
マイクロソフトは日本語での技術開発に意欲を失っている!?
2020年4月にマイクロソフトの検索エンジン「Bing(ビング)」が、多言語対応のためのツール「XGLUE」を公開した時のことだ。人工知能を使った注目の技術だったが、対応する19言語の中に日本語が含まれていないことに気づき、辻は愕然としたという。「ビングは日本での市場シェアが小さくなりすぎて、日本語での技術開発に意欲を失いかけているのではないか」。
世界全体の検索サービス市場では1位がグーグルで、2位以下に百度やビングが続いている。だが日本ではこの時点でグーグル(76・75%)とヤフー(19・87%)が大半を占め、ビングはわずか2・9%(20年4月現在、StatCounter調べ)。百度は既に15年に日本市場から撤退している。
検索精度を上げるには莫大な設備投資が必要だ。常時、膨大な数のウェブサイトをクローリング(ウェブを巡回して情報を蓄積すること)しなければならない。だが、例えば、日本のある大手サイトにグーグルは1日8000万回以上クローリングしているが、ビングの巡回数は半分以下だった。一方で、クローリングの際のアクセスコントロールには技術力を要するが、ビングはコントロールに失敗して、巡回先のサーバに負荷をかけてトラブルを引き起こすこともあるという。このため、最近ではツイッターのようにビングのアクセスを制限しているサイトも少なくない。
「市場シェアが小さくなって、コストをかけてもペイしないと判断しているのかもしれない。だが、コストをかけないから精度はますます下がり、使いにくいからさらにシェアを下げるという、負のスパイラルに陥っている」
特に懸念されるのが、日本語の検索エンジンの場合、他の言語圏より新規参入が困難だという点だ。日本語の場合、単語と単語の間にスペースがなく、文構造や修飾関係があいまいであるなどの特殊性もあり、自然言語処理は難しいとされる。英語圏で健闘するダックダックゴーやエコシアなども日本語の精度は高いとは言えない。
検索サービス市場だけに目を向ければ、日本は2位のヤフーが健闘しているように見える。だが、ヤフーの検索エンジンはグーグルから提供されているものだ。つまり、日本のユーザーの96・6%は、グーグルの検索エンジンを介してインターネット上の情報にアクセスしていることになる。だからこそ、辻は「もし、ビングまでが日本市場から出て行ってしまったら、完全にグーグルしかなくなる」とビングの動向が気がかりでならなかったのだ。
インターネット時代、検索は人々が情報にたどり着くための主要な入口になった。その道案内役がグーグルだけに絞られることがいかに危険なことか。職業柄、辻は痛いほど知っている。だが、「もう対抗軸を育てるのには手遅れかもしれない」と焦る辻が、今振り返って悔しがるのは、約11年前の出来事である。
「もしあの時、違った対応が選択されていたら......」
辻が言う「あの時」とは、ヤフーがグーグルの検索エンジンを採用することを日本の公正取引委員会があっさりと認め、グーグルの検索独占に道を開いた時のことだ。同じ2010年に、欧州委員会はグーグルの検索エンジン市場での行動を問題視し、正式調査に入っている。日本の個人情報保護法が違法に対する実効的な制裁を持たない間に、欧州連合(EU)は莫大な制裁金を彼らに科していたのだ。
すべてがグーグルに飲み込まれる
辻は仕事柄、常にグーグルから顧客のウェブサイトへのトラフィ
その前年、グーグルは「ユニバーサル検索」と呼ばれる統合型検索をスタートさせている。検索すると、ウェブページの検索結果だけでなく、そのキーワードに該当する画像、動画、関連ニュースなどが一度に表示されるタイプの検索である。さらに08年には位置情報に基づく「ローカル検索」も統合された。「和食」と検索すれば一番上にグーグルマップが表示され、現在地近くの和食の店が口コミ情報とともに並ぶ。ユーザーはわざわざ、ぐるなびや食べログにアクセスしなくても、店の評価や場所など大体のことは把握できるようになった。10年には「グーグルショッピング」も始まった。「冷蔵庫」と検索すれば、検索画面の一番上に様々な冷蔵庫の価格や画像の一覧が並び、何回かクリックするだけで購入できるようなサービスである。
グーグルショッピングは検索連動型の広告である。「冷蔵庫」などと検索すると、検索結果の一番上に様々な冷蔵庫の商品名や価格や店舗名などが写真つきでズラリと並ぶから、使ったことのある人は多いだろう。これらは冷蔵庫を販売したいECサイトや家電量販店がグーグルに広告料を支払って掲載している。かたや、他社の運営するECサイトなどは下位に表示されるため、ユーザーが下のほうにスクロールしていかなければなかなか目にとまらない。
検索結果の表示される位置が、他のショッピングサイトを駆逐する上でいかに大きな威力を発揮するか。18年時点で調査会社Adthenaが、米国などの24万の業者が出稿した4000万件の広告を分析した結果は、それを証明している。調査によると、米国の小売業者らが使った検索連動型広告の予算の76・4%がグーグルショッピングに投じられており、さらに、クリックの85・3%はグーグルショッピングから発生していることもわかったという。
そして、ホテル、航空チケット、転職案内......グーグルは次々と自社独自のサービスを展開していき、おかげでユーザーは素早く、簡単に、必要な情報にアクセスできるようになった。
「ユーザーにとって便利なことは間違いない。でも、このままではすべてがグーグルに飲み込まれてしまうのでは」。辻は担当する顧客企業が、自社サイトの閲覧者数減少に狼狽する姿を見ている。グーグル自身の提供するサービスに押しやられ、自社の検索結果は画面の下のほうにしか表示されなくなったからだ。たいていのユーザーは、わざわざスクロールしてまで探してくれない。米国では実際に廃業を余儀なくされた大手歌詞サイトやショッピングサイトもあった。
「検索の番人」が語るグーグル一強の問題点
実は辻は、かなりのグーグル・ファンである。検索エンジンについて調査を重ねれば重ねるほど、グーグルの精緻なアルゴリズムと細かい配慮に魅せられてしまうのだという。だが、そんな辻が、「それでもグーグル一強にしてはいけない」と感じているのは、検索が現代の表現の自由や知る権利を支えるものだと信じるからだ。
2016年に、大手IT企業DeNAの運営する医療系まとめサイトWELQが、信憑性に欠ける悪質な健康情報を大量に掲載し、問題となった。広告収入狙いでアクセス数を稼ぐためだけの「粗製乱造」の記事ばかりだったが、過剰なSEO対策をほどこした結果、検索結果の上位に大量に表示されていたのだ。命にも関わる問題である。これを問題視してツイッターで告発し、WELQを閉鎖に追い込むきっかけを作った一人が辻だった。
この問題の後、グーグルは医療分野のアルゴリズムを何度か大きく変えた。病名や症状で検索した際に、信憑性に欠ける記事が上位に表示されないように、規模や知名度を重視する方向でアルゴリズムを調整したのだ。その結果、たしかに危険な記事は上位に表示されなくなった。ただ、個人が細々と続けていた良質の医療系サイトも、検索ではなかなかたどり着けなくなってしまった。
また新型コロナウイルス感染症が広がる状況下では、グーグルは、信頼できるワクチン情報にユーザーを接しやすくするというポリシーを立てている。「コロナ ワクチン」などと検索された場合、誤情報が上位に表示されないようにアルゴリズムを調整し、ユーチューブでは「保健当局の見解と矛盾する情報」の削除を進めているという。この努力によって、荒唐無稽なワクチン害悪論やいたずらに不安を煽るような誤情報は減った。だが、一方で、科学的な根拠に基づいた危険性の指摘でも上位に表示されにくくなった。
グーグルの努力を評価しつつも、辻は再び悩み始めた。「個人が自由に情報発信できるネットの良さや、社会の多様性が失われないだろうか」と。そして毎日のように膨大な検索ワードをグーグルや他の検索エンジンに投入しては結果を比較し、グーグルのアルゴリズムに行き過ぎや偏りがないかをチェックしている。筆者は彼をひそかに「検索の番人」と呼んでいる。
「検索はそのバランスをちょっと欠くだけでも世の中の見え方を変える力を持つ」。だからこそ、辻は検索エンジンの多様性が必要だと感じている。
「かつて日本には200以上の検索技術があった」と辻は振り返る。だが、次第に選択肢は狭まり、2010年頃にはNTTさえもグーグルの検索エンジンを使うようになっていた。「それでも当時、まだ日本にはヤフーという対抗軸が存在していた。グーグルが8割を占める海外の状況に比べればまだ幸運な環境にあったのに」。
ヤフーとグーグルの提携について公取委に異議申し立てをした楽天も、翌年の11年5月には、ポータルサイトでの検索と検索連動型広告システムをグーグルに切り替えた。楽天はこの時、「良質な技術を採用し、利便性を高めるため」とヤフー同様の説明をしている。
もう一つの失われた10年
それから約10年。グーグル支配は着実に進んだ。21年3月時点の日本の検索エンジンシェアは、パソコンやモバイルなどを合わせた全体でグーグルが95・92%を占める。スマホの場合は、さらに寡占が進み、99・58%になった。
「グーグルが社会的責任を果たそうと努力しているのはわかっている。でも......」。辻は悩んできた。
様々な検索エンジンが存在する状況下ならいいだろうが、現実は私たちが情報にたどり着くための、ほぼ一つの道。そしてそれはグーグルの考えによって、きれいに「優先順位」がつけられた道なのである。
インターネットは、一般市民に情報発信と情報収集の自由を与えてくれた。だが、このままでは一般市民がいくら情報を発信しても、届かない日が来るのではないか。情報収集は楽になるかもしれない。だが、それもグーグルの掌の上での収集になる。それは、インターネットが、私たちの知っているインターネットではなくなることを意味するのではないか。
仕事柄、日々グーグルのアルゴリズムと向き合い、膨大な検索結果を観測する立場の辻だからこそ、肌で感じる恐怖だった。
辻が検索の世界で起きている変化に気づき、抱き続けた焦燥感。だが、それが日本社会で広く共有されるまでには10年を要してしまった。
検索は一例にすぎない。スマートフォンの位置情報や、ウェブの閲覧履歴が大量に収集される問題、集められた大量のデータが莫大な広告収益を生み、その収益により新たなビジネス分野で市場支配が進行していく問題、膨大なデータがAIをどんどん優秀にし、利用者を囲い込み、ひいては「エコーチェンバー」や「フィルターバブル」によって社会を分断していく問題......。GAFA(グーグル、アマゾン、フェイスブック、アップル)の巨大化に起因する問題は、プライバシーや消費者保護、競争環境、民主主義のあり方にまで幅広くまたがる。それぞれの分野では危機感を抱き、奮闘する人の姿があった(若江雅子著『膨張GAFAとの闘い』参照)。だが、社会全体としての動きは鈍く、対応が遅れる中でこの10年が過ぎてしまったのである。
若江雅子
GAFAにデータと富が集中している。日本がそれを易々と許した一因に、にわかに信じがたい法制度の不備がある。国内企業に及ぶ規制が海外勢には及ばない「一国二制度」や、EUに比べて遥かに弱い競争法やプライバシー規制、イノベーションを阻害する時代遅れの業法……。霞が関周辺にはそれらに気づき、抗おうとした人々がいた。本書はその闘いの記録であり、また日本を一方的なデジタル敗戦に終わらせないための処方箋でもある。