2024.12.19
システムの穴を運用でカバーしようとしてミス多発… バグが大量発生、決算が合わない状態から業務効率化を実現するまで
How Are Search Engines So Fast?(全1記事)
リンクをコピー
記事をブックマーク
オリビア・ゴードン氏:あなたはファイルを探しています。保存したばかりで、保存場所もわかっているはずなのに、ここだと思っていた場所に見当たりません。
そこでパソコン内を調べますが、結局、ものすごくイライラすることになります。書類の提出期限はあと10分と迫っているのに、パソコンの検索にものすごく時間がかかるのです。正しいファイル名もわかっています。だって、保存したばかりなんですから!
そこで、お友達のGoogleさんにWordは一時ファイルをどこに保存するのかと尋ねます。パソコンが何かおかしなことをしている場合もあるので、念のためですね。すると、Googleは瞬時に、関連する結果一覧を順序立てて示してくれます。
Googleのコンピューターは何兆という膨大な量のWebページを調べ、あなたの特定の問題に対する関連性のランク付けをし、あなたのために順番に並べて一覧にしました。一方で、あなたのパソコンはと言えば、Googleに比べてはるかに小さなデータベースの検索に何千倍もの時間をかけてグルグルと回り続けているのです。
では、Googleは一体どうやって検索しているんでしょうか?
Googleのコンピューターはご自身のパソコンに比べて動きが速いだけだろうと思うかもしれません。……おそらくそれは当たっています。しかし、Googleの見事なスピードの主たる立役者はコンピューターの能力ではありません。
代わりにたどり着くのは、よく知られている「アルゴリズム」というものです。アルゴリズムとは、何かを成し遂げるために従う手順に過ぎませんが、Googleやその他の検索エンジンでは、アルゴリズムによって検索が何ページもの結果に変えられています。
アルゴリズムの動作がそのように速いのには理由があります。検索してから画面に結果が出るまでの一瞬の間、検索エンジンが実際に何兆ものページをくまなく調べたりなどしていないのです。そんなことをしていたらものすごい時間がかかってしまいますし、今はもうダイヤルアップの時代ではありませんから。
私たちが求めているのは、今すぐに出る結果ですよね。
検索エンジンが検索時に全ページに目を通したりしないのは、その前にすでに調べが行われているからなんです。検索エンジンは絶えずWeb上でクロール(Webの収集作業)を行っています。
サイトからサイトへとリンクを辿り、どのページにどんな言葉があるか、その言葉が各ページにいくつあるか、インターネット上の他の部分に対するそのページの重要度など、あらゆる情報についての膨大なリストを作り上げているのです。
検索エンジンがどの結果を表示するかという正確な方法は、一般的には伏せられています。検索結果が上位に来るようにするような、サイトによるシステム操作を防ぎたいためです。
しかし要は、こうした膨大なリストがどのように仕分けされ、いわゆるインデックスとして組み合わされるかということに尽きます。インデックスは本の後ろのほうにある索引とよく似たものです。
検索を行うと、検索エンジンのコンピューターはインデックスの確認のみを行って、最も関連性の高い入力事項を探し出し、正しい順番に並べて返信するというわけです。
こうした作業は、毎回地道にページの検索を行うよりも複雑に聞こえるかもしれませんが、本の場合を考えてみてください。探している箇所を、各ページをめくって目を通しながら探すよりも、索引から探すほうがはるかに楽ですよね。
索引を利用したほうが速いのは、索引の作成者がそうした苦労を引き受け、本の題目をわかりやすく順序立てて一覧にしてくれているからです。そして、索引作成の大変な作業にはそれだけの価値があります。索引があれば、ほしい物がなんであれ、索引がない場合よりもはるかに速く見つけ出せますから。
Googleのコンピューターも膨大な時間と努力を投入してインデックスを作っていますが、その努力の甲斐があるというものです。インデックスによって劇的に検索スピードが上がり、毎秒、約40,000件もの検索にGoogleは答えているのです。
では、なぜ自宅のパソコンやラップトップはファイルの検索がしやすくなる索引作成を行わないのでしょうか? 実は、最新のパソコンのなかには索引を作成するパソコンもあり、かなり素早いファイルの検索が可能になっています。
索引作成をしないパソコンも、ほとんどの場合、上手くお願いすれば……つまり、正しい設定に変えれば、索引を作ることができます。しかしなかには、パソコンにあえて索引作成をさせない人もいます。なぜなら、索引の作成と維持には時間と動力がかかり、パソコンの動きを緩慢にしかねないからです。
索引のない状態で検索を行うと、パソコンはまさにファイルに逐一目を通し、探しているものがあるかどうかを確認しなければなりません。パソコン検索が遅々として進まないことがあるのには、こうした理由があるのです。
そんなこんなで、パソコンがあなたの所有曲にいちいち「期末レポートですか」と尋ねている間に、10分が経過してしまうというわけです。
関連タグ:
2024.12.20
日本の約10倍がん患者が殺到し、病院はキャパオーバー ジャパンハートが描く医療の未来と、カンボジアに新病院を作る理由
2024.12.19
12万通りの「資格の組み合わせ」の中で厳選された60の項目 532の資格を持つ林雄次氏の新刊『資格のかけ算』の見所
2024.12.16
32歳で成績最下位から1年でトップ営業になれた理由 売るテクニックよりも大事な「あり方」
2023.03.21
民間宇宙開発で高まる「飛行機とロケットの衝突」の危機...どうやって回避する?
PR | 2024.12.20
モンスター化したExcelが、ある日突然崩壊 昭和のガス工事会社を生まれ変わらせた、起死回生のノーコード活用術
2024.12.12
会議で発言しやすくなる「心理的安全性」を高めるには ファシリテーションがうまい人の3つの条件
2024.12.18
「社長以外みんな儲かる給与設計」にした理由 経営者たちが語る、優秀な人材集め・会社を発展させるためのヒント
2024.12.17
面接で「後輩を指導できなさそう」と思われる人の伝え方 歳を重ねるほど重視される経験の「ノウハウ化」
2024.12.13
ファシリテーターは「しゃべらないほうがいい」理由 入山章栄氏が語る、心理的安全性の高い場を作るポイント
2024.12.10
メールのラリー回数でわかる「評価されない人」の特徴 職場での評価を下げる行動5選
Climbers Startup JAPAN EXPO 2024 - 秋 -
2024.11.20 - 2024.11.21
『主体的なキャリア形成』を考える~資格のかけ算について〜
2024.12.07 - 2024.12.07
Startup CTO of the year 2024
2024.11.19 - 2024.11.19
社員の力を引き出す経営戦略〜ひとり一人が自ら成長する組織づくり〜
2024.11.20 - 2024.11.20
「確率思考」で未来を見通す 事業を成功に導く意思決定 ~エビデンス・ベースド・マーケティング思考の調査分析で事業に有効な予測手法とは~
2024.11.05 - 2024.11.05