統計
2001年の研究[5]によれば、Web上の文書は5500億個以上も存在し、その多くは「深層Web」にあるという。
2002年の 20億以上のWebページを調査した結果によると[6]、英語のコンテンツが 56.4%で最も多く、以下、ドイツ語(7.7%)、フランス語(5.6%)、日本語(4.9%)となっていた。
これ以降、中国語のページの増加が目立っている。
もっと最近の研究では[7]、75種類の言語でWeb検索を行ってサンプリングし、一般に検索可能なWebは 2005年1月現在で 11億5千万ページ存在するとの結果を得たのである。