TuFuncion TuFuncion
Buscar
¿Cuánta información almacena Google?

Hace varios días Google presentó un nuevo documento en el cual se detalla el sistema de ficheros que utiliza, este documento ha sido elaborado por algunos ingenieros de Google y no contiene datos de servicios cómo Writely, Calendar, Blogger o Googlepages.

Bigtable: A Distributed Storage System for Structured Data (PDF)

Resumen de Datos alamcenados en Google

Resumen datos almacenados por Google:

El sistema de búsqueda de Google usa alrededor de 850TB de información (1 TB = 1024 GB), un número cercano a la cantidad de información que circula por Internet, por ejemplo Google Analytics utiliza 220 TB almacenados en dos tablas una de 200TB para datos y otra de 20TB para resúmenes.

Google Earth por su parte utiliza 70.5 TB: 70 TB para imágenes y 500 GB para la información indexada, la segunda tabla es relativamente pequeña, pero su carga es gigante unas 10.000 consultas por segundo y datacenter.

La búsqueda personalizada no necesita demasiado información solo 4 TB. “La búsqueda personalizada almacena la información de cada usuario con un único identificador de usuario que es asignado a un registro nombrado por ese identificador de usuarios, todas las acciones del usuarios son almacenadas en esa tabla.”

Google Base usa 2 TB y Orkut sólo 9 TB.

Compresión de Datos


Si consideramos que toda esta información se encuentra comprimida con un índice de comprensión del 11%, los 800 TB mencionados menguarían hasta 88 TB. Google por lo tanto utiliza para todos los servicios mencionados anteriormente 220 TB comprimidos.

Un dato interesante sería saber que el tamaño de las imágenes utilizadas por Google Earth es casi igual al total de la información referente a páginas indexadas por Google.

Otros Datos

Rapidshare tiene unos 360 Terabytes de almacenamiento destinado a la recepción de archivos por parte de sus usuarios.

Si Google tiene 24 mil millones páginas y estos datos necesitan 850 TB, el tamaño medio de una página debe ser:

934.584.883.609.600/24.000.000.000 = 38.941 (38 K)

En este documento no se ofrecen datos acerca de Gmail pero si tuvieramos que hacer una estimación sobre el tamaño necesario para mantener este servicio, tendriamos que tener en cuenta unos 50 millones de usuarios cada uno con un almacenamiento de 2747 MB:

50,000,000 * 2747 =

* 1152175308800000000 bits
* 144021913600000000 bytes
* 140646400000000 kilobytes
* 137350000000 megabytes
* 134130859.37500 gigabytes
* 130987.167358 terabytes
* 127.9171556 petabytes

Si te interesan las bases de datos y cómo Google puede aspirar a organizar toda la información del mundo este documento es de lectura obligada.
How Much Data Does Google Store?
Bigtable: A Distributed Storage System for Structured Data (PDF)
Google afirma que el primer motor de búsqueda es MSN
Utiliza Linux en tu cuenta Gmail
Trucos para mejorar tu cuenta Gmail
Google Wayback Machine (histórico de páginas)
Un día de un servidor Google
Almacenamiento online y reproductor mp3 gratuito
Google es Dios

arrow1 Response

  1. jose gabino camacho estrada
    96 mos, 4 wks ago

    soy una persona comun, sin ninguna especialidad sobre el tema de las computadora, de hecho apenas llevo unos meses usando facebook, pero por curiosidad me pregunte que tanta informacion hay en internet y bueno llege a aqui, me hice una idea de lo importante que es este medio y importante que es.
    una vez un sobrino que si estudio sistemas cumputacionales, me dijo “despues de los numeros lo que hay infinito es el internet”, bueno no se quiza exagero, no lo sé pero ahora que veo un articulo que dice “google es dios” me parece algo posible (lo de lo infinito no lo de dios), aunque no dejo de pensar que es algo muy presuntoso, porque a fin de cuentas la informacion se limita a todo el conocimiento de nuestra civilizacion.
    Sin embargo me inquieta pensar que,todo nuestro acervo lo estemos dejando en manos de una biblioteca virtual, que lo unico que nos esta ahorrando es dinero ,espacio y tiempo. pero que es estan fragil,que basta con que un gobierno autoritario, o los mismos dueños de google lo lo hagan inaccesible, o un simple fenomeno metereologico lo haga desaparecer .
    Esto me hace recordar, la historia de la gran biblioteca de Alejandria, que fue destruida por un mero capricho de un ejercito invasor, que significo la desaparicion de todo un mundo de informacion antigua,
    Por lo que pienso que no hay como una buena enciclopedia, a la antigua o sea, en libros impresos.
    Esta es mi humilde opinion

Deja un comentario