en: Sin categoría
Google mueve los hilos en Internet y por ello es esencial estar bien indexado, hace no mucho Google anuncio que tenían ya 1.000.000.000.000 de URLs almacenadas en sus servidores, estamos hablando de 1 billón de páginas indexadas de una manera tan sumamente perfecta que podemos acceder desde el buscador a cualquiera de ellas en menos de un segundo.
Pero claro en este proceso de indexación también existe el juego sucio y los trucos y un elevado porcentaje de estas páginas son spam, además habría que añadir las páginas abandonadas o que ofrecen una información totalmente desactualizada.
Un claro ejemplo de artes sucias es Neoteo.com, la práctica en este caso es sencilla inflar el sitio de visitas provenientes de Google sin importar la calidad de las visitas, esto lo hacen mediante el uso de miles de etiquetas que poco o nada tienen que ver con la temática de la página y de la que se nutren con “contenido automático” que realmente carece de importancia.
Páginas indexadas por Neoteo: site:neoteo.com
Sólo hay que tener en cuenta que el blog de “Neoteo.com” cuenta con 4.000 suscriptores y con 2.780.000 páginas indexadas, no hay que ser un experto para ver que algo no cuadra, sin ir más lejos este blog cuenta con 3.000 suscriptores y 8.530 páginas indexadas, para los que no les haya quedado claro lo normal es lo segundo
.
Para colmo cada una de estas “páginas falsas” vienen adornadas con anuncios de Adsense para engañar al personal y lucrarse de una manera sucia.
Veamos algunos ejemplos de esta práctica:
Creo que estos ejemplos poco o nada tienen que ver con la temática de un blog que dice en su descripción algo así como: “Revista sobre Ciencia y Tecnología, tratamos sobre Gadgets, Inernet, Juegos, etc. Todo la información interesante para un geek esta aquí.”, no creo que “porno”, “sexo”, “bebes”, “tatuajes” y “sexy” sean etiquetas muy “geeks” y esto es solo por citar algunas.
Esta página cumple muy pocas de las directrices de calidad de Google:
Directrices de calidad: principios básicos
1 Respuesta a ¿Indexar páginas a cualquier precio?
Anónimo
16 de Septiembre de 2008 a las 6:37 pm
Y eso no es lo peor, en sus resultados enmascaran anuncios adsense Neoteo Viola las políticas de Adsense
Anónimo
19 de Septiembre de 2008 a las 3:48 pm
Y si a google no le importa entonces a quien? si os fijáis tienen anuncios google personalizados lo que significa que tienen un agente de adsense como manager y si les sigue estando permitido hacer trampas…
hasta se ve que venden enlaces en la página principal cosa que google te suele penalizar tu web quitandote pagerank
para que veais lo bueno que es google..
Anónimo
16 de Septiembre de 2008 a las 5:10 pm
¿Indexar páginas a cualquier precio?
1.000.000.000 de URLs
¿¿¿¿¿ 1 billón de páginas indexadas ?????
Segun tengo entendido, en el sistema métrico decimal un billón es:
1,000,000,000,000 y no 1,000,000,000
en tal caso deberías decir que tienen Mil millones.
Anónimo
16 de Septiembre de 2008 a las 5:11 pm
Los cuatro puntos del final parecen bastante sensatos, pero hay una cosa que me ha llamado la atención especialmente, algo que ya vengo diciendo desde hace años, y es la referencia a todas esas páginas que llevan años sin actualizarse, que no ofrecen gran cosa pero hacen bulto. Yo las llamo “cadáveres” de la Red.
Personalmente, cuando leo acerca de la cantidad de páginas indexadas que tiene Google no hago ni caso a las cifras, ni me las creo. A Google podrían diagnosticarle un Síndrome de Diógenes (Digital).
Hay otra cosa que no has comentado, la cantidad de páginas con contenido duplicado de otros sitios, el famoso corta/pega, o el simple enlazado que, aunque incluya los créditos (queda más estupendo el “via”), no deja de estar copiado (duplicado, triplicado, etc) sin aportar nada nuevo (si, al menos, los que copian/pegan tradujesen todos esos artículos que simplemente enlazan habrían hecho algún esfuerzo por mejorar un poco la Red). Es curioso observar cómo páginas punteras en casi cualquier tema sacan un artículo y en menos de una hora hay cantidad de enlaces en otras webs de temáticas similares a dicho artículo sin aportar NADA más … (Sin comentarios). Escribir “he leido tal artículo en tal web” y dejarlo ahí (lo que la gran mayoría hace en sus blogs de temática tecnológica) NO es generar contenido.
saludos
Anónimo
18 de Septiembre de 2008 a las 3:41 pm
Pues creo que aqui el problema es que no tienes suficiente rank como neo treo
es facil hablar
bay
Anónimo
18 de Septiembre de 2008 a las 3:13 am
Supongo que el anuncio del número de páginas indexadas que hizo Google lo redactaron desde EEUU. En ese caso, la correspondencia es correcta. El billón estadounidense equivale a mil millones, y no a un millón de millones, como en España. Por lo tanto, el que ha escrito el artículo lo ha hecho correctamente.
Acid
18 de Septiembre de 2008 a las 9:34 am
Lo que hay erróneo no es la cifra, sino lo que representa. Se dice almacenadas y luego indexadas, pero no es ninguna de las dos cosas: se trata de URLs “procesadas” que son diferentes (según el blog oficial de Google).
Es decir, el robot recorre enlaces y encuentra URLs y las procesa, detectando si ya tenía una igual (supongo que aplica un hash, etc) y si encuentra una diferente aumenta el contador. Eso no quiere decir que las almacene (cache)… ni siquiera tampoco que las indexe (creo que se entiende que un billón es mucho y conviene descartar algunas).
Por ejemplo, imaginad una página que sea sólo un número, sin palabras ni nada y que no haya ninguna razón extra para enlazarla… Creo que es un caso claro de página a descartar. Si busco información de un número quiero que me aparezca texto, o algo en relación a ese número, no el número suelto.
Acid
18 de Septiembre de 2008 a las 8:54 am
Parece ser que habéis cambiado la cifra, para que concuerde con la palabra billón…
Pero lo que era incorrecto era la palabra billón, la cifra de mil millones era correcta y si queréis decirlo con una sola palabra, podéis usar la palabra millardo (que corresponde a la palabra inglesa billion).
Por otro lado, decir que la cifra imagino que corresponde a páginas ALMACENADAS y accesibles mediante caché, lo cual es diferente de las páginas _indexadas_ (que son las que Google recorre y archiva para búsquedas). Es decir, algunas las recorre y archiva la URL, pero no “almacena” la página entera. El número de páginas indexadas sería más de 2 elevado a 32, es decir, 4294967296 (más de 4 millardos) ya que hace años tuvieron problemas ya que usaban tecnología de 32 bits…
Nacho
17 de Septiembre de 2008 a las 1:20 pm
de verdad crees que porno no es una etiqueta muy geek?