Historias
Slashboxes
Comentarios
 

Login Barrapunto

Login

[ Crear nueva cuenta ]

Google penaliza la redistribución de contenidos

editada por alo el 07 de Julio 2005, 17:28h   Printer-friendly   Email story
desde el dept. PageRank-eando
pobrecito hablador nos cuenta: «Leo en google.dirson.com que Google lleva tiempo penalizando los contenidos duplicados Aún sin saber todavía de que manera lo hace (¿Penalizando sólo la página con contenido duplicado? ¿penalizando el sitio entero? ¿No presentando los enlaces a los contenidos duplicados?) mi opinión es que están atentando contra una de las características básicas de Internet, la de la persistencia de la información.» Continúa en la página de la historia.
«Obviamente no todo lo que hay colgado por ahí merece la pena ser preservado, pero siempre se ha dicho que no importa que una página desaparezca de Internet, alguien, en algún lugar, habrá reproducido esos contenidos (como digo, si merecen la pena) y esa información no desaparecerá junto a su origen.

Si ahora Google penaliza esa duplicación la gente se pensará muy mucho el reproducir (ojo, no hablo de copiar) nada, y puede darse la circunstancia de que la desaparición de portales con interesantísimos contenidos (como el ejemplo reciente de Cyberdark, snifs) suponga la volatilización de grandes cantidades de conocimiento y datos interesantes.

Por no hablar de la distorsión del PageRank. Ahora, un enlace en un portal de prestigio supone una buena cantidad de karma, pero si ése enlace es descartado porque el contenido está duplicado (hablamos siempre que se duplica de forma deliberada y gracias a la participación activa de autor y editor) ese PageRank ya no sirve de nada y, por ejemplo, un blog con buenas reflexiones que sean duplicadas en otros portales con más “peso” se verá en la imposibilidad de ascender en las búsquedas de Google pese a la calidad de sus contenidos.»

Este hilo ha sido archivado. No pueden publicarse nuevos comentarios.
Mostrar opciones Umbral:
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.
  • Cuando estás buscando información sobre gatos, no te gusta leer el mismo texto una y otra vez.

    Yo imagino que el sistema será para que los resultados presentados sean más interesantes, no por el afán de perjudicar a los que duplican los contenidos.
    --
    Gdado dice roller [sourceforge.net]
  • El control de la información

    (Puntos:2, Inspirado)
    por pobrecito hablador el Jueves, 07 Julio de 2005, 18:32h (#547101)
    Se trata de controlar la información en la red.

    Si no se puede encontrar, es como si no existiese. Ahora una información molesta puede aparecer en cientos de sitios y resultar más dificil de neutralizar. Si poca gente es capaz de localizarla, se minimiza el efecto, y se puede contrarrestar con la de los grandes portales mediáticos.

    Ya saben que no pueden eliminar la información, porque además no sería políticamente correcto, así que van a controlar el esfuerzo que hay que realizar para encontrarla. Una vez que controlas los buscadores, llevas a la gente a donde te interesa.

    No nos engañemos, los buscadores son tan fundamentales para la red como el DNS, y ambos están bajo su control.

  • Hombre...

    (Puntos:1)
    por Walenzack (13964) el Jueves, 07 Julio de 2005, 18:39h (#547112)
    ( http://www.xing.com/profile/LuisGonzalo_SotoAboal | Última bitácora: Viernes, 02 Octubre de 2009, 20:51h )
    Tanto como "perjudicar la persistencia de la información"... Que una página no aparezca en Google no quiere decir que la página deje de existir.
    Será más difícil encontrarla, eso sí... de todas formas, cuando desaparezcan las páginas con la información original, entonces la página que aparecerá al buscar será ésa. Otras páginas copiarán a ésa, pero no aparecerán al buscar... etc. No veo perjuicio a la persistencia por ningún lado.

    Y bueno, tened en cuenta (como dicen por arriba) que no hace gracia hacer una búsqueda y que las primeras 20 páginas sean iguales...

    Lo de blogs "menos famosos" que salen perjudicados antes blogs "con más peso": digo yo que las fechas de publicación de contenidos cuentan para algo. ¿No?

    --
    Tal vez quieras visitar mi perfil en XING [xing.com].
  • Pues vaya

    (Puntos:4, Divertido)
    por _NoP (728) el Jueves, 07 Julio de 2005, 18:59h (#547129)
    ( http://www.ytodolodemas.com/ )
    Con lo de moda que se está poniendo por parte de páginas grandes el plagiar contenidos de blogs personales apañados estamos
  • que cagada

    (Puntos:2)
    donde encuentro un mirror para [...]

    hay muchos proyectos que sin mirrors no sería posible que todos podieramos accederlos... y menos al mismo tiempo (p.ej. cuando sale una nueva versión muy esperada de algún sw)

    --

    -------
    [es_CL]
    Demoncrusher: ThrashMetal [demoncrusher.com]

  • por mos-fet (3606) el Jueves, 07 Julio de 2005, 19:52h (#547168)
    ( http://barrapunto.com/ | Última bitácora: Domingo, 08 Octubre de 2006, 09:45h )
    También está Yahoo, Altavista, Alltheweb.....
  • Pues yo estoy de acuerdo :)

    (Puntos:3, Interesante)
    por cYbErDaRk (5330) el Jueves, 07 Julio de 2005, 21:28h (#547237)
    ( http://www.cyberdark.net )
    A mí me parece de los más sano esta postura de Google. Supongo, además, que si se penaliza a alguien se penaliza a aquella página con contenido redundante más nueva, es decir, que la página original más "antigua" mantiene su posición.

    Y me parece genial porque de un tiempo esta parte he encontrado varias webs que apoyándose en la ley del mínimo esfuerzo (véase copy&paste o redistribución de cotenidos) están llenando Internet de basurilla, con el único objeto de que te pases por su sitio y pinches en un anuncio de AdWords que no venía al caso.

    Hay gente que habla de los blogs y tal, donde es muy común el quotear historias de otros y comentarlas, pero en la internet en la que yo me muevo (tiendas y grandes portales) el contenido vale su peso en oro. La ficha de un libro, buena, currada, artículos interesantes son tal o cual tema... eso es lo que hace que la gente conozca tu sitio a través de los buscadores, posibles compradores. Es, en realidad, es el principal secreto. Y luego llega un tipo, y con poco esfuerzo, rellena su site de info... a costa de tu curro!

    Posibilidades de ascender las hay; pero, joder, ¡hay que currárselo un poco! Conseguir un PR6 no es moco de pavo, y no te lo dan en dos meses.

    Me parece, al fin de al cabo, una medida muy higiénica :) Además, no entiendo porqué darle tanta importancia a Google. Veamos, a mí Google me parece importante para los negocios, pero si lo que yo tengo es un blog, me importa un pimiento que salga bien o mal posicionado; lo que me importa es que mis amigos sepan donde está. Ese afán por salir el primero, si no ganas pasta con ello, no puede ser bueno :)

    Un saludo

    PD: la heredera de cyberdark, latercerafundacion, estará lista para después del verano, con una biblioteca ampliada y mejorada.
    --
    cYbErDaRk
  • no es lo mismo

    (Puntos:2)
    por jipipayo (15741) el Jueves, 07 Julio de 2005, 21:31h (#547243)
    ( http://remeseiro.com/metadata | Última bitácora: Viernes, 03 Junio de 2005, 21:14h )
    mas que persistencia de información, yo le llamaría duplicidad o redundancia.
    Y efectivamente la repetición no es un sistema válido para clasificar la información por su calidad.
    Un ejemplo gráfico:
    No volveré a levantarle la falda a Margarita.
    No volveré a levantarle la falda a Margarita.
    No volveré a levantarle la falda a Margarita.
    No volveré a levantarle la falda a Margarita.
    No volveré a levantarle la falda a Margarita.
    No volveré a levantarle la falda a Margarita.
    2o años después sólo pienso en qué habrá sido de Margarita.
    --


    :: In Log we trust ::
  • Dirson OT

    (Puntos:5, Informativo)
    por Carlus (9000) el Jueves, 07 Julio de 2005, 21:41h (#547248)
    ( http://www.neuroticweb.com/ | Última bitácora: Lunes, 26 Noviembre de 2007, 09:15h )

    No es por meterme con Dirson, pero casi siempre que hay una noticia sobre buscadores siempre mencionais a Dirson. Algo más de variedad en las fuentes no estaría mal, os dejo algunas sugerencias (en castellano)

    (Sí, ya se que si quiero más variedad que mande yo mismo noticias con otras fuentes)

    --
    --- Aqui es donde hay que poner algo inteligente?
    • Re:Dirson OT de txuspe (Puntos:1) Jueves, 07 Julio de 2005, 22:04h
  • Si en vez de ...

    (Puntos:2)
    por SergioHernando (17573) <sergioNO@SPAMsahw.com> el Jueves, 07 Julio de 2005, 22:13h (#547268)
    ( http://www.sahw.com/wp | Última bitácora: Lunes, 16 Febrero de 2009, 09:13h )
    Si en vez de dedicar los esfuerzos a localizar y penalizar páginas con contenidos repetidos (a ver si es que los americanos ahora no saben qué es la cita), dedicaran los esfuerzos a erradicar los millones de link farms, páginas XXX, casinos online, milagros médicos y milagros financieros que pueblan sus top 10 en muchos criterios de búsqueda, a Google y a nosotros, nos iría mucho mejor.
    --

    Sergio Hernando [sahw.com] - In security we trust

  • por pussylover (8089) el Viernes, 08 Julio de 2005, 00:35h (#547330)
    ( http://www.alexmilla.net/ )
    Me parece perfecto que Google empiece a vigilar este tipo de cosas, es decir, no creo que vaya por el tema de páginas personales, sino por el de muchas WEB's que misteriosamente redirigen a una misma.

    Nunca te has puesto a buscar en Internet una aplicación a través de Google y aparecen chorrocientas mil que lo que hacen es hacerte pagar por ella? O con un dialer o similares?

    Yo creo que va más destinado a ese tipo de web's.
  • por lex sparrow (17876) el Viernes, 08 Julio de 2005, 08:31h (#547431)
    ( http://www.pclandia.net/lexsparrow/ | Última bitácora: Lunes, 25 Enero de 2010, 07:48h )
    Yo ya empiezo a estar un poco harto de que buscas cualquier cosa un poco general (o de moda) y en seguida te aparecen 4000 paginas iguales que no tiene nada que ver (mildescargas.com, todogratis.com, juegosgratis.com, internetytodo.com, movilestonos.com, ...) y que si entras, no es que sean parecidas, es que son clavadas (y como resulta fácil de predecir, salen en los primeros puestos) con lo que el Google PageRank en estos casos es inútil.

    Los de Google suelen pensarlo todo bastante, así que me imagino que van a por este tipo de páginas, y no a por los mirrors de páginas legítimas. Una cosa que caracteriza mucho a las paginas estas chorras es que es entrar, y encontrarte con un espectáculo de luz y sonido, y todos los enlaces apuntando a un tal dialer-gratis.exe.

    Por otro lado, la penalización no quiere decir que le saquen del índice, sino que baja puestos. A mi me parece bien esta técnica, porque de esta manera, las paginas "chungas" no saldrán las primeras, ysi se cuela algun "mirror" legítimo, siempre puedes llegar a dicho mirror desde la página principal, por lo que no representa un problema.

    El problema que indican es que Google no tiene aún muy claro cual es el site original y cual el mirror ... espero que lo solucionen pronto.
    --
    ¿Quieres volver a la era de los 8 bit [pressplaythenanykey.com]
  • Repetid conmigo:

    (Puntos:2)
    por pajaro (14380) el Viernes, 08 Julio de 2005, 09:00h (#547449)
    - Google es una empresa privada.
    - Google tiene criterios propios.
    - Google no es internet.
    - Google no es la verdad absoluta.
  • por VBiR (7677) el Viernes, 08 Julio de 2005, 10:57h (#547557)
    ( http://barrapunto.com/ )
    A ver, la gente que está escribiendo en esta notícia... De verdad no sabíais que google hace eso desde siempre (que yo recurede)?

    No os habéis encontrado nunca con la frase: In order to show you the most relevant results, we have omitted some entries very similar to the X already displayed. If you like, you can repeat the search with the omitted results included. ?

    Pues supongo que debéis usar bien poco google, por que yo me la encuentro a menudo.

    Como muestra un botón [google.com].

    El problema que exponen és que si por casualidad google indexa primero una copia en lugar del original, pues es la copia la que aparece quando no se muestran los resultados iguales.

    --

    VBiR
    Reginaldo, vuelve! Necesitamos un troll de categoría!

  • Re:Me alegro mucho

    (Puntos:2, Interesante)
    por pobrecito hablador el Jueves, 07 Julio de 2005, 18:06h (#547075)
    En internet hay que tener cuidado al hablar de redundancia, no siempre lo es, en muchas ocasiones es réplica, y lo que dice el colega es cierto, si Google va a empezar a penalizar la replicación, podemos cagarla.
    [ Padre ]
  • Re:Digo yo...

    (Puntos:2)
    por sorrill (13858) el Jueves, 07 Julio de 2005, 18:25h (#547098)
    ( http://barrapunto.com/ )
    De la misma forma que un profesor sabe que has copiado, cambiando la portada del trabajo no es suficiente :-)

    El contenido es lo que cuenta y si el contenido es casi identico (98%, por ejemplo) es que has copiado.

    Los menus y resto de chorradas no afectan de forma sustancial a las busquedas de google.

    Saludos.
    [ Padre ]
    • Re:Digo yo... de Defero (Puntos:1) Viernes, 08 Julio de 2005, 07:42h
      • mmmm... de psykal (Puntos:2) Viernes, 08 Julio de 2005, 09:32h
        • Re:mmmm... de Defero (Puntos:1) Viernes, 08 Julio de 2005, 09:44h
          • Re:mmmm... de guggy (Puntos:1) Sábado, 09 Julio de 2005, 21:49h
      • Re:Digo yo... de mr_mejor (Puntos:2) Viernes, 08 Julio de 2005, 18:53h
  • Re:Me alegro mucho

    (Puntos:3, Inspirado)
    por KraMMeR (9571) <reversethis-{moc.liamg} {ta} {otnuple}> el Jueves, 07 Julio de 2005, 20:33h (#547212)
    Yo puedo proponer que en mi web se discuta el contenido de otra, pero usar enlaces, iframes o referencias por rss de otras páginas relentiza mucho el servidor, y tienes que estar pendiente de las caidas de todos los servidores a los que referencias... por ejemplo, si estas usando información de un servidor en Filipinas encima te llevas un lagazo de regalo.
    La redundacia de datos en parte es una forma de hacer "mirrors" para los mismos, e incluso, una forma de tener vías alternativas para difundir la informacion en otros ámbitos... por ejemplo, habrá gente que no lea barrapunto porque la pagina es fea (yo prefiero llamarlo, un diseño pa los que van a lo que van). Yo ofrezco una página con diseño para gente con otros gustos, gente mas joven, gente mas vieja, gente de otro país, etc... y estoy ofreciendo contenidos de barrapunto (respetando las licencias, citas y demás) y otro público esta opinando sobre el. Y eso es parte del encanto de la libre información que representa Internet, y probablemente los autores de la noticia asi lo prefieran.
    Cada vez que veo noticias sobre Google me dan escalofrios, esta gente tiene un poder sobre internet del que no estoy seguro que sean lo suficientemente responsables y conscientes. Cada año, al igual que las visitas, la cantidad de gente que considera que internet es www.google.com aumenta exponencialmente, y da un poco de pena que ellos sean los que deciden los estándares que tengo que seguir yo para hacer mi sitio web, porque empieza a ser mas importante la posicion en google que otra cosa.
    [ Padre ]
  • Re:Digo yo...

    (Puntos:1)
    por Liveral (17846) el Jueves, 07 Julio de 2005, 20:48h (#547220)
    ( http://barrapunto.com/ | Última bitácora: Martes, 02 Junio de 2009, 23:28h )
    Algoritmo de la subsecuencia común más larga (Longest Common Subsequence , si se escribe así) El terror de Ana Rosa.
    [ Padre ]
  • Re:quoteando

    (Puntos:1)
    por Walenzack (13964) el Jueves, 07 Julio de 2005, 21:21h (#547232)
    ( http://www.xing.com/profile/LuisGonzalo_SotoAboal | Última bitácora: Viernes, 02 Octubre de 2009, 20:51h )
    Lol... copias un trozo de la propia noticia (ni siquiera del artículo original), lo pones de comentario... tachán, +1 Interesante. ¿Algún tipo de experimento sociológico, Tei?

    PD: Sí, he pillado la gracia de "copiar el original" xD

    --
    Tal vez quieras visitar mi perfil en XING [xing.com].
    [ Padre ]
    • Re:quoteando de Tei (Puntos:2) Jueves, 07 Julio de 2005, 22:40h
    • 1 respuesta por debajo de tu umbral de lectura actual.
  • Re:Me alegro mucho

    (Puntos:2)
    por Joseba (1322) el Jueves, 07 Julio de 2005, 23:00h (#547294)
    ( http://blog.sindominio.net/blog/hiro_protagonist )
    Pero no te olvides que internet no es una base de datos, así que la redundancia en lugar de ser un defecto puede ser, y bajo mi punto de vista lo es, una ventaja. De hecho, que la información esté replicada es precisamente lo que garantiza más y mejor acceso a ella, cuando dependes de tantos cacharros, individuos, empresas y gobiernos. Y más aún si además de replicarla se completa.

    Aaaaaaaaaaagur.
    --
    "mi libertad empieza donde EMPIEZA la de l@s demás"
    [ Padre ]
  • 7 respuestas por debajo de tu umbral de lectura actual.