Historias
Slashboxes
Comentarios

Google desarrolla un buscador de imágenes basado en el contenido

editada por Yonderboy el 06 de Mayo 2008, 09:44h   Printer-friendly   Email story
desde el dept. reconocimiento-de-imágenes
GSI-UEM nos cuenta: «El pasado jueves, en la World Wide Web Conference en Beijing, dos científicos de Google presentaron un artículo que describía lo que llamaron VisualRank, un algoritmo que reúne técnicas de reconocimiento de imágenes con técnicas para la ponderación y 'rankeado' de imágenes en función del parecido entre ellas.»

Este hilo ha sido archivado. No pueden publicarse nuevos comentarios.
Mostrar opciones Umbral:
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.
  • El uso más lógico será...

    (Puntos:1, Informativo)
    por pobrecito hablador el Martes, 06 Mayo de 2008, 10:12h (#1040603)
    Se me ocurre que será usado mayormente para buscar... porno, of course. :P
  • Y para eso...

    (Puntos:2, Interesante)
    por yampeku (5409) el Martes, 06 Mayo de 2008, 10:58h (#1040626)
    ( http://www.ssbbmaps.com/ )
    Google necesitaba un gran corpus de imágenes debidamente anotadas, que es lo que consiguieron gracias a este jueguecillo [google.com] No saben ni nada
  • De reconocimiento de imágenes nanai

    (Puntos:5, Interesante)
    por redofromstart (35297) el Martes, 06 Mayo de 2008, 13:33h (#1040699)
    ( Última bitácora: Lunes, 11 Agosto de 2008, 22:21h )

    De reconocimiento de imágenes nanai de la China (je, qué bien traído).

    En todo caso reconocimiento de patrones. Lo que hace el algoritmo es agrupar (clustering) imágenes basándose en el histograma, detección de bordes, topología, etc. A partir de esos datos construye grafos gigantescos de imágenes similares y -ahora sí llega lo "innovador"- asigna valores a los nodos en función de su relevancia. A esta función de afinidad (fitness) le han llamado ImageRank -marca obliga- y se recalcula en función de la relevancia de vértices adyacentes de forma similar a como se hace con el PageRank.

    Lo "gordo" es, ¿cómo pasar del dominio de las palabras en una búsqueda al algoritmo? Pues usando metadatos (metadata, tags) que relacionan una imagen con una serie de palabras.

    Primero filtran las candidatas usando la búsqueda de imágenes tradicional: según el anchor text, palabras cercanas a la etiqueta img en el documento html, etc.

    Después, y aquí es donde yo esperaba la verdadera innovación -snif-, lo que usan son las etiquetas que los usuarios anónimos y voluntarios han asignado mediante aquél conocido jueguecillo y que les ha ahorrado entrenar la IA.

    NOTA: Los palabros en inglés no son pura pedantería, es por si algún interesado quiere buscar -en Google, cómo no- información acerca de estas técnicas que, por otro lado, llevan años usándose.

    ¿Noticia? Pues no sé hasta qué punto. Creo que si los que han presentado el paper no fueran de Google no habría pasado de práctica de universidad, la verdad. La diferencia fundamental es la cantidad de trabajo que les han ahorrado los usuarios voluntarios y la enorme base de datos de imágenes que ya tienen indexadas. Lo del algoritmo ImageRank no pasa de ser una lógica evolución del PageRank. Nada nuevo bajo el sol.

  • Re:Beijing?

    (Puntos:3, Interesante)
    por yero (19441) el Martes, 06 Mayo de 2008, 10:57h (#1040625)
    Google tiene un laboratorio de R&D en Beijing, igual que Microsoft.
    Pero además, enlazando con el primer comentario de la notícia, hay que tener en cuenta que si tienes la capacidad de buscar por contenido de las imagenes (pr0n), google también tiene la capacidad de eliminar los resultados con contenido="pr0n", y esta vez a con una fiabilidad mucho mayor que buscando cadenas de texto :) Aplíquese esto a la censura china si se prefiere.
    [ Padre ]
    • Re:Beijing? de euyyn (Puntos:1) Martes, 06 Mayo de 2008, 13:36h
    • 1 respuesta por debajo de tu umbral de lectura actual.
  • Re:Esa ortografía

    (Puntos:1, Redundante)
    por payo_ranger (4885) el Martes, 06 Mayo de 2008, 11:29h (#1040637)
    ( http://barrapunto.com/~payo_ranger | Última bitácora: Miércoles, 02 Marzo de 2005, 20:58h )
    próxmio?
    [ Padre ]
  • 3 respuestas por debajo de tu umbral de lectura actual.