Login Barrapunto
Google desarrolla un buscador de imágenes basado en el contenido
GSI-UEM nos cuenta: «El pasado jueves, en la World Wide Web Conference en Beijing, dos científicos de Google presentaron un artículo que describía lo que llamaron VisualRank, un algoritmo que reúne técnicas de reconocimiento de imágenes con técnicas para la ponderación y 'rankeado' de imágenes en función del parecido entre ellas.»
« Disponible OpenSolaris 2008.05 | Concurso millonario de licencias de Microsoft en la Comunidad de Madrid »
Este hilo ha sido archivado.
No pueden publicarse nuevos comentarios.
Google desarrolla un buscador de imágenes basado en el contenido
|
Log in/Crear cuenta
| Top
| 19 comentarios
| Buscar hilo
Y recuerda: Los comentarios que siguen pertenecen a las personas que los han enviado. No somos responsables de los mismos.

El uso más lógico será...
(Puntos:1, Informativo)Y para eso...
(Puntos:2, Interesante)( http://www.ssbbmaps.com/ )
De reconocimiento de imágenes nanai
(Puntos:5, Interesante)( Última bitácora: Lunes, 11 Agosto de 2008, 22:21h )
De reconocimiento de imágenes nanai de la China (je, qué bien traído).
En todo caso reconocimiento de patrones. Lo que hace el algoritmo es agrupar (clustering) imágenes basándose en el histograma, detección de bordes, topología, etc. A partir de esos datos construye grafos gigantescos de imágenes similares y -ahora sí llega lo "innovador"- asigna valores a los nodos en función de su relevancia. A esta función de afinidad (fitness) le han llamado ImageRank -marca obliga- y se recalcula en función de la relevancia de vértices adyacentes de forma similar a como se hace con el PageRank.
Lo "gordo" es, ¿cómo pasar del dominio de las palabras en una búsqueda al algoritmo? Pues usando metadatos (metadata, tags) que relacionan una imagen con una serie de palabras.
Primero filtran las candidatas usando la búsqueda de imágenes tradicional: según el anchor text, palabras cercanas a la etiqueta img en el documento html, etc.
Después, y aquí es donde yo esperaba la verdadera innovación -snif-, lo que usan son las etiquetas que los usuarios anónimos y voluntarios han asignado mediante aquél conocido jueguecillo y que les ha ahorrado entrenar la IA.
NOTA: Los palabros en inglés no son pura pedantería, es por si algún interesado quiere buscar -en Google, cómo no- información acerca de estas técnicas que, por otro lado, llevan años usándose.
¿Noticia? Pues no sé hasta qué punto. Creo que si los que han presentado el paper no fueran de Google no habría pasado de práctica de universidad, la verdad. La diferencia fundamental es la cantidad de trabajo que les han ahorrado los usuarios voluntarios y la enorme base de datos de imágenes que ya tienen indexadas. Lo del algoritmo ImageRank no pasa de ser una lógica evolución del PageRank. Nada nuevo bajo el sol.
Re:Beijing?
(Puntos:3, Interesante)Pero además, enlazando con el primer comentario de la notícia, hay que tener en cuenta que si tienes la capacidad de buscar por contenido de las imagenes (pr0n), google también tiene la capacidad de eliminar los resultados con contenido="pr0n", y esta vez a con una fiabilidad mucho mayor que buscando cadenas de texto
Re:Esa ortografía
(Puntos:1, Redundante)( http://barrapunto.com/~payo_ranger | Última bitácora: Miércoles, 02 Marzo de 2005, 20:58h )