10000 hilos concurrentes a 100 GB/s entre hilo, da 1000 TB/s -yo no me lo creo-, no está mal, chaval, que diría Charly Glamour:-)
Respecto a los saltos en el Cell, penalizan más o menos como cualquier CPU que no ejecute fuera de orden, se soluciona a base de "loop unrolling" y buena voluntad;-)
El Cell, por mi experiencia, está a años luz en flexibilidad de cualquier GPU actual (cálculo, número de registros por unidad vectorial, memoria local, comunicación entre unidades vectoriales, transferencias por DMA en segundo plano, etc.). Eso sí, me encantaría que las GPUs fuesen más flexibles, palabra.
¿Qué CPU no ejecuta fuera de orden? Y no penaliza lo mismo que una CPU en orden (que no penaliza nada, pero el rendimiento es un pedo), su predictor de saltos es una porquería y la penalización es muy exagerada. Y el loop unrolling, en general, podrá paliarlo, no arreglarlo. Y desde luego poco o nada que hacer con condicionales. Por ejemplo, un bucle for de 10 millones de iteraciones con un if dentro, la mitad del código en el if y la otra mitad en el else. Te cagas.
Por un módico precio te optimizo los bucles que quieras para Cell, con penalización por debajo del 20% (tarifa "brikindans"), debajo del 10% (tarifa "crusaíto"), debajo del 5% (tarifa "maiquelyason"), o debajo del 2% (tarifa "robocop").
Y no obstante, mi experiencia (y la de todos los que yo conozco) es que se consigue mucho más rendimiento con una GPU que con un Cell.
Sin duda, porque son más potentes a nivel de cálculo, y si tu problema lo permite, miel sobre hojuelas (por eso la PS3 tiene también una GPU y no sólo el Cell).
Re:Se va acercando, pero todavía, no.
(Puntos:2)( http://www.voluntariado.net/ | Última bitácora: Domingo, 10 Junio de 2012, 21:48h )
Respecto a los saltos en el Cell, penalizan más o menos como cualquier CPU que no ejecute fuera de orden, se soluciona a base de "loop unrolling" y buena voluntad
El Cell, por mi experiencia, está a años luz en flexibilidad de cualquier GPU actual (cálculo, número de registros por unidad vectorial, memoria local, comunicación entre unidades vectoriales, transferencias por DMA en segundo plano, etc.). Eso sí, me encantaría que las GPUs fuesen más flexibles, palabra.
Re:Se va acercando, pero todavía, no.
(Puntos:2)( http://www.voluntariado.net/ | Última bitácora: Domingo, 10 Junio de 2012, 21:48h )
Por un módico precio te optimizo los bucles que quieras para Cell, con penalización por debajo del 20% (tarifa "brikindans"), debajo del 10% (tarifa "crusaíto"), debajo del 5% (tarifa "maiquelyason"), o debajo del 2% (tarifa "robocop").
Sin duda, porque son más potentes a nivel de cálculo, y si tu problema lo permite, miel sobre hojuelas (por eso la PS3 tiene también una GPU y no sólo el Cell).