> En soluciones cluster, cada ordenador no es una unidad fisica independiente, puesto que cada miembro del cluster esta conectado a una unidad de
almacenamiento de datos comun a todos ellos. Ademas de eso, tienen algun sistema de comunicacion interna, como por ejemplo, se pueden conectar entre ellos por una red ethernet. Cada miembro del cluster tiene una IP para la comunicacion interna, pero el cluster en si mismo solo tiene una IP externa por la que es accesible.
En realidad, como norma general, sólo se puede acceder a uno de los nodos del cluster, que tiene una dirección IP externa. El resto tienen direcciones IP internas y muy poca seguridad entre ellos. Es el bastión exterior el que debe velar por la seguridad del acceso o todo se irá al garete. No veo muy clara la diferencia con respecto al punto anterior, que también suele depender de un servidor de base de datos, pero da igual, creo que se trata más de una diferencia formal que real.
> En un sistema cluster esto no pasa.
No estoy de acuerdo. Dada la forma habitual en la que se implementan los clusters de cálculo, todos los nodos dependen de un nodo maestro que es el que reparte las responsabilidades de cálculo. Si éste casca, casca todo el cluster. Si el cluster está bien hecho, si falla un nodo normal se debe poder repartir su trabajo entre el resto de nodos sin demasiados problemas. Igualmente, si falla el nodo que sirve de almacen de datos, lo más probable es que falle todo el sistema.
> Generalmente, los cluster se usan para sistemas de alta disponibilidad
Tampoco estoy de acuerdo. Tradicionalmente los clusters se han usado en soluciones de alto rendimiento, no de alta disponibilidad. La diferencia es clara, en los primeros pretendemos que siempre quede al menos 1 equipo que nos responda, en los segundos pretendemos obtener la máxima potencia de CPU posible. El ejemplo clásico de los clusters es el Beowulf que es una solución de alto rendimiento. Además, si te fijas bien, casi todos los clusters están en centros de investigación científica y no en bancos o compañías de seguros.
> Por otro lado, siempre he leido sobre sistemas cluster de 2, 4 y 8 nodos
????????. Esos son muy pocos nodos. Un cluster normalito en investigación científica tendría un mínimo de 16 nodos y suelen llegar fácilmente a 32 e incluso 64. Lo cierto es que a partir de 64 nodos la cosa se complica un poco, tal y como comentaba en mi anterior post por los problemas que tiene TCP/IP sobre Ethernet. En esos casos se utilizan tecnologías especiales (Myranet) o topologías muy complejas. De todas formas, hay clusters dedicados a cálculo científico de más de 512 nodos y no estoy hablando de clusters de alta disponibilidad que siempre es más sencillo escalar. La compañía Celera (Genoma Humano) tenía un cluster inmenso pero no es público. Cada grupo tenía de 64 a 128 nodos y tenían bastantes de éstos, aunque no todos trabajaban de forma coordinada.
Hace ya algún tiempo unos amigotes reunimos nuestros ordenadores para hacer un cluster para POVRay. Usamos un mísero HUB Ethernet 10 de 8 bocas y claro el rendimiento fue pésimo pero la experiencia muy divertida. Entre los nodos había desde un Athlon 700 con 256 MB RAM a un mísero 486 66 con 24 MB de RAM. Montar un cluster para POVRay es casi trivial, sobre todo si no te dedicas a optimizar cada nodo, usar nodos sin disco duro y cosas de esas. Se, por ejemplo, que en la ESI de Sevilla un proyecto de fin de carrera de un alumno de Industriales ha consistido en montar un cluster de 16 nodos duales para uno de los departamentos.
En cuanto a si Windows tiene soporte para clusters, SIIII. No se los detalles exactos porque no lo uso, pero tanto NT como 2000 seguro que lo tienen. Lo que ocurre es que realmente Linux se ha impuesto a Windows en este tema (al menos para clusters serios de más de 16 nodos). Una razón, y sólo digo una, sería el precio. Ambos windows requieren de versiones especiales de su software y seguro que no son nada baratas. Cualquier Linux, con los paquetes y librerias adecuados te sirve. Lógicamente no es un instalar y listo, pero en general, nada en un cluster lo es :)
Para los interesados en el tema de los clusters y la supercomputación hay muchas referencias, pero un buen punto de partida sería Clusters Top 500 en el que podreis encontrar una lista no oficial de los clusters más potentes del mundo. Sólo por curiosidad, de los 50 más potentes que aparecen listados, 42 corren en Linux, 2 en TRUE 64, 1 Windows NT, 1 Solaris y 4 no indican que SO corren, así que saca tus propias conclusiones :)
-- Jaime Nebrera Herrera * jnebrera@jazzfree.com *
Nunca digas no se hacerlo mejor di: nunca lo he intentado
Re:Pues..
(Puntos:1)( http://junior.us.es/jnebrera/index.html )
En realidad, como norma general, sólo se puede acceder a uno de los nodos del cluster, que tiene una dirección IP externa. El resto tienen direcciones IP internas y muy poca seguridad entre ellos. Es el bastión exterior el que debe velar por la seguridad del acceso o todo se irá al garete. No veo muy clara la diferencia con respecto al punto anterior, que también suele depender de un servidor de base de datos, pero da igual, creo que se trata más de una diferencia formal que real.
> En un sistema cluster esto no pasa.No estoy de acuerdo. Dada la forma habitual en la que se implementan los clusters de cálculo, todos los nodos dependen de un nodo maestro que es el que reparte las responsabilidades de cálculo. Si éste casca, casca todo el cluster. Si el cluster está bien hecho, si falla un nodo normal se debe poder repartir su trabajo entre el resto de nodos sin demasiados problemas. Igualmente, si falla el nodo que sirve de almacen de datos, lo más probable es que falle todo el sistema.
> Generalmente, los cluster se usan para sistemas de alta disponibilidadTampoco estoy de acuerdo. Tradicionalmente los clusters se han usado en soluciones de alto rendimiento, no de alta disponibilidad. La diferencia es clara, en los primeros pretendemos que siempre quede al menos 1 equipo que nos responda, en los segundos pretendemos obtener la máxima potencia de CPU posible. El ejemplo clásico de los clusters es el Beowulf que es una solución de alto rendimiento. Además, si te fijas bien, casi todos los clusters están en centros de investigación científica y no en bancos o compañías de seguros.
> Por otro lado, siempre he leido sobre sistemas cluster de 2, 4 y 8 nodos????????. Esos son muy pocos nodos. Un cluster normalito en investigación científica tendría un mínimo de 16 nodos y suelen llegar fácilmente a 32 e incluso 64. Lo cierto es que a partir de 64 nodos la cosa se complica un poco, tal y como comentaba en mi anterior post por los problemas que tiene TCP/IP sobre Ethernet. En esos casos se utilizan tecnologías especiales (Myranet) o topologías muy complejas. De todas formas, hay clusters dedicados a cálculo científico de más de 512 nodos y no estoy hablando de clusters de alta disponibilidad que siempre es más sencillo escalar. La compañía Celera (Genoma Humano) tenía un cluster inmenso pero no es público. Cada grupo tenía de 64 a 128 nodos y tenían bastantes de éstos, aunque no todos trabajaban de forma coordinada.
Hace ya algún tiempo unos amigotes reunimos nuestros ordenadores para hacer un cluster para POVRay. Usamos un mísero HUB Ethernet 10 de 8 bocas y claro el rendimiento fue pésimo pero la experiencia muy divertida. Entre los nodos había desde un Athlon 700 con 256 MB RAM a un mísero 486 66 con 24 MB de RAM. Montar un cluster para POVRay es casi trivial, sobre todo si no te dedicas a optimizar cada nodo, usar nodos sin disco duro y cosas de esas. Se, por ejemplo, que en la ESI de Sevilla un proyecto de fin de carrera de un alumno de Industriales ha consistido en montar un cluster de 16 nodos duales para uno de los departamentos.
En cuanto a si Windows tiene soporte para clusters, SIIII. No se los detalles exactos porque no lo uso, pero tanto NT como 2000 seguro que lo tienen. Lo que ocurre es que realmente Linux se ha impuesto a Windows en este tema (al menos para clusters serios de más de 16 nodos). Una razón, y sólo digo una, sería el precio. Ambos windows requieren de versiones especiales de su software y seguro que no son nada baratas. Cualquier Linux, con los paquetes y librerias adecuados te sirve. Lógicamente no es un instalar y listo, pero en general, nada en un cluster lo es :)
Para los interesados en el tema de los clusters y la supercomputación hay muchas referencias, pero un buen punto de partida sería Clusters Top 500 en el que podreis encontrar una lista no oficial de los clusters más potentes del mundo. Sólo por curiosidad, de los 50 más potentes que aparecen listados, 42 corren en Linux, 2 en TRUE 64, 1 Windows NT, 1 Solaris y 4 no indican que SO corren, así que saca tus propias conclusiones :)
Jaime Nebrera Herrera * jnebrera@jazzfree.com *
Nunca digas no se hacerlo mejor di: nunca lo he intentado