SAP HANA (II): Hadoop, una gran alianza


En nuestro primer post sobre SAP HANA analizamos cómo su uso puede llegar a beneficiar al sector financiero en departamentos como ventas, marketing, gestión de riesgos o contabilidad financiera.  Pero, más allá de las posibilidades de SAP HANA, también hay que tener en cuenta su evolución hasta la actualidad, sus puntos fuertes y sus debilidades en estos momentos.

Xavier_Portell
Xavier Portell, Manager – GFT

En los últimos meses, SAP HANA ha experimentado una gran evolución en las herramientas de desarrollo. Su uso es ahora más sencillo. Hoy en día nos encontramos ante una plataforma central que permanece robusta y estable, mientras que la plataforma de desarrollo ha mejorado significativamente. La funcionalid de base se puede desarrollar en plazos más cortos, cosa que permite desarrollos más eficientes. De todas formas, aún hay que tener en cuenta que la corrección de errores y el ajuste fino de la aplicación siguen resultando tareas complejas que conviene planificar.

¿Pueden los líderes del mercado en Big Data y en tecnologías in-memory cooperar en una solución de alto rendimiento? Desde GFT estamos convencidos de ello. Gracias a nuestra experiencia, apostamos por aprovechar las fortalezas de SAP HANA y combinarlas con las de Hadoop con el objetivo de construir una solución integral para grandes volúmenes de datos.

Combinando SAP HANA  y Hadoop

SAP HANA es especialmente eficiente para la toma de decisiones en tiempo real y systemas de soporte a la toma de decisiones.  También es bueno para el manejo de grandes cantidades de datos aunque, todavía no está al mismo nivel que Hadoop.

Por su parte, Hadoop permite almacenar arbitrariamente grandes cantidades de datos de una manera eficiente. Uno de sus principales puntos fuertes es que nos permite encontrar una aguja en un (inestructurado e inmenso) pajar. En definitiva, realiza una veradera y compleja minería de datos, trabajando siempre en modo de ejecución por lotes (batch).

La siguiente tabla permite comparar HANA y Hadoop según cuatro criterios:

1. Escala temporal e Interfaces:

  • SAP HANA se encuentra en su hábitat natural en entornos a tiempo real, aunque es capaz de funcionar también en modo batch. Permite el acceso a los datos almacenados a través tanto de interfaces estándar como de desarrollos a medida.
  • Hadoop trabaja únicamente en batch y requiere un esfuerzo adicional para exponer los datos que almacena a otros componentes de la infraestructura de IT, normalmente a través de interfaces específicos a medida

2. Volumen de datos y estructuración de los mismos:

  • Hadoop permite la utilización de inmensos volúmenes de datos. Resulta especialmente eficiente en el tratamiento de datos no estructurados o con baja estructuración.
  • SAP HANA permite la utilización de grandes volúmenes de datos y resulta especialmente eficiente para datos más estructurados.

3. Coste total:

  • SAP HANA es una solución comercial que requiere la compra de una licencia. Presenta un alto coste de adopción inicial.
  • Hadoop es un software Open Source no comercial. Como todos los productos Open Source, su adopción inicial tiene un coste muy bajo, pero para proveer una infraestructura de producción es necesario realizar inversiones adicionales para asegurar la calidad de servicio necesaria.

4. Despliegue:

  • SAP HANA requiere un aparato (appliance) específico y permite de forma limitada la utilización de clusters en paralelo, normalmente en ubicación local
  • Hadoop permite un altísimo grado de paralelismo funcionando en clusters, que pueden ser remotos en nube

 

SAP_HANNA_HADOOP_1

Después de probar ambas tecnologías en un desarrollo experimental, GFT apuesta por la combinación de SAP HANA y HADOOP como tecnologías complementarias.  Con esta combinación, podremos afrontar el desafío que presenta el manejo de grandes volúmenes de datos, tanto a nivel de velocidad como de variedad de dimensiones. La siguiente gráfica permite comparar en términos de volumen y velocidad vs. volumen y variedad para SAP HANA, Hadoop y la combinación de ambas. Claramente dicha combinación permite cubrir todo el espectro posible, por lo que los beneficios resultan inmejorables.

SAP_HANNA_HADOOP_2

En conclusión, la combinación de ambas tecnologías permite aprovechar las fortalezas de ambas que se complementan mutuamente para crear una solución “big data” completa. Actualmente, SAP está trabajando en la integración entre SAP HANA y HADOOP .