Apache Kudu es un almacén de datos orientado a columnas, gratuito y de código abierto, del ecosistema Apache Hadoop. Es compatible con la mayoría de los marcos de procesamiento de datos en el entorno Hadoop. Proporciona completitud a la capa de almacenamiento de Hadoop para permitir análisis rápidos de datos rápidos.[1]
Apache Kudu | ||
---|---|---|
![]() | ||
Información general | ||
Tipo de programa | software libre | |
Desarrollador | Apache Software Foundation | |
Lanzamiento inicial | 15 de agosto de 2018 | |
Licencia | licencia Apache | |
Información técnica | ||
Programado en | C++ | |
Versiones | ||
Última versión estable | 1.17.16 de diciembre de 2024 | |
Enlaces | ||
Sitio web oficial
Repositorio de código
Seguimiento de errores
| ||
El proyecto de código abierto para construir Apache Kudu comenzó como un proyecto interno en Cloudera.[2] La primera versión Apache Kudu 1.0 se lanzó el 19 de septiembre de 2016.[3]
Kudu fue diseñado y optimizado para cargas de trabajo OLAP. Al igual que HBase, es un almacén en tiempo real que admite la búsqueda y mutación de registros indexados por clave.[4] Kudu se diferencia de HBase porque el modelo de datos de Kudu es un modelo relacional más tradicional, mientras que HBase no tiene esquema. La representación en disco de Kudu es verdaderamente columnar y sigue un diseño de almacenamiento completamente diferente al de HBase/ Bigtable.[4]