Apache ORC (Optimized Row Columnar) es un formato de almacenamiento de datos orientado a columnas, gratuito y de código abierto del ecosistema Apache Hadoop. Es similar a los otros formatos de archivo de almacenamiento en columnas disponibles en el ecosistema de Hadoop, como RCFile y Parquet. Es compatible con la mayoría de los marcos de procesamiento de datos en el entorno Hadoop.
Apache ORC | ||
---|---|---|
Información general | ||
Tipo de programa | Sistema de archivos distribuido | |
Desarrollador | Apache Software Foundation | |
Lanzamiento inicial | 12 de mayo de 2015 | |
Licencia | Apache License 2.0 | |
Estado actual | Activo | |
Idiomas | inglés | |
Información técnica | ||
Plataformas admitidas | Java | |
Versiones | ||
Última versión estable | 2.0.314 de noviembre de 2024 | |
Enlaces | ||
Sitio web oficial
Repositorio de código
Seguimiento de errores
| ||
En febrero de 2013, el formato de archivo Optimized Row Columnar (ORC) fue anunciado por Hortonworks en colaboración con Facebook.[3] Un mes después, se anunció el formato Apache Parquet, desarrollado por Cloudera y Twitter.[4]