Una base de datos XML constituye un sistema software que da persistencia a datos almacenados en formato XML. Estos datos pueden ser interrogados, exportados y serializados. Las bases de datos XML están generalmente asociadas con las bases de datos documentales.
Existen dos grandes clases de bases de datos XML:[1]
Típicamente ofrecen alguna de las siguientes aproximaciones para almacenar XML en la estructura relacional clásica:
Entre los SGBD que soportan ISO XML están:
Típicamente una base de datos habilitada XML se adapta mejor allí donde la mayoría de los datos no están en XML, para aquellos datos en los que la mayoría están en XML, una base de datos nativa XML se adaptará mejor.
select
id, vol, xmlquery('$j/name', passing revista "j") as name
from
revistas
where
xmlexists('$j[publica="Elsevier"]', passing revista "j")
El término "base de datos nativa XML" (NXD) puede llevar a confusión. Muchas NXDs no funcionan como bases de datos independientes, y no almacenan el texto nativo en XML.
La definición formal de la iniciativa XML:DB (que parece inactiva desde 2003[9]) afirma que:
Además, muchas bases de datos XML databases proporcionan un modelo lógico de agrupar documentos, llamada "colecciones". Las bases de datos pueden establecer y gestionar muchas colecciones al mismo tiempo. En algunas implementaciones puede existir una jerarquía de colecciones, de modo análogo a la estructura de directorios de un sistema operativo.
Todas las bases de datos XML soportan al menos una sintaxis de interrogación. Al menos casi todas soportan XPath para realizar preguntas a documentos o colección de ellos. XPath provides a simple pathing system that allows users to identify nodes that match a particular set of criteria.
Además de XPath, muchas bases de datos XML soportan XSLT como método para transformar documentos o resultados obtenidos de la base de datos. XSLT proporciona un lenguaje declarativo escrito con gramática XML. Con él define una serie de filtros XPath que pueden transformar documentos XML en otros con otro formato, como texto plano, XML o HTML.
Las bases de datos XML suelen interrogar mediante XQuery. XQuery incluye XPath como método de selección de nodos, pero de modo extendido que da capacidad de transformación. A veces los usuarios se refieren a su sintacis como FLWOR al poderse incluir en la pregunta las siguientes claúsulas: 'for', 'let', 'where', 'order by' y 'return'. Los fabricantes de SGBD relacionales -que tradicionalmente sólo proporcionan mecanismos SQL- ahora incluyen mecanismos híbridos SQL-XQuery. Esto permite interrogar los datos XML de manera análoga a los relacionales, en la misma sentencia. Esto permite combinar datos XML y relacionales.
La mayoría de bases de datos XML soportan un API neutral común llamado XQJ API. Este fue desarrollado por JCP como interfaz estándar de una fuente de datos XML/XQuery, permitiendo a los desarrolladores java realizar preguntas de acuerdo a la especificación W3C XQuery 1.0. En definitiva el XQJ API representa a las bases de datos XML lo mismo que representa el API JDBC a las bases de datos relacionales y SQL.
Denominación | Licencia | Lenguaje | XQuery 3.0 | XQuery Update | XQuery Full Text | Extensiones EXPath | Extensions EXQuery | XSLT 2.0 |
---|---|---|---|---|---|---|---|---|
BaseX | Licencia BSD | Java | Sí | Sí | Sí | Sí | Sí | Sí |
eXist | Licencia LGPL | Java | Parcial | Propietario | Propietario | Sí | Sí | Sí |
MarkLogic Server | Comercial | C++ | Parcial | Propietario | Propietario | No | No | Sí |
Sedna | Licencia Apache | C++ | No | Sí | Sí | No | No | No |
plataforma 28msec | Motor: Licencia Apache, Almacenamiento: Comercial | C++ | Parcial[10] | Sí | Sí | Sí | Sí | No |
MonetDB/XQuery | Licencia MonetDB (tipo Mozilla) | C | ? | ? | ? | ? | ? | ? |