ext4 (fourth extended filesystem o «cuarto sistema de archivos extendido») es un sistema de archivos transaccional (en inglés journaling), anunciado el 10 de octubre de 2006 por Andrew Morton, como una mejora compatible de ext3. El 25 de diciembre de 2008 se publicó el núcleo Linux 2.6.28, que elimina ya la etiqueta de "experimental" de código de ext4.
ext4 | ||
---|---|---|
Desarrollador | Mingming Cao, Dave Kleikamp, Alex Tomas, Andrew Morton, y otros | |
Nombre completo | Fourth extended file system | |
Sistemas operativos compatibles | Linux | |
Introducción | 10 de octubre de 2006 (Linux 2.6.19) | |
Identificador de la partición |
0x83 (MBR) EBD0A0A2-B9E5-4433-87C0-68B6B72699C7 (GPT) | |
Estructuras | ||
Contenido del directorio | Tabla, Árbol | |
Localización de archivo | bitmap (espacio libre en mapa de bits), tabla (metadatos) | |
Bloques malos | Tabla | |
Límites | ||
Máxima dimensión de archivo | 16 TiB (usando bloques de 4k ) | |
Máximo número de archivos | 4 mil millones (4x10⁹) (especificado en el tiempo de creación del sistema de archivos) | |
Tamaño máximo del nombre de archivo | 265 bytes | |
Tamaño máximo del volumen | 1024 PiB = 1 EiB | |
Caracteres permitidos en nombres de archivo | Todos los bytes excepto NULL y '/' | |
Características | ||
Fechas registradas | modificación (mtime), modificación de atributo (ctime), acceso (atime), borrado (dtime), creación (crtime) | |
Rango de fecha | 14 de diciembre de 1901 - 25 de abril de 2514 | |
Bifurcaciones | No | |
Atributos | extents, noextents, mballoc, nomballoc, delalloc, nodelalloc, data=journal, data=ordered, data=writeback, commit=nrsec, orlov, oldalloc, user_xattr, nouser_xattr, acl, noacl, bsddf, minixdf, bh, nobh, journal_dev | |
Permisos de acceso a archivos | POSIX | |
Compresión transparente | No | |
Cifrado transparente | Sí, desde núcleo Linux 4.1 (junio de 2015) | |
Las principales mejoras son:
El sistema de archivos ext4 es capaz de trabajar con volúmenes de gran tamaño, hasta 1 exbibyte[1] y ficheros de tamaño de hasta 16 TiB.
Los extents han sido introducidos para reemplazar al tradicional esquema de bloques usado por los sistemas de archivos ext2/3. Un extent es un conjunto de bloques físicos contiguos, mejorando el rendimiento al trabajar con ficheros de gran tamaño y reduciendo la fragmentación. Un extent simple en ext4 es capaz de mapear hasta 128 MiB de espacio contiguo con un tamaño de bloque igual a 4 KiB.[2]
Cualquier sistema ext3 existente puede ser montado como ext4 sin necesidad de cambios en el formato del disco. También es posible actualizar un sistema de archivos ext3 para conseguir las ventajas del ext4 ejecutando un par de comandos. Esto significa que se puede mejorar el rendimiento, los límites de almacenamiento y las características de sistemas de archivos ext3 sin reformatear y/o reinstalar el sistema operativo. Si se requiere de las ventajas de ext4 en un sistema de producción, se puede actualizar el sistema de archivos. El procedimiento es seguro y no existe riesgo para los datos (aunque siempre es recomendado hacer un respaldo de la información crítica). Ext4 usará la nueva estructura de datos sólo para la información nueva. La estructura antigua será conservada sin modificación y será posible leerla y/o modificarla cuando sea necesario. Esto significa que si se convierte un sistema de archivos a ext4 no se podrá regresar a ext3 de nuevo.[3]
El uso de extents está fijado por defecto desde la versión del núcleo 2.6.23. Anteriormente, esta opción requería ser activada explícitamente (por ejemplo mount /dev/sda1 /mnt/point -t ext4dev -o extents
).
El sistema de archivos ext4 permite la reserva de espacio en disco para un fichero. Hasta ahora la metodología consistía en rellenar el fichero en el disco con ceros en el momento de su creación. Esta técnica no es ya necesaria con ext4, ya que una nueva llamada del sistema "preallocate()" ha sido añadida al núcleo Linux para uso de los sistemas de archivos que permitan esta función. El espacio reservado para estos ficheros quedará garantizado y con mucha probabilidad será contiguo. Esta función tiene útiles aplicaciones en streaming y bases de datos.
Ext4 hace uso de una técnica de mejora de rendimiento llamada Allocate-on-flush, también conocida como reserva de memoria retrasada. Consiste en retrasar la reserva de bloques de memoria hasta que la información esté a punto de ser escrita en el disco, a diferencia de otros sistemas de archivos, los cuales reservan los bloques necesarios antes de ese paso. Esto mejora el rendimiento y reduce la fragmentación al mejorar las decisiones de reserva de memoria basada en el tamaño real del fichero.
En ext3 el nivel de profundidad en subdirectorios permitido estaba limitado a 32000. Este límite ha sido aumentado a 64000 en ext4, permitiendo incluso ir más allá de este límite (haciendo uso de "dir_nlink"). Para permitir un rendimiento continuo, dada la posibilidad de directorios mucho más grandes, htree está activado por defecto en ext4. Esta función está implementada desde la versión 2.6.23. htree está también disponible en ext3 cuando la función dir_index está activada.
Ext4 usa checksums en el registro para mejorar la fiabilidad, puesto que el journal es uno de los ficheros más utilizados en el disco. Esta función tiene un efecto colateral beneficioso: permite de forma segura evitar una lectura/escritura de disco durante el proceso de registro en el journal, mejorando el rendimiento ligeramente. La técnica del journal checksumming está inspirada en la investigación de la Universidad de Wisconsin en sistemas de archivos IRON (Sección 6, bajo el nombre "checksums de transacciones").[4]
Incluso haciendo uso de diversas técnicas para evitar la fragmentación, un sistema de larga duración tiende a fragmentarse con el tiempo. Ext4 dispone de una herramienta que permite desfragmentar ficheros individuales o sistemas de ficheros enteros sin desmontar el disco.[5]
En ext4, los grupos de bloques no asignados y secciones de la tabla de inodos están marcados como tales. Esto permite a e2fsck saltárselos completamente en las comprobaciones y en gran medida reduce el tiempo requerido para comprobar un sistema de archivos del tamaño para el que ext4 está preparado. Esta función está implementada desde la versión 2.6.24 del núcleo Linux.
Ext4 asigna múltiples bloques para un fichero en una sola operación, lo cual reduce la fragmentación al intentar elegir bloques contiguos en el disco. El asignador multibloque está activo cuando se usa 0_DIRECT o si la asignación retrasada está activa. Esto permite al fichero tener diversos bloques "sucios" solicitados para escritura al mismo tiempo, a diferencia del actual mecanismo del núcleo de solicitud de envío de cada bloque al sistema de archivos de manera separada para su asignación.
Puesto que los ordenadores se tornan en general cada vez más rápidos y que Linux está pasando a ser cada vez más usado en aplicaciones críticas, la granularidad de los timestamps basados en segundos se está volviendo insuficiente. Para resolver esto, ext4 tendrá timestamps medidos en nanosegundos. Ésta función está actualmente implementada en la versión 2.6.23 del núcleo. Adicionalmente se han añadido 2 bits del timestamp extendido a los bits más significativos del campo de segundos de los timestamps para retrasar casi 500 años el problema del año 2038.
Opción | Características |
---|---|
data=ordered | Todo los datos son forzados fuera del sistema de archivos principal antes de enlazarlos con los metadatos del journal |
commit=nrsec | Se le puede decir a ext3 que sincronize todos los datos y metadatos cada "nrsec" segundos. El valor por defecto son 5 segundos. Esto quiere decir que si hay una caída de energía, se perderán, como mucho 5 segundos de trabajo (el sistema de ficheros no se verá dañado gracias al journaling). Este valor por defecto (o cualquiera inferior) repercutirá en el rendimiento, pero es adecuado para proteger los datos. Mientras mayor sea el número mejor será el rendimiento del sistema. Ponerlo a 0 tendrá el mismo efecto que el valor por defecto. |
1(*)> | Activa / desactiva el uso de barreras en el código jbd. Barrier= 0 Lo desactiva, Barrier = 1 lo activa. También requiere un IO que soporte barreras, y si el jbd coge un error en la escritura en una barrera, se desactivara con una advertencia... |
orlov | Esta opción activa el nuevo sistema Orlov de asignación de bloques de disco duro. |
bsddf | Hace que el comando "df" funcione como en sistemas BSD. |
data_err=ignore | Tan sólo muestra un mensaje de error si ha ocurrido un error en el buffer de un fichero en modo "ordenado" |
nogrpid/sysvgroups | Les da a los objetos el mismo ID de grupo que a su creador. |
bh/nobh | Ext3 relaciona los buffer heads a páginas de datos y a
|
delalloc | Aplaza la escritura de bloques hasta que se esté en el tiempo de escritura. |
Opción | Características |
---|---|
ro | Permitir sólo lectura |
journal_checksum | Sumas de comprobación de los ficheros para mejorar su fiabilidad. |
journal_async_commit | Añadir asíncronamente las sumas de comprobación de los ficheros. |
journal=update | Actualiza el «journal» del sistema de ficheros de ext3 al formato actual. |
journal_dev=devnum | Cuando cambian los valores mínimos y/o máximos del journal de dispositivos externos, esta opción le permite al usuario especificar la nueva localización del «journal». El dispositivo «journal» es identificado por sus nuevos números mínimos y máximos codificados en «devnum». |
noload | No carga el «journal» al montar la unidad. |
data=journal | Todos los datos son introducidos en el «journal» antes de empezar a escribir en el sistema de ficheros principal. |
data=writeback | No se guarda el orden de los datos, los datos pueden ser escritos en el sistema de ficheros principal después de que sus metadatos hayan sido introducidos en el «journal». |
oldalloc | Esta opción deshabilita el sistema «Orlov» de asignación de bloques de disco duro. |
user_xattr | Habilita los «Atributos Extendidos de Usuario». También se debe tener habilitada la opción de atributos extendidos habilitadas en el núcleo (CONFIG_EXT3_FS_XATTR). |
nouser_xattr. | Deshabilita los «Atributos Extendidos de Usuario». |
acl | Habilita el soporte a la «Lista de Acceso de Control» POSIX. También se tendrá que tener habilitado el soporte ACL en el núcleo (CONFIG_EXT3_FS_POSIX_ACL) |
noacl | Deshabilita el soporte a la «Lista de Acceso de Control» POSIX. |
reservation | Reserva de inodos |
noreservation | No reserva de inodos |
minixdf | Hace que «df» actúe como en sistemas Minix. |
debug | La información acerca de la depuración de programas se envía al registro del sistema (syslog). |
errors=remount-ro | Cuando se encuentra un error, el ordenador monta el sistema como sólo lectura, «read-only». |
errors=continue | Cuando se encuentra un error, el ordenador continua trabajando. |
errors=panic | Cuando se encuentra un error, el ordenador pasa a estado «panic», deteniendo el sistema. |
data_err=abort | Aborta el «journal» si ocurre un error en el buffer de un fichero en modo «ordenado». |
grpid/bsdgroups | Le da a los objetos la misma ID de grupo que a su creador. |
resgid=n | El ID de grupo que deberán usar los bloques reservados. |
resuid=n | El ID del usuario que deberán usar los bloques reservados. |
sb=n | Usa superbloques alternativos en la posición «n». |
quota | |
noquota | |
grquota | |
usrquota | |
stripe=n | Número de bloques del sistema de archivos que el mballoc (asignador multibloque) intentara usar para la asignación de tamaño y la alineación. Para sistemas RAID 5 o 6 debe ser el número de discos de datos. |
max_batch_time=usec | |
min_batch_time=usec | |
journal_ioprio=prio | La prioridad de I/O (desde 0 a 7, donde 0 es la máxima prioridad) que será usada por las operaciones de entrada y salida proporcionadas por «kjournald2» durante una operación de subida. Por defecto está a 3. |