Calidad de datos se refiere a los procesos, técnicas, algoritmos y operaciones encaminados a mejorar la calidad de los datos existentes en empresas y organismos. Hay varias definiciones de calidad en datos pero la más común es que sirven su propósito.[1] Limpieza de datos tal vez se requiere para asegurar la calidad de dichos datos.[2]
Los principales beneficios de la calidad de datos son:[3][4]
La garantía de calidad de datos es el proceso de la evaluación de datos por perfil para descubrir incoherencias y otras anomalías en los datos y además desempeñar actividades de limpieza de datos[5][6] (por ejemplo, excluyendo del análisis a los valores atípicos) para mejorar la calidad de los datos.
Dichas actividades se puede hacer como una parte del almacén de datos o como parte de la administración de bases de datos de una pieza existente de la aplicación informática.[7]