El espacio latente, también llamado campo latente, es una incrustación de un conjunto de elementos dentro de una variedad matemática en la que los objetos similares aparecen próximos entre sí. La posición de cada elemento se describe mediante variables latentes que capturan sus similitudes.
En la práctica, la dimensionalidad del espacio latente se elige más pequeña que la del Espacio de características original, convirtiéndolo en un caso de reducción de dimensionalidad y, por extensión, de compresión de datos.[1] Los espacios latentes se aprenden con técnicas de aprendizaje automático y son aprovechados por clasificadores, predictores y modelos generativos.
Para inspeccionar estos espacios se aplican proyecciones a 2‑3 dimensiones, como t‑SNE, UMAP o PCA. Técnicas como t‑SNE preservan la estructura local, mientras que PCA mantiene varianza global; ninguna conserva distancias absolutas, por lo que su interpretación depende del contexto.[2]
Diversos enfoques aprenden representaciones en el espacio latente a partir de datos de alta dimensión y una medida de similitud:
La multimodalidad integra distintos tipos de datos en un espacio latente común.
El uso de espacios latentes y modelos multimodales se extiende a numerosos dominios: