ASLAN (del inglés Algorithm for Sequence Location Approximation using Nuclear Families) es un algoritmo que fue desarrollado para localizar secuencias del genoma que no están mapeadas en el genoma humano de referencia.[1] En él se emplean datos de familias nucleares y un modelo de Máxima verosimilitud para identificar las regiones de origen más probables del genoma de referencia. El objetivo de ASLAN es mejorar el mapeo de regiones genómicas, localizar regiones de alta diversidad genética y explorar áreas del genoma que no estaban previamente descritas.
El genoma humano de referencia, GRCh38, aunque es un avance muy importante en el campo de la genómica, es incompleto, presenta brechas y no representa toda la diversidad genética humana (Carece de más de 200 Megabases). Las brechas o gaps son regiones del genoma que no están completamente secuenciadas, y por tanto no representan toda la diversidad genética en el genoma de referencia, son "huecos" en el genoma en los que falta información, debido a características complejas de estas regiones o limitaciones tecnológicas. Estos gaps se encuentran principalmente en Telómeros, Centrómeros y regiones heterocromáticas. El algoritmo ASLAN fue creado para evitar estos problemas, localizando secuencias no mapeadas y ayudando así a completar el genoma de referencia.
A pesar de su precisión, el algoritmo presenta problemas al localizar secuencias en regiones que son altamente repetitivas y con duplicaciones, también pueden causar algún error las regiones que tienen mucha recombinación entre cromosomas.
A pesar de estas limitaciones, se espera que, con futuros avances en tecnologías de secuenciación, unido a mejoras en los algoritmos, permitan una mayor precisión en las regiones genómicas más complejas.