Mallet (Mazo, en español, siglas de Java "MAchine Learning for Language Toolkit") es una colección integrada de código Java útil para procesamiento de lenguajes naturales estadístico, clasificación de documentos, análisis de conglomerados, extracción de información, y otras aplicaciones de aprendizaje automático aplicadas al texto.
Mallet | ||
---|---|---|
Información general | ||
Tipo de programa | aprendizaje automático | |
Desarrollador | Andrew McCallum, con la colaboración de varios estudiantes y personas | |
Licencia | Common Public License 1.0 | |
Idiomas | inglés | |
Información técnica | ||
Programado en | Java | |
Plataformas admitidas | Java | |
Versiones | ||
Última versión estable | 2.0.7 ( 22 de septiembre de 2011 (13 años, 3 meses y 27 días)) | |
Enlaces | ||
Sitio web oficial
| ||
Mallet incluye herramientas sofisticadas para la clasificación de documentos: rutinas eficientes para la conversión de texto a "características", una amplia variedad de algoritmos (incluyendo Bayes ingenuo, entropía máxima, y árboles de decisión), y código para evaluar el desempeño del clasificador utilizando varios indicadores de uso común.[1]
MALLET fue desarrollado principalmente por Andrew McCallum, de la Universidad de Massachusetts Amherst, con la asistencia de estudiantes de posgrado y profesores tanto de la UMASS Amherst como de la Universidad de Pensilvania.