materias:pln:uba2019:descripcion
¡Esta es una revisión vieja del documento!
Tabla de Contenidos
Descripción de la Materia
Modalidad
El curso será evaluado a través de trabajos prácticos en los que se deben realizar diversos ejercicios de programación de modelos y experimentación con datos. Para la aprobación del curso, deben ser aprobados todos los trabajos prácticos.
Programa
- Procesamiento básico de texto: Expresiones regulares, tokenización, segmentación, normalización, lematización y stemming.
- Modelado de lenguaje: N-gramas, suavizado add-one y por interpolación, back-off. Evaluación con perplexity. Aplicaciones: Generación de lenguaje y atribución de autoría.
- Etiquetado de secuencias: Etiquetado morfosintáctico (PoS tagging) y Reconocimiento de Entidades Nombradas (NER). Modelos Ocultos de Markov (HMMs). Modelos de Máxima Entropía (MEMMs). Algoritmo de Viterbi y beam search. Ingeniería de features, evaluación y análisis de error.
- Modelos avanzados: word embeddings (word2vec, fasttext, GloVe, etc.) y modelos de lenguaje neuronales (ULMFiT, OpenAI, ELMo, etc.).
- Otros temas: Análisis de sentimiento (sentiment analysis), análisis sintáctico (parsing), extracción de información (information extraction), traducción automática (machine translation), etc.
Bibliografía
- Jurafsky, D. and Martin, J. H. (2008). Speech and Language Processing. Prentice Hall, Upper Saddle River, NJ, USA, 2nd edition.
- Manning, C. D. and Schütze, H. (1999). Foundations of Statistical Natural Language Processing. The MIT Press, 1 edition.
- Bird, S., Klein, E., and Loper, E. (2009). Natural Language Processing with Python. O'Reilly Media, 1 edition. (online)
Enlaces
Cursos relacionados:
-
-
- Jurafsky, D. and Martin, J. H. (2008). Speech and Language Processing. Prentice Hall, Upper Saddle River, NJ, USA, 2nd edition.
Tecnologías:
materias/pln/uba2019/descripcion.1567897219.txt.gz · Última modificación: 2019/09/07 23:00 por francolq