Herramientas de usuario

Herramientas del sitio


materias:pln:uba2018:descripcion

Descripción de la Materia

Modalidad

El curso será evaluado a través de trabajos prácticos en los que se deben realizar diversos ejercicios de programación de modelos y experimentación con datos. Para la aprobación del curso, deben ser aprobados todos los trabajos prácticos.

Programa

  • Procesamiento básico de texto: Expresiones regulares, tokenización, segmentación, normalización, lematización y stemming.
  • Modelado de lenguaje: N-gramas, suavizado add-one y por interpolación, back-off. Evaluación con perplexity. Aplicaciones: Generación de lenguaje y atribución de autoría.
  • Etiquetado de secuencias: Etiquetado morfosintáctico (PoS tagging) y Reconocimiento de Entidades Nombradas (NER). Modelos Ocultos de Markov (HMMs). Modelos de Máxima Entropía (MEMMs). Algoritmo de Viterbi y beam search. Ingeniería de features, evaluación y análisis de error.
  • Análisis de sentimiento (sentiment analysis): Detección de polaridad. Corpus y métricas de evaluación. Pipeline básico: preprocesamiento, features y clasificadores. Recursos: Lexicones de sentimiento, representaciones de palabras (word embeddings).
  • Otros temas: Análisis sintáctico (parsing), extracción de información (information extraction), traducción automática (machine translation), etc.

Bibliografía

Enlaces

materias/pln/uba2018/descripcion.txt · Última modificación: 2018/08/10 03:03 por 127.0.0.1