====== Descripción de la Materia ====== [[materias:pln:uba2018|(volver a la página principal)]] ===== Modalidad ===== El curso será evaluado a través de trabajos prácticos en los que se deben realizar diversos ejercicios de programación de modelos y experimentación con datos. Para la aprobación del curso, deben ser aprobados todos los trabajos prácticos. ===== Programa ===== * Procesamiento básico de texto: Expresiones regulares, tokenización, segmentación, normalización, lematización y stemming. * Modelado de lenguaje: N-gramas, suavizado add-one y por interpolación, back-off. Evaluación con perplexity. Aplicaciones: Generación de lenguaje y atribución de autoría. * Etiquetado de secuencias: Etiquetado morfosintáctico (PoS tagging) y Reconocimiento de Entidades Nombradas (NER). Modelos Ocultos de Markov (HMMs). Modelos de Máxima Entropía (MEMMs). Algoritmo de Viterbi y beam search. Ingeniería de features, evaluación y análisis de error. * Análisis de sentimiento (sentiment analysis): Detección de polaridad. Corpus y métricas de evaluación. Pipeline básico: preprocesamiento, features y clasificadores. Recursos: Lexicones de sentimiento, representaciones de palabras (word embeddings). * Otros temas: Análisis sintáctico (parsing), extracción de información (information extraction), traducción automática (machine translation), etc. ===== Bibliografía ===== * [[http://web.stanford.edu/~jurafsky/|Jurafsky, D]]. and [[http://www.cs.colorado.edu/~martin/|Martin, J. H.]] (2008). [[http://www.cs.colorado.edu/~martin/slp.html|Speech and Language Processing]]. Prentice Hall, Upper Saddle River, NJ, USA, 2nd edition. * [[https://web.stanford.edu/~jurafsky/slp3/|Draft de la 3ra edición]] * Manning, C. D. and Schütze, H. (1999). [[http://nlp.stanford.edu/fsnlp/|Foundations of Statistical Natural Language Processing]]. The MIT Press, 1 edition. * Bird, S., Klein, E., and Loper, E. (2009). Natural Language Processing with Python. O'Reilly Media, 1 edition. [[http://www.nltk.org/book/|(online)]] ===== Enlaces ===== Cursos relacionados: * [[materias:pln|Procesamiento de Lenguaje Natural 2017 (Franco M. Luque, FaMAF)]] * [[materias:pln2015|Procesamiento de Lenguaje Natural 2015 (Franco M. Luque y Laura Alonso Alemany, FaMAF)]] * [[https://www.coursera.org/course/nlp|Natural Language Processing (Dan Jurafsky & Christopher Manning, Coursera)]] (link muerto) * **[[http://web.stanford.edu/~jurafsky/NLPCourseraSlides.html|Lecture Slides]]** * **[[https://www.youtube.com/playlist?list=PL6397E4B26D00A269|Video Lectures]]** * [[http://www.cs.columbia.edu/~cs4705/|Natural Language Processing (Michael Collins, Columbia, 2013)]] * **[[https://www.youtube.com/user/afigfigueira/playlists?sort=dd&view=50&shelf_id=5|Video Lectures]]** * [[http://web.stanford.edu/~jurafsky/|Jurafsky, D]]. and [[http://www.cs.colorado.edu/~martin/|Martin, J. H.]] (2008). [[http://www.cs.colorado.edu/~martin/slp.html|Speech and Language Processing]]. Prentice Hall, Upper Saddle River, NJ, USA, 2nd edition. * [[https://web.stanford.edu/~jurafsky/slp3/|Draft de la 3ra edición]] Tecnologías: * [[http://git-scm.com/|Git]] * [[http://www.python.org|Python]] * [[http://scikit-learn.org/|scikit-learn]] * [[http://www.nltk.org/|NLTK]]