====== Descripción de la Materia ====== [[materias:pln:2017|(volver a la página principal)]] ===== Modalidad ===== La materia se llevará a cabo mediante clases teóricas y Trabajos Prácticos supervisados de diferente alcance. No habrá parciales, si no que la regularización/promoción estará dada por los Trabajos Prácticos. Habrá cuatro Trabajos Prácticos. Para aprobar la materia se debe rendir un examen teórico final (un coloquio en caso de promocionar). La nota final será una combinación de las notas obtenidas en los Trabajos Prácticos y en el examen final (con una proporción a determinar). Los estudiantes de **postgrado** tendrán un último Trabajo Práctico diferenciado, en el que deberán replicar un trabajo de investigación publicado en alguna conferencia o revista del área. Condiciones para regularizar: * Aprobar al menos un 60% de los Trabajos Prácticos, esto es, **tres de los cuatro TPs**. Condiciones para promocionar: * Aprobar todos los Trabajos Prácticos con nota no menor a 6 (seis) y con un promedio no menor a 7 (siete). * Aprobar un coloquio. Correlatividades: * Para cursar como regular: * Regularizadas: * Lenguajes Formales y Computabilidad * Modelos y Simulación * Aprobadas: * Introducción a la Lógica y la Computación * Probabilidad y Estadística * Para rendir como regular: * Aprobadas: * Lenguajes Formales y Computabilidad * Modelos y Simulación ===== Contenidos ===== - Introducción: - Fundamentos Matemáticos - Conceptos Lingüísticos Fundamentales - Trabajo basado en corpus - Palabras - Colocaciones - Inferencia Estadística: n-gramas sobre datos dispersos - Desambiguación de palabras - Adquisición léxica - Gramáticas - Modelos Markovianos - Etiquetado con partes del discurso - Gramáticas libres de contexto probabilísticas - Parsing probabilístico - Aplicaciones - Alineación estadística y traducción automática - Extracción de Información - Categorización de texto ===== Bibliografía ===== * [[http://web.stanford.edu/~jurafsky/|Jurafsky, D]]. and [[http://www.cs.colorado.edu/~martin/|Martin, J. H.]] (2008). [[http://www.cs.colorado.edu/~martin/slp.html|Speech and Language Processing]]. Prentice Hall, Upper Saddle River, NJ, USA, 2nd edition. * [[https://web.stanford.edu/~jurafsky/slp3/|Draft de la 3ra edición]] * Manning, C. D. and Schütze, H. (1999). [[http://nlp.stanford.edu/fsnlp/|Foundations of Statistical Natural Language Processing]]. The MIT Press, 1 edition. * Bird, S., Klein, E., and Loper, E. (2009). Natural Language Processing with Python. O'Reilly Media, 1 edition. [[http://www.nltk.org/book/|(online)]] ===== Enlaces ===== Cursos relacionados: * **[[materias:pln2015|Procesamiento de Lenguaje Natural 2015 (Franco M. Luque y Laura Alonso Alemany, FaMAF)]]** * [[https://www.coursera.org/course/nlp|Natural Language Processing (Dan Jurafsky & Christopher Manning, Coursera)]] (link muerto) * **[[http://web.stanford.edu/~jurafsky/NLPCourseraSlides.html|Lecture Slides]]** * **[[https://www.youtube.com/playlist?list=PL6397E4B26D00A269|Video Lectures]]** * [[http://cs.famaf.unc.edu.ar/~laura/pln2013|PLN (Laura Alonso, FaMAF, 2013)]] * [[http://www.cs.berkeley.edu/~klein/cs288/fa14/|Statistical NLP (Dan Klein, Berkeley, 2014)]] * [[http://www.cs.columbia.edu/~cs4705/|Natural Language Processing (Michael Collins, Columbia, 2013)]] Tecnologías: * [[http://git-scm.com/|Git]] * [[http://www.python.org|Python]] * [[http://scikit-learn.org/|scikit-learn]] * [[http://www.nltk.org/|NLTK]]