materias:pln:2019:practico3
Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
materias:pln:2019:practico3 [2019/05/15 04:03] – [Ejercicio 7: Clasificador con Embeddings] francolq | materias:pln:2019:practico3 [2019/06/13 21:21] (actual) – francolq | ||
---|---|---|---|
Línea 7: | Línea 7: | ||
* Repositorio: | * Repositorio: | ||
- | * Fecha de entrega: 23/5 a las 23:59. | + | * Fecha de entrega: |
Línea 276: | Línea 276: | ||
===== Ejercicio 6: Clasificador "three words" ===== | ===== Ejercicio 6: Clasificador "three words" ===== | ||
- | * Implementar un tagger que utilice un clasificador para etiquetar cada palabra en base a la información disponible en una ventana alrededor de la palabra. | + | * Implementar |
* Definir el vectorizador con los siguientes features: | * Definir el vectorizador con los siguientes features: | ||
* la palabra actual en minúsculas. | * la palabra actual en minúsculas. | ||
Línea 294: | Línea 294: | ||
* Clasificador de máxima entropía ('' | * Clasificador de máxima entropía ('' | ||
*/ | */ | ||
+ | |||
+ | Interfaz de '' | ||
+ | |||
+ | <code python> | ||
+ | class ClassifierTagger: | ||
+ | """ | ||
+ | """ | ||
+ | |||
+ | def __init__(self, | ||
+ | """ | ||
+ | clf -- classifying model, one of ' | ||
+ | """ | ||
+ | |||
+ | def fit(self, tagged_sents): | ||
+ | """ | ||
+ | Train. | ||
+ | tagged_sents -- list of sentences, each one being a list of pairs. | ||
+ | """ | ||
+ | |||
+ | def tag_sents(self, | ||
+ | """ | ||
+ | sent -- the sentences. | ||
+ | """ | ||
+ | |||
+ | def tag(self, sent): | ||
+ | """ | ||
+ | sent -- the sentence. | ||
+ | """ | ||
+ | |||
+ | def unknown(self, | ||
+ | """ | ||
+ | w -- the word. | ||
+ | """ | ||
+ | </ | ||
+ | |||
+ | Tests: | ||
+ | |||
+ | $ nosetests tagging/ | ||
+ | |||
+ | |||
===== Ejercicio 7: Clasificador con Word Embeddings fastText ===== | ===== Ejercicio 7: Clasificador con Word Embeddings fastText ===== | ||
- | * Agregar word embeddings fastText a los features clasificador del ejercicio anterior. | + | |
- | * Usar los vectorizadores | + | * Usar el vectorizador provisto en '' |
- | * Usar los modelos pre-entrenados para el idioma castellano ofrecidos por fastText. | + | * Usar los modelos pre-entrenados para el idioma castellano ofrecidos por fastText. |
+ | * Entrenar, evaluar y reportar resultados y tiempos en el README. | ||
Documentación: | Documentación: | ||
- | * [[https:// | + | |
- | * [[https:// | + | * [[https:// |
- | * [[https:// | + | * [[https:// |
===== Ejercicio 8: Análisis de Error y Nuevos Features | ===== Ejercicio 8: Análisis de Error y Nuevos Features | ||
Línea 326: | Línea 367: | ||
* https:// | * https:// | ||
+ | https:// | ||
+ | |||
+ | * Probe LSTM cells: recuerda consistencia de comillas?| | ||
*/ | */ | ||
materias/pln/2019/practico3.1557892984.txt.gz · Última modificación: 2019/05/15 04:03 por francolq