materias:pln:2019:practico3
Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
materias:pln:2019:practico3 [2019/05/15 21:00] – francolq | materias:pln:2019:practico3 [2019/06/13 21:21] (actual) – francolq | ||
---|---|---|---|
Línea 7: | Línea 7: | ||
* Repositorio: | * Repositorio: | ||
- | * Fecha de entrega: 23/5 a las 23:59. | + | * Fecha de entrega: |
Línea 276: | Línea 276: | ||
===== Ejercicio 6: Clasificador "three words" ===== | ===== Ejercicio 6: Clasificador "three words" ===== | ||
- | * Implementar un tagger que utilice un clasificador para etiquetar cada palabra en base a la información disponible en una ventana alrededor de la palabra. | + | * Implementar |
* Definir el vectorizador con los siguientes features: | * Definir el vectorizador con los siguientes features: | ||
* la palabra actual en minúsculas. | * la palabra actual en minúsculas. | ||
Línea 294: | Línea 294: | ||
* Clasificador de máxima entropía ('' | * Clasificador de máxima entropía ('' | ||
*/ | */ | ||
+ | |||
+ | Interfaz de '' | ||
+ | |||
+ | <code python> | ||
+ | class ClassifierTagger: | ||
+ | """ | ||
+ | """ | ||
+ | |||
+ | def __init__(self, | ||
+ | """ | ||
+ | clf -- classifying model, one of ' | ||
+ | """ | ||
+ | |||
+ | def fit(self, tagged_sents): | ||
+ | """ | ||
+ | Train. | ||
+ | tagged_sents -- list of sentences, each one being a list of pairs. | ||
+ | """ | ||
+ | |||
+ | def tag_sents(self, | ||
+ | """ | ||
+ | sent -- the sentences. | ||
+ | """ | ||
+ | |||
+ | def tag(self, sent): | ||
+ | """ | ||
+ | sent -- the sentence. | ||
+ | """ | ||
+ | |||
+ | def unknown(self, | ||
+ | """ | ||
+ | w -- the word. | ||
+ | """ | ||
+ | </ | ||
+ | |||
+ | Tests: | ||
+ | |||
+ | $ nosetests tagging/ | ||
+ | |||
+ | |||
===== Ejercicio 7: Clasificador con Word Embeddings fastText ===== | ===== Ejercicio 7: Clasificador con Word Embeddings fastText ===== | ||
* Agregar word embeddings fastText a los features clasificador del ejercicio anterior. | * Agregar word embeddings fastText a los features clasificador del ejercicio anterior. | ||
- | * Usar los vectorizadores | + | * Usar el vectorizador provisto en '' |
* Usar los modelos pre-entrenados para el idioma castellano ofrecidos por fastText. | * Usar los modelos pre-entrenados para el idioma castellano ofrecidos por fastText. | ||
* Entrenar, evaluar y reportar resultados y tiempos en el README. | * Entrenar, evaluar y reportar resultados y tiempos en el README. | ||
Línea 326: | Línea 366: | ||
* https:// | * https:// | ||
* https:// | * https:// | ||
+ | |||
+ | https:// | ||
* Probe LSTM cells: recuerda consistencia de comillas?| | * Probe LSTM cells: recuerda consistencia de comillas?| | ||
*/ | */ | ||
materias/pln/2019/practico3.1557954034.txt.gz · Última modificación: 2019/05/15 21:00 por francolq