materias:pln:uba2018:practico1
Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
materias:pln:uba2018:practico1 [2018/02/14 19:17] – francolq | materias:pln:uba2018:practico1 [2018/08/10 03:03] (actual) – editor externo 127.0.0.1 | ||
---|---|---|---|
Línea 7: | Línea 7: | ||
* Repositorio: | * Repositorio: | ||
- | * Fecha de entrega: 15/02 a las 23:59. | + | * Fecha de entrega: |
Línea 155: | Línea 155: | ||
* Calcular V como el tamaño del alfabeto incluyendo el marcador ''</ | * Calcular V como el tamaño del alfabeto incluyendo el marcador ''</ | ||
* Agregar al script de entrenamiento ('' | * Agregar al script de entrenamiento ('' | ||
- | * Entrenar sobre nuestro corpus y guardar los modelos resultantes para varios valores de n (1, 2, 3 y 4). | ||
Interfaz de la clase '' | Interfaz de la clase '' | ||
Línea 170: | Línea 169: | ||
""" | """ | ||
</ | </ | ||
+ | |||
+ | Tests: | ||
+ | |||
+ | $ nosetests languagemodeling/ | ||
+ | |||
+ | Documentación: | ||
+ | * [[http:// | ||
+ | |||
+ | |||
+ | ===== Ejercicio 5: Evaluación de Modelos de Lenguaje ===== | ||
+ | |||
+ | * Separar el corpus en entrenamiento y test (90% y 10% resp.). | ||
+ | * Usar el script '' | ||
+ | * Usar el script '' | ||
Nueva interfaz de '' | Nueva interfaz de '' | ||
Línea 190: | Línea 203: | ||
</ | </ | ||
- | Tests: | ||
- | |||
- | $ nosetests languagemodeling/ | ||
- | |||
- | |||
- | ===== Ejercicio 5: Evaluación de Modelos de Lenguaje ===== | ||
- | |||
- | * Separar el corpus en entrenamiento y test (90% y 10% resp.). | ||
- | * Usar el script '' | ||
Interfaz de '' | Interfaz de '' | ||
Línea 220: | Línea 224: | ||
* Implementar el suavizado por interpolación en '' | * Implementar el suavizado por interpolación en '' | ||
* Calcular lambdas en términos de un único parámetro gamma (ver documentación abajo). | * Calcular lambdas en términos de un único parámetro gamma (ver documentación abajo). | ||
- | * Usar add-one para el nivel más bajo (unigramas). | + | |
* Usar datos held-out (un 10% de train) y barrido para elegir valor para gamma. | * Usar datos held-out (un 10% de train) y barrido para elegir valor para gamma. | ||
* Agregar al script de entrenamiento ('' | * Agregar al script de entrenamiento ('' | ||
Línea 255: | Línea 259: | ||
* [[https:// | * [[https:// | ||
* [[https:// | * [[https:// | ||
+ | * [[http:// | ||
+ | * Mails: | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
+ | * [[https:// | ||
materias/pln/uba2018/practico1.1518635840.txt.gz · Última modificación: 2018/08/10 03:03 (editor externo)