Tabla de Contenidos

Introducción a la Programación Funcional

Después de iniciarnos en la programación lógica en prolog, vamos a empezar con la programación funcional en haskell.

Iniciando haskell

Al igual que con prolog, vamos a estar usando un intérprete de haskell. Un intérprete de haskell es un programa que entiende haskell, por lo tanto, puede entender y ejecutar los programas que vamos a hacer en haskell. El intérprete que vamos a estar usando es Hugs.

A Hugs se lo invoca desde la línea de comandos o cliqueando sobre el icono en nuestro entorno gráfico. Una vez que el intérprete está activo, la pantalla se presenta con un prompt a la espera de comandos o expresiones a ser evaluadas.

  [laura@azul Taller]$ hugs
  __   __ __  __  ____   ___      _________________________________________
  ||   || ||  || ||  || ||__      Hugs 98: Based on the Haskell 98 standard
  ||___|| ||__|| ||__||  __||     Copyright (c) 1994-2005
  ||---||         ___||           World Wide Web: http://haskell.org/hugs
  ||   ||                         Report bugs to: hugs-bugs@haskell.org
  ||   || Version: March 2005     _________________________________________
  
  Haskell 98 mode: Restart with command line option -98 to enable extensions
  
  Type :? for help
  Hugs.Base>

A diferencia de prolog, el intérprete de haskell tiene muchas funciones ya definidas, las que se incluyen en el llamado preludio estándar. Entre ellas están todas las aritméticas y las lógicas básicas, pero también otras muchas, como por ejemplo “reverse”. Veamos algunos ejemplos de cómo funcionan:

  Hugs.Base> 21+21
  42
  Hugs.Base> True && False
  False
  Hugs.Base> 2*4 == 10 `div` 5 && True
  False
  Hugs.Base> [2,3,5,7,11]++[1,2]
  [2,3,5,7,11,1,2]
  Hugs.Base> reverse "dabale arroz a la zorra el abad"
  "daba le arroz al a zorra elabad"

Podemos salir del intérprete Hugs con CTRL-D o con el comando “:q”.

  Hugs.Base> :q
  [Leaving Hugs]
  [laura@azul Taller]$

Incorporando conocimiento

Para poder dar nuevas definiciones y/o funciones, además de las que se encuentran en el preludio estándar, necesitamos escribir un programa de haskell. Lo haremos con un archivo terminado en .hs, donde escribiremos en texto plano todas las definiciones que conforman el programa.

Como ejemplo, vamos a ver todo el proceso de creación del programa - carga en memoria - prueba - modificación del programa - recarga, con el Ejercicio 8.3 del apunte Extracto del Cálculo de Programas, que tiene el siguiente enunciado:

sgn :: Int → Int 
-- dado un entero x, //sgn// retorna su signo, de la siguiente forma: 
-- retornará 1 si x es positivo, -1 si es negativo y 0 en cualquier otro caso.

Para crear un programa se puede hacer mediante un editor de texto cualquiera (kate, bloc de notas, emacs…) o, si no, se puede invocar el comando para editar un (nuevo) archivo :e cap8.hs desde el intérprete mismo:

Hugs.Base> :e cap8.hs

Se nos ocurre la siguiente solución para el problema de la función sgn:

sgn :: Int -> Int
sgn x   | 0<x   = 1
        | x<0   = -1
        | x=0   = 0

Escribimos esta función en el archivo, lo guardamos, y lo cargamos en la memoria del intérprete para que esté disponible para usarla. Para cargar el archivo, usamos la instrucción :l:

Hugs.Base> :l cap8.hs
ERROR "cap8.hs":4 - Syntax error in input (unexpected `=')

Pero el intérprete indica un error! Por qué? En la última línea del programa, vemos que usamos el mismo símbolo “=” para dos cosas muy distintas: para separar una condición de la forma como se calcula el resultado si la condición es cierta y para comparar dos valores. Pero en realidad el símbolo “=” sólo se puede usar para definir. Para comparar tenemos que usar el símbolo “==”.

Las traducciones de los símbolos son más o menos directas, de todas formas preparamos una tabla de Traducción de "Cálculo de Programas" a Haskell.

Para solucionar el error, corregimos x=0 por x==0.

sgn :: Int -> Int
sgn x   | 0<x   = 1
        | x<0   = -1
        | x==0  = 0

Luego de guardar el programa, hay que volver a cargarlo para que el intérprete pueda usar la función corregida, si no lo cargamos, el intérprete se queda en el estado anterior, en el que no tenía la función porque ésta tenía un error.

Hugs.Base> :l cap8.hs
Main>

Ahora sí, la función es correcta y por ello el intérprete nos muestra el prompt Main, que indica que hemos cargado alguna función más de las que hay en el preludio estándar, y que las funciones que hemos cargado son correctas.

Podemos probar la nueva función con casos de test, y vamos a fijarnos en qué casos nos dá errores y por qué:

Main> sgn 1
1
Main> sgn 0
0

Ningún problema: funciona para los casos del manual :).

Main> sgn 123123123123

Program error: arithmetic overflow
  
Main> sgn 123123123
1

El número es demasiado grande y el intérprete se queda sin capacidad para tratarlo, si le damos un número más chico, sí funciona.

Main> sgn (-1
ERROR - Syntax error in expression (unexpected end of input)

Error de sintaxis: no cerramos el paréntesis!

  
Main> sgn "hola"
ERROR - Type error in application
*** Expression     : sgn "hola"
*** Term           : "hola"
*** Type           : String
*** Does not match : Int

Error de tipos: la función está definida para trabajar con enteros (Int), no con el tipo cadena de caracteres (String).

Main> sgn 1.1
ERROR - Cannot infer instance
*** Instance   : Fractional Int
*** Expression : sgn 1.1

Error de tipos: la función está definida para trabajar con enteros (Int), no con el tipo decimal (Fractional).

Main> sgn -1
ERROR - Cannot infer instance
*** Instance   : Num (Int -> Int)
*** Expression : sgn - 1

Main> sgn (-1)
-1

Error de precedencia: la aplicación de funciones tiene precedencia sobre cualquier otra operación, y por lo tanto el intérprete aplica primero la función. Al hacerlo, se encuentra con un error de tipos: en lugar de un número, encuentra como argumento otra función (la función “-”), y ese no es el tipo de dato que está esperando, porque está esperando un entero (Int). Para evitar ese problema, usamos paréntesis para indicar que primero hay que aplicar “-” a “1”, el resultado de eso será un número entero y a eso sí vamos a poder aplicarle la función sgn.

Cómo declaramos el conocimiento en haskell?

La declaración del conocimiento en haskell tiene algunos parecidos y algunas diferencias con la declaración del conocimiento en prolog.

Vemos que haskell declara el conocimiento en forma de funciones y no mediante reglas. Sin embargo, las funciones son muy parecidas a las cláusulas de Horn que veíamos en prolog: encontramos una cabeza y un cuerpo, separados por el símbolo “=”. Veamos más atentamente la función sgn.

sgn :: Int -> Int
sgn x   | 0<x    = 1
        | x<0    = -1
        | x==0   = 0

La primera línea es la signatura de tipos, de la que vamos a hablar en la siguiente sección. Las otras tres líneas son la definición de la función. Podemos ver que esta función está definida por análisis por casos, distinguiendo tres casos: cuando x es positivo (0<x), cuando x es negativo (x<0) o cuando x es 0 (x==0). Estos tres casos se relacionan entre ellos mediante el símbolo “|”, que indica disyunción. El intérprete va a ir evaluando cada uno de los casos en el orden en el que los encuentra en el archivo del programa, y cuando encuentre uno con el que pueda unificar lo que quiere resolver, lo va a aplicar y va a terminar.

Por lo tanto, lo que hay a la izquierda del símbolo “|” tiene una función parecida a la de la cabeza de una regla de prolog, lo que hay a la derecha sería parecido al cuerpo de una regla, con algunas diferencias. Noten que la cabeza de una regla prolog tiene toda la información sobre el nombre de la función y sus argumentos, al igual que la parte izquierda de una definición de función en haskell. Sin embargo, en haskell hay un elemento implícito, el resultado, que en prolog debe estar explícito. Si escribiéramos la función sgn en prolog, la escribiríamos así:

sgn(X,Y) :- (0<X , Y=1) ; (X<0 , Y=(-1)) ; (X=0, Y=0).

y la consultaríamos de la siguiente manera:

?- sgn(33,Y).
Y = 1 .

De esta forma, indicamos que la variable “Y” va a guardar el valor del resultado de la función, lo cual está implícito en haskell. Como ven, aunque en los dos lenguajes escribamos programas que calculan lo mismo con los mismos resultados, escribir la función sgn resulta mucho más natural en haskell que en prolog. Esto es así porque cada lenguaje está orientado a tratar un cierto tipo de problemas.

Al igual que en prolog, las variables que se usan en haskell tienen alcance únicamente dentro de la definición de la función, pero, a diferencia de prolog, las variables se escriben en minúscula, de la misma forma que el nombre de las funciones.

Vemos que al definir sgn en haskell hemos distinguido dos partes del cuerpo, mediante el símbolo “=”. A la izquierda de “=” hemos escrito una condición y, si ésta se cumple, se calcula el resultado de la forma que se especifica a la derecha. Si no se cumple, se pasa al siguiente elemento de la disyunción. En prolog no disponemos de ese mecanismo, y por lo tanto nos hemos visto obligados a especificar esas dos partes de cada elemento de la disyunción con la misma categoría dentro de la proposición. Si derivamos la prueba de cada programa, vamos a ver que el resultado de ambos es el mismo, pero la función en haskell resulta mucho más natural y más fácil de leer.

Vamos a ver que en haskell hay varias formas de expresar estas condiciones para que se cumpla una determinada forma de calcular un resultado, en el apartado sobre comparación de patrones. Ahora vamos a ver un poco más sobre tipos de datos en haskell.

Tipos de datos

Haskell es un lenguaje tipado, es decir, todo dato pertenece a una clase o tipo de datos. En general, la definición de una función va precedida de su signatura de tipos, donde declaramos los tipos que están involucrados en la función:

sgn :: Int -> Int     -- esta línea es la signatura de tipos de la función sgn
sgn x   | 0<x   = 1
        | x<0   = -1
        | x==0  = 0

La signatura de tipos está formada por el nombre de la función y el tipo de sus parámetros y resultado. El nombre va seguido de :: y los parámetros y el resultado van separados por . Por ejemplo:

sgn :: Int -> Int
reverse :: [a] -> [a]
map :: (a -> b) -> [a] -> [b]

Pequeño ejercicio sobre la aridad1) de las funciones: cuál de estas tres funciones es unaria, cuál binaria, cuál ternaria?

Pero incluso si no hiciéramos la declaración de tipos mediante la signatura (lo cual sería muy mala práctica!), Hugs tiene una maquinaria para inferir el tipo de los datos de cualquier función. Podemos consultarlos mediante la instrucción :t:

  Main> :t sgn
  sgn :: Int -> Int
  Main> :t 1 + 2.1
  1 + 2.1 :: Fractional a => a
  
  Main> :t 1+ sqrt 64
  1 + sqrt 64 :: Floating a => a
  Main> :t 1+ "a"
  ERROR - Cannot infer instance
  *** Instance   : Num [Char]
  *** Expression : 1 + "a"
  Main> :t "hola" ++ "que" ++ "tal"
  "hola" ++ "que" ++ "tal" :: [Char]
  Main> :t reverse
  reverse :: [a] -> [a]
  
  Main> :t map
  map :: (a -> b) -> [a] -> [b]

De esta forma, nos resulta imposible escribir cualquier expresión que esté mal tipada, es decir, usando tipos distintos a los que se declaran en la definición de la función. De hecho, corre el rumor de que, en una versión de desarrollo de un popular intérprete de haskell (GHC), si el intérprete encontraba un error de tipos, borraba todo el código fuente! :-}

Los tipos de datos se declaran con la primera letra en mayúscula: Int, Float, Char, String, etc. En cambio, las variables se declaran en minúscula.

Veamos algunos de los tipos de datos que maneja haskell: diferentes tipos de números, letras, tuplas y listas.

Letras y números

En haskell tenemos diferentes tipos de números. Los que más vamos a estar usando son los enteros, que se llaman Int, pero también tenemos los decimales (Float).

También tenemos el tipo Char que engloba caracteres, como 'a', 'b', etc. Los elementos que pertenecen a este tipo se usan entre comillas simples. El tipo String es una forma abreviada de escribir listas de caracteres. En lugar de escribir ['h','o','l','a'], el tipo String posibilita que podamos escribir “hola”, lo cual queda mucho más legible :).

Tuplas

Las n-uplas son conjuntos con un número y orden de elementos predefinido. Se escriben entre paréntesis y se separan los elementos mediante comas. Los más conocidos son las tuplas, conjuntos de dos elementos, pero también hay triplas, cuatruplas, etc. La utilidad de las n-uplas es que nos permiten agrupar datos para manejarlos como una sola cosa.

Veamos algunos ejemplos:

suma3upla :: (Int,Int,Int) -> Int
suma3upla (x,y,z) = x+y+z
  
sumaYResta :: Int -> Int -> (Int,Int)
sumaYResta x y = (x+y, x-y)

Y los probamos desde el prompt.

  Main> suma3upla (2,3,4)
  9
  Main> sumaYResta 2 3
  (5,-1)

Las tuplas pueden contener cualquier elemento de cualquier tipo, y se pueden mezclar tipos dentro de una misma tupla. Por ejemplo, podemos tener que el primer elemento de una tupla sea una cadena de caracteres y el segundo un número, el primero, una lista, el segundo elemento un booleano y el tercero otra lista, y así todas las combinaciones que se les ocurran.

Listas

Las listas son conjuntos de elementos ordenados, pero, a diferencia de las tuplas, tienen un número indeterminado de elementos, posiblemente ninguno. También a diferencia de las tuplas, los elementos de una lista tienen que ser todos del mismo tipo. Por ejemplo, si tenemos que el primer elemento de una lista es un entero, entonces todos tienen que ser enteros. Podemos tener listas de cualquier tipo de datos: listas de números, de tuplas, de triplas, listas de listas, listas de listas de listas…

Las listas se escriben entre corchetes y se separan los elementos mediante comas. Pero esta forma de representar las listas es una forma abreviada de escribir lo que haskell interpreta internamente como una anidación de tuplas de profundidad indeterminada. De hecho [1,2,3] = (1,(2,(3,[]))).

Dado que las listas son en realidad anidaciones de tuplas, podemos trabajar con su estructura como tuplas, y separar la parte inicial de la lista del resto, lo que se suele llamar cabeza y cola. Por ejemplo, en la siguiente función:

esVacia :: [a] -> Bool
esVacia []     = True
esVacia (x:xs) = False

Pero no sólo podemos distinguir el primer elemento de una lista, podemos distinguir cualquier fracción inicial. Cuando decimos que podemos distinguir cualquier fracción inicial de una lista, lo que queremos decir es que nos podemos referir al n-ésimo elemento de una lista, eso sí, para hacerlo tenemos que hacerlo con un patrón en el que se representen todos los elementos desde el primero hasta el n-1. Por ejemplo, si queremos referirnos al tercer elemento de una lista, tendremos que referirnos también al primero y al segundo, aunque sea mediante un patrón irrefutable, por ejemplo, de esta forma:

tercero [a] -> a
tercero [_:_:x:_] = x

Sin embargo, podemos dejar el resto de la lista sin detallar cuántos elementos hay. No podemos distinguir fracciones finales de las listas porque la estructura de tuplas requiere que para distinguir el n+1 elemento de una tupla hayamos distinguido el elemento n.

Definimos un predicado que decide si hay 2 o más elementos en una lista:

alMenos2 :: [a] -> Bool
alMenos2 []       = False
alMenos2 [x]      = False
alMenos2 (x:y:xs) = True

Comparación de patrones

En haskell, como en prolog, las diferentes funciones se aplican por unificación. Es decir, cuando el intérprete trata de resolver algo, lo resuelve buscando alguna definición de función cuya parte izquierda pueda unificarse con lo que el intérprete está tratando de resolver.

Cómo hace el intérprete para llegar desde nuestra pregunta al resultado? En el siguiente ejemplo:

Main> alMenos2 [1,2,3,4,5]
True

El intérprete busca alguna definición de función que pueda unificar con alMenos2 [1,2,3,4,5]. En primer lugar, encuentra un primer caso en el que se define alMenos2:

alMenos2 []       = False

Pero este caso no le sirve porque no puede unificar la lista vacía [] con la lista no vacía [1,2,3,4,5].

Después encuentra otro caso en el que se define alMenos2, pero tampoco puede unificar una lista de un elemento con una lista de 5.

alMenos2 [x]      = False

Finalmente, encuentra un caso de una lista con dos o más elementos, con la que sí puede unificar:

alMenos2 (x:y:xs) = True

Vamos a prestar un poco más de atención al patrón que describe listas con uno o más elementos. En primer lugar vemos que se usan paréntesis. No es porque se trate de una tupla, sino para evitar errores de precedencia con el operador “:”. Este operador es una función binaria que toma un elemento y una lista y nos indica que ese elemento está dentro de la lista, en su cabeza. Si hacemos el árbol de tipado de la expresión alMenos2 (x:y:xs), nos quedará de la siguiente forma:

alMenos2    ( x : y :  xs )
-----------  --- ---  ----
[a] -> Bool   a   a : [a]
                 ---------
                :   [a]
             -------------
                 [a]
--------------------------
       Bool

Notemos que hemos usado la variable xs para describir una lista con un número indeterminado de elementos. En este caso hemos usado xs que es un nombre de variable muy usado en haskell para listas, pero podríamos haber usado cualquier otra variable: cola, resto, lista, a o lo que fuera. La variable representa una lista porque si no no podría tipar con el operador “:”, que requiere que su segundo argumento sea una lista. En cualquier caso, esta lista puede ser una lista cualquiera, incluyendo la lista vacía.

A la unificación también se la llama correspondencia de patrones o pattern matching, y a los elementos que unifican se los puede llamar patrones. Así, los diferentes casos que especificamos al definir por casos una función se pueden llamar también “patrones”.

El patrón irrefutable

Hemos visto que las variables se escriben con minúscula. Como en prolog, también tenemos una variable comodín, que puede unificar con cualquier cosa, y se escribe de la misma forma que en prolog, con el guión bajo “_”.

Veamos algunos ejemplos de uso del patrón irrefutable. Recuerden que habíamos visto la función esVacia:

esVacia :: [a] -> Bool
esVacia []     = True
esVacia (x:xs) = False

Podemos usar comodines en ambas partes del segundo patrón o bien un patrón irrefutable y comodín a la vez.

esVacia' :: [a] -> Bool
esVacia' []    = True
esVacia' (_:_) = False

esVacia'' :: [a] -> Bool
esVacia'' [] = True
esVacia'' _  = False

También se puede aplicar a la función alMenos2, que definíamos originalmente así:

alMenos2 :: [a] -> Bool
alMenos2 []       = False
alMenos2 [x]      = False
alMenos2 (x:y:xs) = True

Esta segunda versión es bastante más difícil de leer que la primera, por el uso y abuso del orden de evaluación de los patrones, patrones irrefutables y comodines. Los patrones irrefutables son muy útiles, pero no debemos dejar que nos impidan entender lo que escribimos ;).

alMenos2' :: [a] -> Bool
alMenos2' (_:_:_) = True
alMenos2' _       = False

Veamos ahora un ejemplo de mal uso del patrón irrefutable:

esCeroOUno :: Int -> Bool
esCeroOUno 0 = True
esCeroOUno _ = False
esCeroOUno 1 = True

Si probamos

Main> esCeroOUno 1
False

Por qué nos devuelve falso? Porque en haskell, como en prolog, los patrones se aplican en el orden en el que se encuentran en el archivo de la base de conocimiento: se evalúan de arriba a abajo y el primero que coincide se toma, y se finaliza la ejecución2). Como “_” unifica con cualquier cosa, entonces el intérprete encuentra un patrón que unifica con lo que está buscando, devuelve el resultado que hay a la derecha y finaliza la ejecución.

El programa que hace lo que nosotros esperamos tiene esto en cuenta y ordena los patrones de forma que se aplique el patrón irrefutable sólo cuando todo el resto falla.

esCeroOUno :: Int -> Bool
esCeroOUno 0 = True
esCeroOUno 1 = True
esCeroOUno _ = False

Un ejemplo: la función bisiesto

A manera de ejemplo veamos el ejercicio 8.7 del apunte, donde tenemos que definir una función muy útil para cualquier aparato que maneje un calendario (relojes, celulares, PDAs, computadoras, DVD-R, etc.). La signatura es bisiesto: Int → Bool, y es un predicado que devuelve true si el año es bisiesto y false en caso contrario. Recordemos cuando un año es bisiesto:

La regla para los años bisiestos según el calendario gregoriano es:
Un año es bisiesto si es divisible por 4, excepto los principios de siglo (aquellos divisibles por 100),
que para ser bisiestos, también deben ser divisibles por 400. 

Una definición matemática concisa sería bisiesto n = 4|n /\ (100|n ⇒ 400|n).

Veamos tres versiones distintas 3).

La del programadora/or imperativo

bisiesto'' :: Int -> Bool
bisiesto'' n = if  n `mod` 4 /= 0 then False
                else if n `mod` 100 /= 0 then True
                        else if n `mod` 400 == 0 then True
                                else False

El que está aprendiendo Haskell

bisiesto' :: Int -> Bool
bisiesto' n     | n `mod` 4 /= 0 = False
                | n `mod` 4 == 0 = n `mod` 100 /= 0 || n `mod` 400 == 0

El que entiende mucho de programación declarativa ;-)

bisiesto :: Int -> Bool
bisiesto n = n `mod` 4 == 0 && (n `mod` 100 /= 0 || n `mod` 400 == 0)

Ejercicios

Hay muchos ejercicios para hacer, no se preocupen si no pueden terminarlos todos!! Vamos a ver algunos de ellos en la próxima clase para consolidar los conceptos que hemos visto en esta.

probar con (0,1), (2,2), (3,1).
probar con 5 y 9, con -8 y 9, con -10 y -1, con 0 y 0 y con 0 y 3

Definir la función edad :: (Int, Int, Int) → (Int, Int, Int) → Int que dadas dos fechas indica los años transcurridos entre ellas. Por ejemplo edad (20,10,1968) (30,4,1987) = 18. Suponer que las fechas están siempre bien formadas y que la primera es menor o igual a la segunda.

probar con (16,4,1980) y (17,5,1992), (16,4,1980) y (14,5,1992), (16,4,1980) y (15,4,1992) y con (16,4,1980) y (17,5,1972).

En un prisma rectangular, llamemos h a la altura, b al ancho y d a la profundidad. Completar la siguiente definición del área del prisma:
area h b d = 2 ∗ frente + 2 ∗ lado + 2 ∗ arriba
|[ …aca va la definicion… ]|
donde frente, lado y arriba son las caras frontal, lateral y superior del prisma respectivamente.

Completar la función area h b d area :: Int → Int → Int → Int que calcula el área de un prisma rectangular:

    area :: Int -> Int -> Int -> Int   
    area h b d = 2*frente + 2*lado + 2*tapa
         where
            frente = ...
            lado   = ...
            tapa   = ...
probar con [1,2,3], con [3,3,3] y con [].
probar con [1,2,3], con [3,3,3] y con [].
probar con [1,2,3], con [3,3,3], con [0], con [0,1] y con [].
probar con (1,2) y [3,2,4,5], (0,0) y [], (1,2) y [2,3,4,5].

Ayuda: fíjense que el resultado siempre debe ser una lista de caracteres!

probar con ['l','u','n','e','s'], ['d','o','m','i','n','g','o'], [].
1)
Recuerden que la aridad es el número de argumentos de la función: unaria si tiene un argumento, binaria si tiene dos, etc.
2)
En haskell no hay backtracking (vuelta atrás), como en prolog
3)
Esto es una mala copia de The Evolution of a Haskell Programmer