¿Como es que escribe una máquina de coser?
La
Máquina de Coser, a la que nos referiremos en este breve pasaje,
es, antes que nada, un mecanismo literario: un enciclopedia relacional
en permanente trans(formación); lo que la produce es un algoritmo
analítico-sintáctico regido por un juego de lenguaje basado
en una sola regla que define el significado de un término
midiendo su co-ocurrencia con las demás palabras en una base de datos
siempre cambiante. Su contenido, dinámico y relacional,
depende de las actualizaciones sufridas por páginas Web indexadas en
una base de datos variable —por cierto considerablemente numerosa
y en permanente expansión—que nuestra maquinaria está creando
y examinando permanentemente, y cuyos contenidos están, a su
vez, sujetos, a una constante actualización).
Inútil
agregar que un ingenio de estas características es sólo pensable y
posible en la Web y en la era de la masificación de Internet, en donde
cualquier usuario puede generar una publicación en formato blog.
¿Pero
cómo es que funciona esta máquina de coser jirones y harapos de oraciones
dispersas por toda la red? se preguntará el lector de este pasaje...
—y también el lector de la Máquina de Coser...
¿De
donde provienen esas palabras y frases —esa masa de textos—que
no cesan de desplegarse en la pantalla a una velocidad de escritura
que pareciera sobrepasar nuestra humana capacidad de lectura?
La
primera pregunta es: ¿cómo nos procuramos las palabras?; ¿cómo nos
procuramos, por decir, la biblioteca primigenia donde residen todas
nuestras palabras y oraciones? ¿Cómo entramos en relación
con esta especie de Biblioteca de Babel? La respuesta es: mediante
una ‘araña informática’. Este es un nombre genérico de aplicaciones
que básicamente recorren enlaces (o links) para formar gigantescas
bases de datos capaces de contener muchas páginas. Así, en una primera
etapa, es nuestra araña quien recorre —y teje la red— de páginas
que se van sumando y así constituyen la materia prima para que
la Máquina de Coser pueda, posteriormente, elaborar sus propias
definiciones y significados informando esta materia prima descompuesta
—este babélico caos de palabras y oraciones en que se han
tornado frases y palabras en el estómago de la araña.
Dando
un paso adelante, le anticipamos al lector que la descomposición —la
digestión, si así se quiere—a la que la Máquina de Coser
somete la suma de todas las páginas es aplicándole un criterio estadístico
(sobre el cual nos explayaremos luego); dando dos pasos atrás, precisamos
recordar que el tejido, como hemos dicho, se (re)genera navegando enlaces.
Lógicamente,
debemos situar un punto de partida. Nuestro interés, como ya habrá
advertido el lector, radica en el carácter cambiante de los significados
de los términos de acuerdo a sus co-ocurrencias en estructuras sintácticas
(por lo tanto semánticas) en permanente formación. Como
se verá más adelante, el modo como interpretamos estas estructuras
dependen de criterios estadísticos (esa es la regla más elemental
de nuestro juego de lenguaje). En este sentido, el significado
que la Máquina de Coser produce, puede decirse con cierta propiedad,
es relacional, emergente y dinámico.
No
hay (casi) página que se actualice con mayor frecuencia y, sobre todo,
con mayor regularidad que un periódico. Es por ello, que hemos decidido
que el punto inicial del recorrido urdido por la araña sea,
pues, un periódico (no obstante, precisamente por consideraciones de
contenido, no será siempre el mismo periódico: disponemos de
un índice de ellos que rota, de manera que cada ciclo tiene
por punto de partida un periódico diferente). Imprescindible agregar
que por más que podamos precisar el origen, resulta casi imposible
—además de metodológicamente muy inútil (por cierto) — predecir
todos los destinos.
En
cada nudo de la red, la araña hará lo mismo: guardar todos los enlaces
para navegarlos, y guardar todo el texto para procesarlo.
Así
es como la Máquina de Coser se procura, página a página, la
maraña de jirones de símbolos que ha de rezurcir...
¿Cómo
es que procesa esta enorme ruma de retazos? ¿De acuerdo a que criterios
se zurce? ¿Qué pasos contempla nuestro juego de lenguaje?
Supón
que el primer paso fue: “parte desde una página y navega todos
los enlaces guardando todo el contenido”.
El
segundo paso consiste en excluir las ocurrencias —y co-ocurrencias—
más frecuentes entre símbolos (las de primer orden, por así
decir: artículos, algunos verbos y adverbios, pronombres, conjunciones
y ‘conectores’ en general...).
(En
instancias futuras, no obstante, incluiremos todas las expresiones
existentes en la telaraña).
Así,
una vez que la máquina se ha procurado su base de datos —su pequeña
Biblioteca de Babel, por así decir— el algoritmo organiza las
palabras de acuerdo a cuatro pasos más que conducen a un
sólo resultado por palabra...
El
primero, es alfabético: todas las palabras se organizan en listas acorde
al primer símbolo con la cual se escribe cada una (como el lector ya
habrá advertido, en la parte inferior de la página de inicio se encuentra
un abecedario). En cada letra están contenidas, precisamente, las palabras
que empiezan con esa letra...
El
segundo paso, empero, es estadístico: lo que determina el orden —descendente—
de las palabras es la frecuencia con que se encuentran en la masa de
datos escudriñados: la palabra que encabeza cada columna —por ejemplo
la columna de las ‘A’— es, como hemos dicho, la palabra con ‘A’
que con más frecuencia aparece en la totalidad de los documentos examinados
(con excepción de lo excluido en el paso 2).
Como
sabemos, una expresión carece de significado fuera de una proposición
(salvo que la expresión sea toda la proposición). Sin embargo,
la proposición en que la palabra aparece en nuestra enciclopedia
es, precisamente, la proposición que, conteniendo esa misma palabra,
tiene, también, la mayor ocurrencia estadística: es la proposición
más común con la palabra más común por ejemplo de las ‘A’ (o
de las ‘M’ o de las ‘D’...). Esto, ciertamente, no excluye la
posibilidad (remota por cierto) de que esa proposición se componga
únicamente del término en cuestión...
El
tercer paso es estadístico, pero además relacional: ¿que proposición
le sigue, a modo de definición, a “la proposición más común con
la expresión más común (por ejemplo de las ‘A’)”?
Lo que le seguirá será una proposición, también la más numerosa en su género, que contendrá aquella palabra que encontremos la mayor cantidad de veces en todas las proposiciones en que encontramos la primera palabra. Si la primera palabra es, por ejemplo, ‘jabalina’, si tenemos un número n dado de todas las proposiciones con este término y si en todas estas proposiciones la palabra más frecuente aparte de ‘jabalina’ es ‘porvenir’; entonces a la proposición más numerosa que contiene ‘jabalina’ le seguirá la oración más numerosa que contenga ‘porvenir’.
Posteriormente,
el sistema repetirá recursivamente este algoritmo —este mecanismo
sintáctico— y ‘obrará con ‘porvenir’ del mismo modo a
como lo hizo con ‘jabalina’; y así generará lo que, acaso, podríamos
considerar las definiciones que nacen desde cada palabra y que
constituyen el tejido sintáctico y semántico de esta enciclopedia.
Para
el Funcionalismo —por ejemplo para Stich— la dimensión semántica
de la lengua es —y no es nada más que— una propiedad emergente
de su dimensión sintáctica. Podemos agregar que en el caso de nuestra
máquina, la dimensión sintáctica de las cadenas de proposiciones
generadas, es una propiedad emergente de los criterios estadísticos
de co-ocurrencia que hemos descrito en esta breve introducción. De
esta manera, la semántica emerge de la sintaxis
que, a su vez, emerge de la estadística. Esa es la
regla, primitiva por cierto, que está a la base del juego de
lenguaje que hace escribir a la Máquina de Coser.
Como
hemos señalado, estas definiciones estarán en constante transformación,
ya que su contenido depende de los resultados de cada estadística
que, a su vez, depende de las permanentes actualizaciones de los sitios
que conforman nuestra base de datos, tejida incesantemente por la araña.
*
* *
Respecto a la validez que este mecanismo sintáctico —que este juego de lenguaje— pueda tener como ejemplo práctico de una teoría del significado, no me considero lo suficientemente facultado como para asumir una posición filosóficamente consistente. Respecto a su validez como obra de arte, mis incertidumbres son aún más acusadas.
Sea como sea, hay que admitirlo, esta aplicación es una materialización de un experimento mental utilizado como contraargumento filosófico en un ensayo sobre Inteligencia Artificial y Lenguaje Natural. Para quién se interese, el ensayo puede ser leído y descargado en forma gratuita aquí.