¿Como es que escribe una máquina de coser?

     La Máquina de Coser, a la que nos referiremos en este breve pasaje, es, antes que nada, un mecanismo literario: un enciclopedia relacional en permanente trans(formación); lo que la produce es un algoritmo analítico-sintáctico regido por un juego de lenguaje basado en una sola regla que define el significado de un término midiendo su co-ocurrencia con las demás palabras en una base de datos siempre cambiante. Su contenido, dinámico y relacional, depende de las actualizaciones sufridas por páginas Web indexadas en una base de datos variable —por cierto considerablemente numerosa y en permanente expansión—que nuestra maquinaria está creando y examinando permanentemente, y cuyos contenidos están, a su vez, sujetos, a una constante actualización).  

     Inútil agregar que un ingenio de estas características es sólo pensable y posible en la Web y en la era de la masificación de Internet, en donde cualquier usuario puede generar una publicación en formato blog.    

     ¿Pero cómo es que funciona esta máquina de coser jirones y harapos de oraciones dispersas por toda la red? se preguntará el lector de este pasaje... —y también el lector de la Máquina de Coser... 

     ¿De donde provienen esas palabras y frases —esa masa de textos—que no cesan de desplegarse en la pantalla a una velocidad de escritura que pareciera sobrepasar nuestra humana capacidad de lectura? 

     La primera pregunta es: ¿cómo nos procuramos las palabras?; ¿cómo nos procuramos, por decir, la biblioteca primigenia donde residen todas nuestras palabras y oraciones? ¿Cómo entramos en relación con esta especie de Biblioteca de Babel? La respuesta es: mediante una ‘araña informática’. Este es un nombre genérico de aplicaciones que básicamente recorren enlaces (o links) para formar gigantescas bases de datos capaces de contener muchas páginas. Así, en una primera etapa, es nuestra araña quien recorre —y teje la red— de páginas que se van sumando y así constituyen la materia prima para que la Máquina de Coser pueda, posteriormente, elaborar sus propias definiciones y significados informando esta materia prima descompuesta —este babélico caos de palabras y oraciones en que se han tornado frases y palabras en el estómago de la araña.  

     Dando un paso adelante, le anticipamos al lector que la descomposición —la digestión, si así se quiere—a la que la Máquina de Coser somete la suma de todas las páginas es aplicándole un criterio estadístico (sobre el cual nos explayaremos luego); dando dos pasos atrás, precisamos recordar que el tejido, como hemos dicho, se (re)genera navegando enlaces.  

     Lógicamente, debemos situar un punto de partida. Nuestro interés, como ya habrá advertido el lector, radica en el carácter cambiante de los significados de los términos de acuerdo a sus co-ocurrencias en estructuras sintácticas (por lo tanto semánticas) en permanente formación.  Como se verá más adelante, el modo como interpretamos estas estructuras dependen de criterios estadísticos (esa es la regla más elemental de nuestro juego de lenguaje). En este sentido, el significado que la Máquina de Coser produce, puede decirse con cierta propiedad, es relacional, emergente y dinámico.  

     No hay (casi) página que se actualice con mayor frecuencia y, sobre todo, con mayor regularidad que un periódico. Es por ello, que hemos decidido que el punto inicial del recorrido urdido por la araña sea, pues, un periódico (no obstante, precisamente por consideraciones de contenido, no será siempre el mismo periódico: disponemos de un índice de ellos que rota, de manera que cada ciclo tiene por punto de partida un periódico diferente). Imprescindible agregar que por más que podamos precisar el origen, resulta casi imposible —además de metodológicamente muy inútil (por cierto) — predecir todos los destinos.  

     En cada nudo de la red, la araña hará lo mismo: guardar todos los enlaces para navegarlos, y guardar todo el texto para procesarlo.  

     Así es como la Máquina de Coser se procura, página a página, la maraña de jirones de símbolos que ha de rezurcir... 

     ¿Cómo es que procesa esta enorme ruma de retazos? ¿De acuerdo a que criterios se zurce? ¿Qué pasos contempla nuestro juego de lenguaje?  

     Supón que el primer paso fue: “parte desde una página y navega todos los enlaces guardando todo el contenido”.  

     El segundo paso consiste en excluir las ocurrencias —y co-ocurrencias— más frecuentes entre símbolos (las de primer orden, por así decir: artículos, algunos verbos y adverbios, pronombres, conjunciones y ‘conectores’ en general...).  

     (En instancias futuras, no obstante, incluiremos todas las expresiones existentes en la telaraña).  

     Así, una vez que la máquina se ha procurado su base de datos —su pequeña Biblioteca de Babel, por así decir— el algoritmo organiza las palabras de acuerdo a cuatro pasos más que conducen a un sólo resultado por palabra...  

     El primero, es alfabético: todas las palabras se organizan en listas acorde al primer símbolo con la cual se escribe cada una (como el lector ya habrá advertido, en la parte inferior de la página de inicio se encuentra un abecedario). En cada letra están contenidas, precisamente, las palabras que empiezan con esa letra... 

     El segundo paso, empero, es estadístico: lo que determina el orden —descendente— de las palabras es la frecuencia con que se encuentran en la masa de datos escudriñados: la palabra que encabeza cada columna —por ejemplo la columna de las ‘A’— es, como hemos dicho, la palabra con ‘A’ que con más frecuencia aparece en la totalidad de los documentos examinados (con excepción de lo excluido en el paso 2).  

     Como sabemos, una expresión carece de significado fuera de una proposición (salvo que la expresión sea toda la proposición). Sin embargo, la proposición en que la palabra aparece en nuestra enciclopedia es, precisamente, la proposición que, conteniendo esa misma palabra, tiene, también, la mayor ocurrencia estadística: es la proposición más común con la palabra más común por ejemplo de las ‘A’ (o de las ‘M’ o de las ‘D’...). Esto, ciertamente, no excluye la posibilidad (remota por cierto) de que esa proposición se componga únicamente del término en cuestión... 

     El tercer paso es estadístico, pero además relacional: ¿que proposición le sigue, a modo de definición, a “la proposición más común con la expresión más común (por ejemplo de las ‘A’)”?  

     Lo que le seguirá será una proposición, también la más numerosa en su género, que contendrá aquella palabra que encontremos la mayor cantidad de veces en todas las proposiciones en que encontramos la primera palabra. Si la primera palabra es, por ejemplo, ‘jabalina’, si tenemos un número n dado de todas las proposiciones con este término y si en todas estas proposiciones la palabra más frecuente aparte de ‘jabalina’ es ‘porvenir’; entonces a la proposición más numerosa que contiene ‘jabalina’ le seguirá la oración más numerosa que contenga ‘porvenir’. 

     Posteriormente, el sistema repetirá recursivamente este algoritmo —este mecanismo sintáctico— y ‘obrará con ‘porvenir’ del mismo modo a como lo hizo con ‘jabalina’; y así generará lo que, acaso, podríamos considerar las definiciones que nacen desde cada palabra y que constituyen el tejido sintáctico y semántico de esta enciclopedia. 

     Para el Funcionalismo —por ejemplo para Stich— la dimensión semántica de la lengua es —y no es nada más que— una propiedad emergente de su dimensión sintáctica. Podemos agregar que en el caso de nuestra máquina, la dimensión sintáctica de las cadenas de proposiciones generadas, es una propiedad emergente de los criterios estadísticos de co-ocurrencia que hemos descrito en esta breve introducción. De esta manera, la semántica emerge de la sintaxis que, a su vez, emerge de la estadística. Esa es la regla, primitiva por cierto, que está a la base del juego de lenguaje que hace escribir a la Máquina de Coser.  

     Como hemos señalado, estas definiciones estarán en constante transformación, ya que su contenido depende de los resultados de cada estadística que, a su vez, depende de las permanentes actualizaciones de los sitios que conforman nuestra base de datos, tejida incesantemente por la araña.  

     * * * 

     Respecto a la validez que este mecanismo sintáctico —que este juego de lenguaje— pueda tener como ejemplo práctico de una teoría del significado, no me considero lo suficientemente facultado como para asumir una posición filosóficamente consistente. Respecto a su validez como obra de arte, mis incertidumbres son aún más acusadas.

     Sea como sea, hay que admitirlo, esta aplicación es una materialización de un experimento mental utilizado como contraargumento filosófico en un ensayo sobre Inteligencia Artificial y Lenguaje Natural. Para quién se interese, el ensayo puede ser leído y descargado en forma gratuita aquí.