La lingüistica computacional

Anuncios


La lingüistica computacional
Muchos de nosotros hemos estado en contacto con asistentes en lenguaje natural. Quizás algunos recordarán a "clippy", el asistente digital de Microsoft Office, a quien se le podía preguntar para obtener cierta respuesta más o menos acertada con respecto a lo que queríamos saber.

Traductor

Hoy en día, dichos asistentes han evolucionado hasta dar paso a los más elaborados como Siri, desarrollado por Apple. Además de resolver preguntas relativamente sencillas —como: ¿qué restaurantes se encuentran cerca? — ha sido programada para responder algunas otras, por ejemplo:


¿Qué opinas de la inteligencia artificial?— Déjame que me lo piense.
¿Se encontrará la partícula de Dios?— Mi política me obliga a separar el espíritu del silicio.
¿Eres humana?— En la nube nadie sabe si eres un ser humano o no.
Te amo Siri.— ¿En serio?
Te quiero.— Pero si apenas me conoces.
¿Quieres casarte conmigo?— Cultivemos nuestra amistad.


Computacion

Todo esto, por supuesto, ha sido preprogramado para dar respuestas interesantes, pero: ¿es posible que una computadora llegue a dar respuestas como las anteriores por sí misma? Más aún: ¿pueden las máquinas pensar? Esto se lo preguntó Alan Turingen en 1950, y publicó un artículo en la revista Mind, en donde abordaba este tema, en el caso de que las máquinas pudieran pensar: ¿cómo podríamos saberlo?

Para ello, diseñó una prueba, que se conoce hoy en día como "la prueba de Turing", que consiste en reconocer vía teletexto, sin ver al interlocutor, si la otra persona con la que se platica es un humano o una computadora. Si la computadora llegara a engañar al juez y lo hace pensar que es un humano, entonces ha pasado la prueba de Turing.

Texto

A partir de entonces, se han creado varios sistemas de diálogo, siendo uno de los primeros y más famosos Eliza, escrito en el Instituto Tecnológico de Massachusetts, entre 1964 y 1966. Eliza simulaba ser un psicoanalista rogeriano que daba terapia mediante preguntas que llevaban a los pacientes a la reflexión.

Eliza fue tomado en serio por muchos usuarios después de que su creador explicó que trabajaba solo haciendo coincidencia de patrones, y se le considera uno de los primeros programas conocidos como "chatbots", desde entonces se han creado muchos otros.

aplicaciones

En la actualidad existe un concurso que implementa “la prueba de Turing”, que ofrece 100 mil dólares y una medalla de oro sólido al programa que pase dicha prueba. Hasta el momento, nadie ha ganado este premio, pero han resultado programas entretenidos e interesantes como Alicebot.

¿Qué hay, sin embargo, de las aplicaciones útiles? Los sistemas de diálogo para aplicaciones específicas han sido creados desde épocas tempranas. Un ejemplo de ello es shrdlu, creado en 1973, por Terry Winograd. Este programa recibía instrucciones dentro de un micromundo de objetos, en donde no existían más que algunas cajas y pirámides colocadas sobre una mesa, y el objetivo era mover los objetos de lugar utilizando comandos de lenguaje natural para controlar un brazo robótico virtual. Un ejemplo de conversación es:

lenguaje

Ahora bien, ¿esto quiere decir que las máquinas pueden entender nuestro lenguaje? John Searle propone el siguiente ejercicio: coloquemos en un cuarto a una persona, llamémosle Juan, con un gran manual de instrucciones en español, su idioma natal, para dar respuesta en cierto lenguaje que no conoce, digamos, chino.

Entonces llega Xu, una china, introduce por debajo de la puerta un papelito con una frase en chino. Juan abre su libro de instrucciones y busca la respuesta adecuada a la frase que acaba de recibir. Aunque él no entiende qué significa, ni qué está espondiendo, dibuja unos caracteres chinos que finalmente devuelve como respuesta a Xu a través de la puerta. Xu se alegra porque recibe una respuesta coherente a la frase que escribió previamente, y piensa que Juan sabe chino; sin embargo Juan no hizo más que seguir instrucciones sin entender qué es lo que estaba haciendo.

ortografia

Esta historia nos sirve para mostrar lo que podría estar sucediendo con las computadoras: que una computadora pasara “la prueba de Turing” no significa que esté entendiendo el contenido de la plática.

Por supuesto que esto nos lleva a muchas preguntas filosóficas acerca de qué es inteligencia, y qué es aquello que nos permite procesar el lenguaje, pero es mejor que nos enfoquemos a qué es lo que sí puede hacer una computadora. A pesar de que la computadora no entienda propiamente el lenguaje es posible que nos ayude a realizar muchas tareas relacionadas con éste, gracias a la lingüística computacional.

La lingüística computacional, propiamente, es la ciencia que trata de la aplicación de los métodos computacionales en el estudio del lenguaje natural; entendiendo por lenguaje natural aquél que hablamos entre nosotros, los humanos, en oposición a los lenguajes artificiales, creados por nosotros, tales como los lenguajes de programación u otros abstractos como las matemáticas. Una de las partes que consisten en la aplicación directa de lo que estudia la lingüística computacional se llama procesamiento de lenguaje natural.

Cotidianamente interactuamos con herramientas que realizan procesamiento de lenguaje natural. Por ejemplo, cuando realizamos una búsqueda en google, se transforman las palabras en sus múltiples variantes para incrementar el alcance de nuestras búsquedas: “veterinarios”, automáticamente se cambia la palabra a “veterinario” (sin s) para que coincida con las páginas que hablan de un veterinario específico.

También se realizan otras transformaciones como quitar diminutivos, aumentativos, cambiar la forma conjugada del verbo —por ejemplo, si buscamos “trabajan con gatos”, la búsqueda incluye “trabajo/trabaja/trabaje con gatos, entre otros— este proceso se conoce como “lematización”.

linguistica

Otra aplicación de la lingüística computacional, que usamos frecuentemente, es el corrector ortográfico y gramatical de algunos procesadores de texto. Por supuesto que no son infalibles, algunos errores escapan a estos correctores, pero muchas veces ayudan a evitar errores comunes.

Otras cosas que podemos hacer con la lingüística computacional incluyen consultas a bases de datos usando lenguaje natural, producir resúmenes de manera automática, buscadores especializados —de términos legales o médicos— asistentes para lexicógrafos —quienes escriben los diccionarios— asistentes para personas que están aprendiendo otro idioma, clasificación de textos —sugerir en una biblioteca dónde deberán colocarse ciertos libros de acuerdo con su contenido— identificación de temas en un escrito y, en general, ayudar a acercar la tecnología a quienes no tienen suficiente conocimiento de las instrucciones específicas para controlar una computadora —interfaces hombre-máquina.

Así, en lugar de enseñar a mucha gente a usar una computadora, al manejar el mismo lenguaje que nosotros, cualquier persona podría utilizar una computadora, logrando así, informática para todos.

En conclusión, por ahora estamos lejos de tener máquinas que manejen el lenguaje como lo hacemos los humanos, pero contamos con herramientas útiles y muchas aplicaciones que con el tiempo pueden mejorarse.

5 comentarios - La lingüistica computacional

@LA_MEJOR_0NDA +2
¿Qué opinas de la inteligencia artificial?— Déjame que me lo piense.
¿Se encontrará la partícula de Dios?— Mi política me obliga a separar el espíritu del silicio.
¿Eres humana?— En la nube nadie sabe si eres un ser humano o no.
Te amo Siri.— ¿En serio?
Te quiero.— Pero si apenas me conoces.
¿Quieres casarte conmigo?— Cultivemos nuestra amistad.



Raj Detected?
@titi40 +1
que interesante, gracias
@AndromedaMX +1
Me gusto tu post en un futuro muy próximo esto ya podrá ser posible.
@Tebss
el ayudante de office NO es inteligente, es simplemente una base de datos con preguntas vinculadas a sus posibles respuestas y relacionadas entre si. Para que sea inteligente tiene qe tener la capacidad de aprender entre otras características de un sistema inteligente.
@mdulises +1
Estas en lo correcto, no es inteligente, en el post solo se le menciona como un software en la historia de la lingüistica computacional.