Concepciones semánticas de la información

18 527 bytes añadidos, 14:41 13 may 2016
sin resumen de edición
Para la TMC, la información es sólo la selección de un símbolo dentro de un conjunto de símbolos posibles, de modo que una manera simple de comprender cómo la TMC cuantifica la información es considerar el número de preguntas del tipo sí/no que se requieren para determinar qué está comunicando la fuente. Una pregunta es suficiente para determinar el ''output'' de una moneda justa que, por lo tanto, se dice que produce 1 bit de información. Un sistema de dos monedas justas produce cuatro ''outputs'' ordenados: <''h'', ''h''>, <''h'', ''t''>, <''t'', ''h''>, <''t'', ''t''>, y requiere, por lo tanto, al menos dos preguntas, donde cada ''output'' contiene 2 bits de información, y así sucesivamente. Este análisis ''erotérico'' (palabra griega para “pregunta”) permite clarificar dos puntos importantes.
 
Primero, la TMC no es una teoría de la información en el sentido ordinario de la palabra. En la TMC, la información tiene un significado completamente técnico. Consideremos algunos ejemplos. De acuerdo con la TMC, dos “sí” equiprobables contienen la misma cantidad de información, no importa si las preguntas correspondientes son “¿han estado las luces del auto encendidas por mucho tiempo sin recargar la batería?” o “¿te casarías conmigo?”. Supongamos un dispositivo que pudiera enviarnos, con probabilidades iguales, este artículo o la ''Stanford Encyclopedia of Philosophy'' entera. Obtendríamos cantidades muy diferentes de bits de datos al recibir una cosa o la otra, pero recibiríamos sólo 1 bit de información en el sentido del término de la TMC. El 1º de junio de 1944, la BBC transmitió una línea de la ''Canción de otoño'' de Verlaine: “''Les sanglots longs des violons de Autumne''”. El mensaje contenía casi 1 bit de información, un “sí” cada vez más probable a la pregunta acerca de si la invasión del Día D era inminente. La BBC luego transmitió la segunda línea: “''Blessent mon coeur d'une longueur monotone''”. Era otra cadena casi insignificante de letras, pero nuevamente de casi 1 bit de información, dado que era el otro “sí” esperado a la pregunta acerca de si la invasión tendría lugar inmediatamente. La inteligencia alemana sabía acerca del código, interceptó esos mensajes e incluso notificó a Berlín, pero el alto mando no pudo alertar al Séptimo Ejército posicionado en Normandía. Hitler tenía toda la información en el sentido de la palabra de Shannon, pero no pudo entender (o no pudo creer en) la importancia crucial de estos dos pequeños bits de datos. Por nuestra parte, no nos sorprendimos al concluir, en la sección previa, que la cantidad máxima de información (nuevamente, en el sentido de la TMC) es producida por un texto donde cada caracter está igualmente distribuido, es decir, por una secuencia perfectamente azarosa. De acuerdo con la TMC, el clásico mono oprimiendo aleatoriamente las teclas de una máquina de escribir está, en efecto, produciendo un montón de información.
 
En segundo lugar, dado que la TMC es una teoría de la información sin significado (pero no sin-sentido, sino ‘sin significado’ en el sentido de que todavía no es significativa), y puesto que hemos visto que [información − significado = datos], “teoría matemática de la comunicación de datos” resulta una descripción mucho más apropiada de esta rama de la teoría de la probabilidad que la de “teoría de la información”. Esta no es una mera cuestión de etiquetas. La información, en tanto contenido semántico (más sobre esto en breve) también puede ser descripta erotéricamente como ''datos'' + ''interrogaciones''. Imaginemos una porción de información (proposicional) como “la tierra tiene sólo una luna”. Resulta fácil polarizar casi todo su contenido semántico transformándolo en una [interrogación + respuesta binaria], tal como [¿Tiene la Tierra sólo una luna? + sí]. Sustraigamos el “sí” (que constituye como mucho 1 bit de información, en el caso de una respuesta equiprobable por sí o por no) y nos queda, virtualmente, todo el contenido semántico, completamente des-aletheisado (de ''aletheia'', la palabra griega para ‘verdad’, porque la pregunta no es ni verdadera ni falsa). Usando una expresión fregeana, el ''contenido semántico'' es ''información insaturada'', es decir, información semántica que ha sido “erotetizada” y de la cual se ha sustraído una cantidad de información igual a −log ''P''(sí), donde ''P'' es la probabilidad de la respuesta “sí”.
 
El dato “sí” funciona como una llave para desbloquear la información contenida en la interrogación. Para estudiar la codificación y transmisión de la información, la TMC trata la información como datos claves, esto es, como la cantidad de detalles en una señal o mensaje, o el espacio necesario para saturar la información insaturada del informado. Como señala Weaver, “la palabra información se relaciona no tanto con lo que de hecho usted dice, sino con lo que podría decir. La teoría matemática de la comunicación lidia con portadores de información, símbolos y señales, no con la información misma. Esto es, la información es la medida de su libertad de elección cuando selecciona un mensaje” (Weaver 1949, 12).
 
Puesto que la TMC no lidia con la información semántica en sí misma sino con los datos que la constituyen, es decir, con los mensajes que comprenden símbolos sin interpretar codificados en cadenas bien formadas de señales, es común afirmar que la teoría estudia la información a un nivel ''sintáctico''. La TMC puede ser aplicada exitosamente en TIC (tecnologías de la información y comunicación) porque las computadoras son dispositivos sintácticos. Lo que resta es clarificar cómo debe ser interpretado ''H'' en la ecuación [9].
 
''H'' también es conocida en la TMC como ''entropía''. Al parecer, debemos esta confusa etiqueta a John von Neumann, quien recomendó a Shannon:
 
“Debería llamarlo entropía por dos razones: primero, porque la función ya se utiliza en termodinámica con el mismo nombre; segundo, y más importante, porque la mayoría de la gente no sabe qué es realmente la entropía, y si usa la palabra ''entropía'' en una discusión ganará siempre” (citado por Golan 2002).
 
Von Neumann demostró que tenía razón en ambas cosas, desafortunadamente.
 
Si asumimos el caso ideal de un canal de comunicación libre de ruido, ''H'' es una medida de tres cantidades equivalentes:
 
<!--[if !supportLists]-->a.     <!--[endif]-->la cantidad promedio de información por símbolo producida por el informador, o
 
<!--[if !supportLists]-->b.     <!--[endif]-->la correspondiente cantidad promedio de déficit de datos (incertidumbre de datos) que el informado tiene antes de la inspección del ''output'' del informador, o
 
<!--[if !supportLists]-->c.     <!--[endif]-->la correspondiente potencialidad informacional de la misma fuente, es decir, su ''entropía informacional''.
 
''H'' puede indicar (a) o (b) por igual porque, al seleccionar un alfabeto particular, el informador automáticamente crea un déficit de datos (incertidumbre) en el informado que luego puede ser satisfecho (o resuelto) en varios grados por lo ''informante''. Recordemos el juego erotérico: si usa una sola moneda justa, inmediatamente me encuentro en un predicamento de 1 bit de déficit: no sé si es cara o ceca; si usa dos monedas justas, mi déficit se duplica, pero si usa el cuervo, mi déficit se vuelve nulo. Mi vaso vacío (punto (b) arriba) es una medida exacta de su capacidad de llenarlo (punto (a) arriba). Por supuesto, sólo tiene sentido hablar de información como cuantificada por ''H'' si podemos especificar la distribución de probabilidades.
 
En cuanto al punto (c), la TMC trata la información como una cantidad física, como la masa o la energía, y la proximidad entre la ecuación [9] y la formulación del concepto de entropía en mecánica estadística ya fue discutida por Shannon. El concepto informacional y el concepto termodinámico de entropía están relacionados a través de los conceptos de probabilidad y ''aleatoriedad'' (“aleatoriedad” es mejor que “desorden”, dado que el primero es un concepto sintáctico mientras que el segundo tiene un valor semántico fuerte, es decir, es fácilmente asociable a interpretaciones, como solía intentar explicar a mis padres cuando era joven). La entropía es una medida de la cantidad de “mezclidad” [N. del T.: “Mixedupness” en el original] en procesos y sistemas que llevan energía o información. La entropía puede ser vista también como un indicador de reversibilidad: si no hay cambio en la entropía entonces el proceso es reversible. Un mensaje altamente estructurado y perfectamente organizado contiene un grado menor de entropía o aleatoriedad, menos información –en el sentido de Shannon–, y por lo tanto causa un déficit de datos menor, que puede ser cercano a cero (recordemos el cuervo). En contraste, cuanto mayor sea la aleatoriedad potencial de los símbolos en el alfabeto, más bits de información pueden ser producidos por el dispositivo. La entropía asume su máximo valor en el caso extremo de una distribución uniforme, lo que equivale a decir que un vaso de agua con un cubo de hielo contiene menos entropía que un vaso de agua una vez que el cubo se ha derretido, y una moneda sesgada tiene menos entropía que una moneda justa. En termodinámica, sabemos que el grado de entropía corresponde a un déficit de alta energía, pero lo mismo vale para la entropía en la TMC: valores altos de ''H'' corresponden a grandes cantidades de déficit de datos.
 
 
==Información como contenido semántico==
 
Hemos visto que cuando los datos son bien formados y significativos, el resultado es también conocido como ''contenido semántico'' (Bar-Hillel y Carnap 1953; Bar-Hillel 1964). La información, entendida como contenido semántico, viene en dos variedades principales: factual e instruccional. En nuestro ejemplo del auto, podríamos traducir la luz roja encendida en contenido semántico de dos maneras:
 
<!--[if !supportLists]-->a.      <!--[endif]-->como una pieza de información factual, representando el hecho de que la batería está agotada, y
 
<!--[if !supportLists]-->b.    <!--[endif]-->como una pieza de información instruccional, que conlleva la necesidad de una acción específica, por ejemplo, recargar o reemplazar la batería agotada.
 
En esta tercera parte del artículo, nos ocuparemos ante todo de (a), de modo que conviene despejar el terreno considerando primero (b). Este es el último desvío en nuestro recorrido.
 
 
===Información instruccional===
 
La información instruccional es un tipo de contenido semántico. Un folleto instructivo, por ejemplo, provee información instruccional, ya sea imperativa (en la forma de una receta: primero hacer esto, luego hacer aquello…) o ya sea condicional (en la forma de un procedimiento inferencial: si es el caso que tal cosa, haga esto; de lo contrario, haga lo otro).
 
La información instruccional no es acerca de una situación, un hecho o un estado de cosas ''w'', y no modela, describe ni representa ''w''.'' ''Antes bien, esta información intenta producir (o ayudar a producir) ''w''. Por ejemplo, cuando el mecánico nos dice por teléfono que conectemos una batería cargada a la batería agotada del auto, la información que recibimos no es factual, sino instruccional.
 
Hay muchos contextos plausibles en los que una estipulación (“sea el valor de x = 3”, o “supongamos que descubrimos huesos de dinosaurios”), una invitación (“está cordialmente invitado a la fiesta de la universidad”), una orden (“¡cierre la ventana!”), una instrucción (“para abrir la caja, gire la llave”), una jugada (“1.e2-e4 c7-c5” al comienzo de una partida de ajedrez) pueden ser correctamente calificados como clases de información instruccional. La partitura impresa de una composición musical o los archivos digitales de un programa también pueden ser contados como casos típicos de información instruccional.
 
Todas estas instancias de información tienen un lado semántico: tienen que ser al menos potencialmente significativas (interpretables) para poder contar como información. Más aún, la información instruccional puede estar relacionada con la información factual (es decir, descriptiva) en contextos performativos, tales como un bautizo (“este barco se llamará ''HMS El Informante''”) o una programación (como cuando se decide un tipo de variable). Los dos tipos de información semántica (la instruccional y la factual) pueden también darse juntas en el caso de los hechizos mágicos, donde se puede suponer (erróneamente) que las representaciones semánticas de ''x'' proveen algún poder instruccional y control sobre ''x''. Sin embargo, como test, uno debe recordar que la información instruccional no califica alethéticamente (no puede ser calificada correctamente como verdadera ni falsa). En el ejemplo, sería tonto preguntar si es verdadera la información “sólo use baterías de la misma tensión de voltaje”. Las estipulaciones, las invitaciones, las órdenes, las instrucciones, las jugadas y el software no pueden ser verdaderos ni falsos. Como remarca Wittgenstein, “El modo como habla la música. No olvide que un poema, aun cuando esté compuesto en el lenguaje de la información, no es usado en el juego del lenguaje de dar información” (''Zettel'', §160, ver Wittgenstein 1981).
 
 
===Información factual===
 
En el juego del lenguaje que Wittgenstein parece tener en mente, la noción de “información semántica” está entendida en un modo factual o declarativo. La información factual puede ser verdadera o no-verdadera (falsa, en el caso en que uno adopte una lógica binaria). Parece que el sentido más común en que es entendida la información es como ''contenido semántico verdadero ''(Floridi 2004b). Quine (1970, 3–6, 98–99), por ejemplo, equipara “semejanza de significado”, “igualdad de la proposición” e “igualdad de la información objetiva” al tratar las proposiciones como información en el sentido factual recién mencionado (tener el mismo significado significa transmitir la misma información objetiva, aunque, de acuerdo con Quine, esto sólo es un parafraseo del problema). El sentido factual también es uno de los más importantes, dado que la información como contenido semántico verdadero es una condición necesaria para el conocimiento. En las próximas subsecciones, examinaremos brevemente el concepto de datos como ''posibilitadores limitantes'', el papel que juegan los niveles de abstracción en la transformación de los posibilitadores limitantes y, finalmente, la relación entre información factual y verdad.
 
 
====Posibilitadores limitantes (''constraining affordances'')====
 
Los datos que constituyen información factual permiten o invitan a ciertos constructos (son posibilitadores para el agente de información que puede tomar ventaja de ellos) y se resisten o impiden a otros (son constricciones o limitantes para el mismo agente), dependiendo de la interacción con el agente de información que los procesa y de la naturaleza de este último. Por ejemplo, la luz roja brillando intermitentemente y el hecho de que el motor no arranque le permite (o a cualquier agente de información como usted) construir la información de que (a) la batería está agotada, a la vez que vuelve más difícil para usted construir la información de que (b) hay un cortocircuito afectando el funcionamiento del indicador de batería baja y el motor no logra iniciar sólo porque no hay combustible en el tanque, que es un hecho no reportado por el indicador. Este es el sentido en que los datos son posibilitadores limitantes para (un agente de información responsable de) la elaboración de la información factual.
 
 
====Niveles de abstracción====
 
En la sección 1.3 vimos que el concepto de datos puros en sí mismos (''dedomena'') es una abstracción, como el noúmeno de Kant o la sustancia lockeana. El punto al que arribamos es que nunca se accede a los datos ni se los elabora (por un agente de información) independientemente del ''nivel de abstracción'' (NA) (ver también el concepto de “matriz” en Quine 1970). Ha llegado el momento de clarificar qué es NA.
 
Un NA es un conjunto de variables tipadas, representables intuitivamente como una interfaz, la cual establece el alcance y el tipo de datos que estarán disponibles como recurso para la generación de información. El concepto de NA es puramente epistemológico y no debería ser confundido con otras formas de “nivelismo” que están basadas, más o menos explícitamente, en un compromiso ontológico relativo a la arquitectura interna, a la sintaxis o a la estructura del sistema en cuestión (Dennett 1971, Marr 1982, Newell 1982, Simon 1969, Simon 1996; Poli 2001 ofrece una reconstrucción del nivelismo ontológico; más recientemente, Craver 2004 ha analizado el nivelismo ontológico, especialmente en biología y ciencia cognitiva). El nivelismo ontológico ha sido cada vez más atacado. Heil (2003) y Schaffer (2003) han cuestionado su plausibilidad seria y convincentemente. Sin embargo, el nivelismo epistemológico está floreciendo, especialmente en ciencias de la computación (Roever ''et al''. 1998, Hoare y Jifeng 1998), donde se lo emplea regularmente para satisfacer el requerimiento de que los sistemas construidos en niveles (para poder dominar su complejidad) funcionen correctamente.
 
A través de un NA, un agente de información (el observador) accede a un ambiente físico o conceptual: el sistema. Los NAs no son necesariamente jerárquicos y son comparables entre sí. Son interfaces que median las relaciones epistémicas entre el observador y lo observado. Consideremos, por ejemplo, un detector de movimiento (Figura 4). En el pasado, los detectores de movimiento causaban una alarma cada vez que un movimiento era registrado dentro del rango del sensor, incluyendo cosas como el balanceo de la rama de un árbol (objeto ''a'' en la Figura 4). El antiguo NA<sub>1</sub>, pues, consistía en una única variable tipada, que podría denominarse ‘movimiento’. Actualmente, cuando un sensor infrarrojo pasivo registra algún movimiento, monitorea también la presencia de una señal infrarroja, de modo que la entidad detectada debe ser algo que además de moverse emita una radiación infrarroja (usualmente percibida en forma de calor) para que se active la alarma. Los nuevos NA<sub>2</sub> consisten, por su parte, en dos variables tipadas: ‘movimiento’ y ‘radiación infrarroja’. Claramente, su auto (objeto ''b'' en Figura 4) yéndose de su casa está presente en ambos NAs; pero para el nuevo NA<sub>2</sub>, que es más refinado, las ramas del árbol meciéndose en el jardín están ausentes. Del mismo modo, una piedra en el jardín (objeto ''c'' en Figura 4) está ausente tanto en el nuevo como en el viejo NA, dado que no satisface ninguna variable tipada en ninguno de ellos.
 
[[File:image006csi.png|center]]
 
<center>'''Figura 4: Un ejemplo de niveles de abstracción'''</center>
Autores, Editores, Burócratas, Administradores
2246
ediciones

Menú de navegación