domingo, 1 de mayo de 2011

4.1 Ontologias, Taxonomias y estructuras referenciales

Ontologia

Una ontología es una especificación de una conceptualización, esto es, un marco común o una estructura conceptual sistematizada y de consenso no sólo para almacenar la información, sino también para poder buscarla y recuperarla. Una ontología define los términos y las relaciones básicas para la compresión de un área del conocimiento, así como las reglas para poder combinar los términos para definir las extensiones de este tipo de  vocabulario controlado.
Se trata de convertir la información en conocimiento mediante unas estructuras de conocimiento formalizadas (las ontologías) que referencien los datos, por medio metadatos, bajo un esquema común normalizado sobre algún dominio del conocimiento. Los metadatos no sólo especificarán el esquema de datos que debe aparecer en cada instancia, sino que también podrán contener información adicional de cómo hacer deducciones sobre ellos, es decir, cómo establecer axiomas que podrán, a su vez, aplicarse en los diferentes dominios que trate el conocimiento almacenado. De esta forma, los buscadores podrán obtener información al compartir los mismos esquemas de anotaciones web y los agentes de software no sólo encontrarán la información precisa, sino que podrán realizar inferencias de forma automática buscando información relacionada con la que se encuentra situada en las páginas web y con los requerimientos de las consultas realizadas por los usuarios. Además, los productores de páginas y servicios web podrán intercambiar sus datos siguiendo estos esquemas comunes consensuados e, incluso, podrán reutilizarlos.
Los beneficios de utilizar antologías se pueden resumir de la siguiente forma:
  •  proporcionan una forma de representar y compartir el conocimiento utilizando un vocabulario común
  •  permiten usar un formato de intercambio de conocimiento
  •  proporcionan un protocolo específico de comunicación
  •  permiten una reutilización del conocimiento
El término ontología se ha empleado desde hace muchos siglos en el campo de la filosofía y del conocimiento y hace ya varias décadas cobró especial relevancia en el campo de la biblioteconomía y la documentación. Hoy ha sufrido un nuevo impulso debido al desarrollo de la Web Semántica donde prima la idea de transformar la red no sólo en un espacio de información, sino también en un espacio de conocimiento.
En el campo de la filosofía, la ontología -en singular- se ha considerado una rama de la filosofía que se ocupa de la naturaleza y organización de la realidad. En los años 90, dicho concepto se empezó a utilizar en el campo de la Inteligencia Artificial, la ingeniería, la representación del conocimiento y la lingüística computacional como modelos de representación del conocimiento. En el campo de la documentación, las ontologías son una herramienta para el intercambio y uso del conocimiento ya que proveen una compresión compartida y consensuada de un dominio del conocimiento, que puede ser comunicada entre personas y sistemas heterogéneos. Dentro de los sistemas de organización del conocimiento, las ontologías, al igual que los tesauros, se encasillan dentro de las llamadas listas relacionadas.
Existen numerosas definiciones de ontologías, entre las que cabe destacar:
  •  "Una ontología es un vocabulario acerca de un dominio: términos + relaciones + reglas de combinación para extender el vocabulario". Neches, 1991.
  •  "Una ontología es la especificación de una conceptualización". Gruber, 1993. (Aquí el término conceptualización se refiere a un modelo conceptual).
  •  "Una ontología es una especificación formal de una conceptualización compartida". Borst, 1997. (Aquí el término forma se refiere a que es procesable por ordenador).
  •  "Una ontología es una base de datos que describe los conceptos generales o sobre un dominio, algunas de sus propiedades y cómo los conceptos se relacionan unos con otros". Weingand, 1997.
  •   Una ontología necesariamente incluirá un vocabulario de términos y una especificación de su significado (definiciones e interrelaciones entre conceptos) que impone estructura al dominio y restringe las posibles interpretaciones. Uschold-Jasper.
Tanto los tesauros como las ontologías son herramientas que sirven para estructurar conceptualmente determinados ámbitos del conocimiento por medio de vocabularios controlados. La diferencia entre los tesauros y las ontologías radica en la complejidad ya que estas últimas introducen un mayor nivel de profundización semántica y proporcionan una descripción lógica y formal que puede ser interpretada tanto por las personas, como por las máquinas, mientras que los tesauros sólo pueden ser interpretados por humanos. Las ontologías permiten, además, la interoperabilidad entre sistemas distintos.
En resumen, una ontología es un sistema de representación del conocimiento que resulta de seleccionar un dominio o ámbito del conocimiento, y aplicar sobre él un método con el fin de obtener una representación formal de los conceptos que contiene y de las relaciones que existen entre dichos conceptos. Además, una ontología se construye en relación a un contexto de utilización. Esto quiere decir que una ontología especifica una conceptualización o una forma de ver el mundo, por lo que cada ontología incorpora un punto de vista. Además, una ontología contiene definiciones que nos proveen del vocabulario para referirse a un dominio. Estas definiciones dependen del lenguaje que usemos para describirlas. Todas las conceptualizaciones (definiciones, categorizaciones, jerarquías, propiedades, herencia, etc.) de una ontología pueden ser procesables por máquina.
Según Gruber, las ontologías se componen de:
  •  conceptos: son las ideas básicas que se intentan formalizar. Los conceptos pueden ser clases de objetos, métodos, planes, estrategias, procesos de razonamiento, etc.
  •  relaciones: representan la interacción y enlace entre los conceptos de un dominio. Suelen formar la taxonomía del dominio. Por ejemplo: subclase-de, parte-de, parte-exhaustiva-de, conectado-a, etc.
  •  funciones: son un tipo concreto de relación donde se identifica un elemento mediante el cálculo de una función que considera varios elementos de la ontología. Por ejemplo, pueden aparecer funciones como: asignar-fecha, categorizar-clase, etc.
  •  instancias: se utilizan para representar objetos determinados de un concepto.
  •  reglas de restricción o axiomas: son teoremas que se declaran sobre relaciones que deben cumplir los elementos de la ontología. Por ejemplo: "Si A y B son de la clase C, entonces A no es subclase de B", "Para todo A que cumpla la condición B1, A es C", etc. Los axiomas, junto con la herencia de conceptos, permiten inferir conocimiento que no esté indicado explícitamente en la taxonomía de conceptos.
Las posibles aplicaciones y usos de las ontologías son:
  •  repositorios para la organización del conocimiento
  •  servir de herramienta para la adquisición de información
  •  servir de herramientas de referencia en la construcción de sistemas de bases de conocimiento que aporten consistencia, fiabilidad y falta de ambigüedad a la hora de recuperar información
  •  normalizar los atributos de los metadatos aplicables a los documentos
  •  crear una red de relaciones que aporte especificación y fiabilidad
  •  permitir compartir conocimiento
  •  posibilitar el trabajo cooperativo al funcionar como soporte común de conocimiento entre organizaciones, comunidades científicas, etc.
  •  permitir la integración de diferentes perspectivas de usuarios
  •  permitir el tratamiento ponderado del conocimiento para recuperar información de forma automatizada
  •  permitir la construcción automatizada de mapas conceptuales y mapas temáticos
  •  permitir la reutilización del conocimiento existente en nuevos sistemas
  •  permitir la interoperatividad entre sistemas distintos
  •  establecer modelos normativos que permitan la creación de la semántica de un sistema y un modelo para poder extenderlo y transformarlo entre diferentes contextos
  •  servir de base para la construcción de lenguajes de representación del conocimiento



    Taxonomias


    el conjunto de páginas es una gran taxonomía ordenada alfabéticamente con la finalidad adicional de asistir al usuario en la búsqueda de información. “El primer acercamiento hacia la web semántica y el uso de servicios web ( Web Servicies ) es la expresión de taxonomías legibles por máquina“. 6 Las taxonomías constituyen formas de clasificar y categorizar un grupo de elementos en forma de jerarquías; es simplemente una estructura en forma de árbol con ramificaciones y cada punto de estas constituye un nodo. De forma general, para la Biología una taxonomía propone “el estudio de los principios generales de la clasificación científica: en particular, la clasificación sistemática, es la clasificación ordenada de plantas y animales acorde con sus relaciones naturales”. 7 La evolución acelerada de las tecnologías de información ha provocado que el concepto de taxonomía -que hasta hace pocos años se manejaba sólo en el campo biológico- atienda no solamente a construcciones abstractas del lenguaje natural, sino también a la clasificación de entidades de información en forma de jerarquías, según las relaciones que en el mundo real ellas representan.
    Así cada nodo de la taxonomía constituye una entidad de información que tiene lugar en mundo real y cada enlace entre nodos representa una relación entre clases, donde estas relaciones, a su vez, representan clases de objetos, cuya terminología se le atribuye a la programación orientada a objetos en Informática.
    En la medida que se asciende o desciende en determinada jerarquía, las taxonomías adquieren un grado mayor o menor de generalización o especificación. En la clasificación de información, permiten establecer relaciones simples o compuestas para un espacio de información -esquemas de meta-datos, tesauros, modelos conceptuales, Topic Maps y ontologías.
    Desde este punto de vista, una taxonomía es una jerarquía semántica en la que las entidades de información se relacionan mediante clases y subclases; la primera es semánticamente más fuerte que la segunda, y por ello se enfatiza en las taxonomías semánticamente débiles y semánticamente fuertes. Las taxonomías del primer orden carecen de complejidad para expresar agudeza o riqueza en el significado, pero las del segundo orden tratan de utilizar la noción de propiedades o atributos para diferenciar una subclase de la clase superior.
    El uso más frecuente de las taxonomías en ambiente web es en la navegación, especialmente cuando se tiene una idea general de lo que se busca mediante la consulta a motores de búsquedas o directorios web. La Clasificación Decimal de Dewey, en su versión electrónica, es una taxonomía utilizada en las bibliotecas digitales para proporcionarle a los lectores, temáticas o tópicos generales sobre los cuales tratan sus materiales de consulta. El Sistema de Clasificación Industrial Internacional Estándar (NAICS) , concebida como taxonomía para el comercio electrónico y desarrollad por los Estados Unidos, Canadá y México, posibilita comparar estadísticas sobre la actividad empresarial en todo Norte América.
    Las taxonomías, como los tesauros y las ontologías, son mecanismos que permiten estructurar datos e información para dotar a los sistemas de recuperación de información de al menos, un mínimo de semántica. En el web, pueden utilizarse para ayudar a los usuarios/clientes a encontrar productos y servicios, así como para representar mejor sus necesidades de información. Como estructuras enfocadas a la clasificación de contenido, posibilitan que los motores de búsquedas y otras aplicaciones que utilizan taxonomías como los servicios web ( Web Services ), localicen entidades de información más rápido y con mayor grado de precisión y exhaustividad mediante UDDI ( Universal Description Discovery and Integration ).
    Las taxonomías son excelentes mecanismos para clasificar entidades de información, de ahí que las ontologías utilizan taxonomías como columna vertebral para su funcionamiento como base estructural. A juicio de Taylor , las ontologías, que en el campo de la recuperación de información y la inteligencia artificial suponen un avance en la interrelación entre los humanos y las computadoras, pueden ser no lingüísticas -empleadas para la creación de agentes inteligentes- y lingüísticas, al vincularse con aspectos gramáticos, semánticos y sintácticos.
    En unos casos, estas ontologías lingüísticas se reducen a una lista jerárquica de términos en un área específica o dominio del conocimiento y en otros, son vocabularios controlados con categorías que incluyen un análisis semántico de palabras para su posterior categorización y enlace con otras, en términos similares a las relaciones propias de los tesauros y mapas conceptuales.

    REFERENCIAS:

No hay comentarios:

Publicar un comentario