1. Introducción

Las ontologías son el intento por parte de las ciencias de la información de formalizar y manipular el conocimiento. Así pues, vamos a ubicarlas dentro de la pirámide del conocimiento y saber un poco el papel de la informática en ellas.

 

2. La pirámide del conocimiento

Las pirámide del conocimiento, también conocida la DIKW hierarchy o jerarquía datos-información-conocimiento-sabiduría (jerarquía DICS, en español) [1] es una representación de las relaciones entre los datos, la información, el conocimiento y la sabiduría. Cada una de las capas representa un nivel más de complejidad, siendo los datos el elemento más simple y la sabiduría el más complejo.

                     
Figura 1. Pirámide http://matrixcpmsolutions.com/la-conciencia-del-dato

Cada ‘capa’ está relacionada con la inferior y la superior, de modo que la complejidad aumenta a medida que se sube. Así pues, el dato es la unidad mínima de representación. Un dato sería por ejemplo 3, 7 o 18 o SA. Por sí solo no tiene significado, pero en cuanto se contextualiza se convierte en información. Siguiendo el ejemplo anterior, 3 podría ser la cantidad de barras de pan compradas, 7 los días de la semana, 18 la edad de una persona y SA las siglas de Sociedad Anónima. En este momento el mero dato constituye información. La contextualización trae consigo la categorización y un sentido semántico al dato.

El conocimiento, la siguiente capa, implica la agrupación de información a fin de generar conocimiento. Es más, el conocimiento no está implícito en la información, sino que nace de la combinación de esta. Finalmente la sabiduría es un proceso similar al del conocimiento. Éste nace de la agrupación de diferentes conocimientos y, al igual, la sabiduría, no está implícita. Por ello, tanto la generación de conocimiento como de la sabiduría son producto de unos procesos todavía hoy muy poco comprendidos.

 

3. La Informática y los datos

Las bases de datos ‘tradicionales’, en el entorno informático, están especializadas en el almacenamiento, recuperación y tratamiento de datos. Así, bajo este prisma, una base de datos es un conjunto de programas que guarda un conjunto de datos, generalmente en discos, y que permite una recuperación rápida de los datos y de conjuntos de datos relacionados entre ellos. Si por ejemplo se ‘guarda’ el dni de una persona por un lado y su profesión por otro lado, el sistema puede presentar fácilmente la profesión de esa persona junto con los datos de dni. La base de datos sólo retorna datos, y es la persona que gestiona los datos la que lo interpreta como información. Siguiendo el ejemplo anterior, la base de datos podría presentar los datos del dni de una persona asociado a los días que ha llovido en el año 2013. Es una operación posible en una base de datos, pero carente de sentido como información. Así pues, la persona o personas que gestionan los datos saben lo que constituye información. La base de datos no tiene la capacidad de ‘saber’ lo que constituye o no información. Ella maneja de una manera ‘mecánica’ estos datos. Por todo ello, el proceso de relación entre esos datos y su interpretación como información, está realizada por y para personas.

 

4. Las ontologías o cómo representar, almacenar y tratar el conocimiento.

En base a la pirámide de conocimiento, la disciplina de la informática, poco a poco, va escalando. De modo que para trabajar con conocimiento, el primer problema es la representación y su modelado. Existen muchas representaciones del conocimiento como por ejemplo la representación formal de conceptos, los mapas conceptuales, los mapas mentales o las aproximaciones orientadas a objetos [2].

 

Figura 2. Mapa mental. https://www.mindmeister.com/es/103970589/la-literatura-renacentista

Figura 3. Mapa conceptual. https://blogs.kcl.ac.uk/aflkings/students-directing-their-own-learning/concept-mapping/

 

Una ontología según Gruber,[3] y que se ha convertido en la definición aceptada, constituye “una especificación formal de una conceptualización”. Bajo un punto de vista informático, se trata de un modelo abstracto del que se identifican y relacionan los conceptos. Para ello se necesita un lenguaje de representación formalizado y compartido *para poder comunicarse y entender bien el proyecto los distintos agentes en él involucrados, por ejemplo, humanistas de diferentes especialidades, informáticos, y muy diversos profesionales.

[1] R. Gruber. Towards principles for the design of ontologies used for knowl-edge sharing. In N. Guarino and R. Poli, editors,Formal Ontology in Con-ceptual Analysis and Knowledge Representation. Kluwer Academic Publishers, Deventer, The Netherlands, 1993.

 

Ello pone de relieve dos elementos, los conceptos y sus relaciones. Como resultado, las bases de conocimiento (en ingles KB o Knowledge Base) parten de un enfoque con estos elementos a diferencia de las bases de datos que parten de un enfoque sobre los datos y la información. Asimismo, los programas y lenguajes que tratan las ontologías se basan en reglas y las relaciones sobre los conceptos. Estamos, pues, ante un nuevo paradigma de programación y tratamiento de conocimiento.

 

5. La Informática y la pirámide de conocimiento

Las bases de datos y las ontologías tienen una clara relación con la pirámide del conocimiento, tal y como se puede ver la figura 2. Si las bases de datos ‘tradicionales’ significan la intersección entre los datos y la información, las ontologías lo son de la intersección de la información y el conocimiento.

 

Figura 4. Pirámide del conocimiento y su relación con las ontologías y bases de datos.

 

6. El futuro. Ontologías y Humanidades Digitales

El futuro va a significar por un lado la consolidación de las ontologías y las bases de datos de conocimientos y por otro abordar por parte de las ciencias de Informática los sistemas orientados al conocimiento y la sabiduría. Las ontologías, por lo tanto, constituyen una apuesta clara y su consolidación una nueva herramienta para las Humanidades, y en especial las Humanidades Digitales.

 

7. Conclusiones

Las ontologías son todavía un campo incipiente en las ciencias de la computación, pero constituyen un área muy prometedora porque el conocimiento es muy amplio y diversificado. La representación y manipulación del conocimiento así como la creación de nuevo conocimiento a partir de información y conocimientos existentes se vislumbra como un gran cambio dentro las Humanidades Digitales.

 

*Miquel Colobran Huguet es doctor en Ingeniería Informática especializado en Ontologías. Es profesor en el Máster de Humanidades y Patrimonio Digitales de la Universitat Autònoma de Barcelona y la Universitat Pompeu Fabra.

email: miquel.colobran@uab.cat

 

 

 

 

[1] Rowley, Jennifer (2007). «The wisdom hierarchy: representations of the DIKW hierarchy». Journal of Information Science 33 (2): 163-180. doi:10.1177/0165551506070706.

[2] Colobran Huguet, M “A general-purpose security framework”, Ph.D. thesis, Universitat Autònoma De Barcelona, September 2015.

[3] R. Gruber. Towards principles for the design of ontologies used for knowledge sharing. In N. Guarino and R. Poli, editors,Formal Ontology in Con-ceptual Analysis and Knowledge Representation. Kluwer Academic Publishers, Deventer, The Netherlands, 1993.