¿Aún no comprendes la Web Semántica?

getsemantic_400

Última revisión, Noviembre de 2011
Nota al lector: Si eres de los desarrolladores que has leído y re-leído sobre la Web Semántica y aún te quedan dudas, te invito a que le dediques unos minutos al siguiente artículo.  También ten en cuenta que soy un estudiante de Ingeniería que es muy bueno redactando código más no artículos ;).

Uno de mis profesores en la Universidad nos dijo una vez: “Cuando seas capaz de explicarle un tema a tu mamá y esta lo logre entender, entonces podrás decir con certeza que lo has comprendido”.  No les voy a negar que lo intenté y lo logré fácilmente, por el simple hecho que lo ideal para explicar un tema a una persona que no lo domina es usar analogías, las cuales demuestran que tu mente está ordenada y comprende con facilidad el tema.  Por suerte para ustedes queridos desarrolladores, es más fácil explicarles en que consiste la Web Semántica pues existe una analogía casi directa por así decirlo.  Más sobre esto en breve.

Resulta que todo este rollo nace debido la cantidad desmesurada de datos que existen en la Web actual  (¡Se habla de aproximadamente 500 exabites!).  La información está allí, el conocimiento lo vemos pero los ordenadores no lo comprenden debido en gran parte a los formatos utilizados actualmente para transmitir los datos.  Miremos por ejemplo algunas etiquetas del lenguaje de marcado de hipertextos HTML:

<em> (Lo etiquetado debe ser mostrado con un formato diferente para ser enfatizado)

<big> (Lo etiquetado debe ser mostrado en un tamaño grande)

<b> (Lo etiquetado debe ser mostrado en negrillas)

<sub> (Lo etiquetado debe ser mostrado como un subíndice) 

Esto demuestra que es un lenguaje diseñado para presentar información al ojo humano, como se puede apreciar a continuación:

<p>Bocas Town es un lugar <em>relajante</em> ubicado en la <b>Ciudad de Panamá</b> en el cual prima un <big>clima tropical</big> de unos 80°F.</p>

Para una persona el conocimiento que contiene ese párrafo es obvio, pero para un ordenador ese mismo párrafo significa:

<p>!#$”$%$/)&/(/&%$# <em>!”#%!%#$%</em> !”#$!$%#$%#”%#$” <b>!”#$!”%</b> !”#%#&/$%/#$& <big>#”%#$”%”#$%#%</big> !#”%!$#&/#$/$&%$#”/.</p>

Parece una burla pero es lo que ocurre en realidad al momento de procesar el documento.  Este problema no permite que sea posible realizar búsquedas complejas en los buscadores actuales (Valga la redundancia).  Muchos dirán: “¿Qué acabas de decir? Google es genial y ¡Todo lo que busco lo encuentro con facilidad!”.   Esta afirmación es veraz hasta cierto punto ya que mucho de lo que buscamos está en las primeras 2 o 3 páginas, pero hagamos la siguiente consulta para ver que nos genera:

Lugar de descanso fuera de Colombia que sea cálido y que se hable español

Búsqueda en Google
Lugar de descanso fuera de Colombia que sea cálido y que se hable español – Buscar con Google

Seguro ya estabas pensando en Costa Rica, Panamá, Las Bahamas, etc. pues no, el algoritmo de búsqueda de Google no es tán sofísticado como para responder la pregunta ni aunque esta se pudiera expresar formalmente (Algo como: country!=co, wheather=hot, language=es).  El hecho es que la gran mayoría de la información está disponible a los humanos y no a los ordenadores, por lo cual consultas como esas tienen muy poca cabida en la Web actual.  Eso si, es posible crear algoritmos que puedan hacer este trabajo pero serían desgastantes, solo responderían a un grupo reducido de preguntas y no serían tan efectivos como esperamos.

Mirando esto he aprendido la razón por la cual se imparte historia en la formación académica de un estudiante de secundaria (Una revelación que de mi profesor nunca oí decir y como no, ¡Si me aburría en sus clases!).  La importancia de la historia en nuestras vidas es que nos enseña los errores del pasado para no cometerlos de nuevo en el futuro, gracias a ella se logró descubrir que una variante de este problema ya se había presentado anteriormente, era el caso de lo que hoy se conoce como Base de Datos.

El surgimiento de las Bases de Datos se dio porque la búsqueda de información era muy tediosa y se quedaba corta en muchos casos (Entre otros factores).  Si un empleado quería buscar todos los clientes que en lo corrido del año pasado mantuvieron relaciones comerciales con la empresa y que están comenzando a entrar en bancarrota, se le hacía muy complejo porque había que escribir una aplicación específica para ese propósito o acudir a la búsqueda manual.  La primera solución tomaría cierto tiempo en completarse teniendo en cuenta la forma de almacenamiento y, lo más importante, no sería reusable a menos que se necesite de nuevo esta información u otra muy similar;  La segunda opción es aún peor por ser extenuante y en algunos casos imposible (Si existen miles y miles de clientes que estén en dicha situación).

Debido a esto se comenzó a trabajar en un gestor que se encargara del almacenamiento de la información en Bases de Datos y que a la vez permitiera mecanismos de recuperación de la misma,  habían nacido los DBMS (Sistema de manejo de Bases de Datos por sus siglas en inglés).  Estos para ofrecer flexibilidad al momento de recuperar información, usaron un lenguaje de consulta estructurado (o SQL por sus siglas en inglés) para abarcar casi cualquier consulta que se quiera hacer.  Entonces, supongamos que tenemos una Base de Datos que contiene una tabla “Sitios” que a su vez contiene 4 columnas: “Lugar”, “País”, “Clima” y “Lenguaje”. Con base a esto procedemos a realizar la consulta de arriba:

SELECT Lugar FROM Sitios WHERE Pais<>”Colombia” AND Clima=”Caliente” AND Lenguaje=”Español”;

Listo, ya tenemos nuestra lista de lugares deseados para vacaciones ¿No sería genial que el internet operara de la misma manera?  Muchos objetarán diciendo que esa Web solo será usada por expertos, pero hay que tener en cuenta que les estoy proponiendo una analogía, miren lo que Google ha logrado con una intervención mínima de los usuarios, ¿Qué tan lejos llegará con más información al servicio de sus máquinas? Les dejo el interrogante abierto.

Amigos míos esto se está volviendo una realidad.  Los nuevos estándares para trabajar con la Web Semántica están encaminados a llenar de conocimiento a esta Base de Datos mundial.  Primero tenemos a RDF que vendría siendo el candidato ideal para agregar datos con algo de semántica, luego procedemos a añadir ontologías (OWL) que permitan un enriquecimiento semántico mucho mayor y más completo, y luego cuando dispongamos nuestra Base de Datos, finalmente consultaremos la información ya sea con una aplicación especializada o usando SPARQL (El SQL de la Web Semántica).  Cabe resaltar que estas no son las únicas tecnologías, existe un racimo de estas las cuales dejo a su investigación.

La intención de este artículo no fue dar detalles muy técnicos de como trabaja la Web Semántica, sino explicar en que consiste y por qué será una tecnología muy importante en el futuro.  Así como se habla de Cloud Computing, se debería comenzar a hablar de Web Semántica ya que esta marcará un hito muy importante en el uso del internet tal y como hoy lo conocemos.  Recuerden, el conocimiento está allí, solo falta hacer que los computadores puedan verlo.

Por último, les recomiendo el siguiente tutorial para iniciar a trabajar.

¡Comencemos a Semantizar la Web!

Anuncios

4 Comentarios Agrega el tuyo

  1. Nancy dice:

    Gracias 😀

  2. pablofing2013 dice:

    La verdad muy buena la analogía. Muchas gracias por dar el puntapié hacia una investigación mas fuerte.
    Saludos.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s