La Web 3.0 o Web Semántica

Web semántica es uno de los sinónimos que se aplica al futuro de la web, la web 3.0. Ya hablábamos de ello cuando días atrás intentábamos vislumbrar las tendencias que moverían la web en 2008. Fue también el objetivo hacia el cual Tim Berners-Lee, James Hendler y Ora Lassila importantes ideólogos fundadores de la red, creían que debía dirigirse cuando la pensaron (The semantic web.) (Tenéis en un post anterior: La web3.0 será un nuevo dios) una visión mucho más filosófica del tema.

A diferencia de la web2.0, impulsada por el capitalismo que se le adelantó y quizás con cierto retraso debido precisamente a estar menos vinculada a objetivos de mercantilización, la web semántica parece estar siguiendo sus lentos pasos hacia la utopía de la información universal organizada.

Es una carrera lenta y no podemos aconsejar hoy en día una herramienta que nos permita de forma unívoca adaptar nuestros blogs a los buscadores semánticos, que parece que serán los reyes en un futuro (Hackia, Wikiasearch o el importante Yahoo, que anunciaba recientemente la incorporación de este tipo de mecanismos a sus búsquedas).

Ha habido intentos anteriores de sentar e implantar las bases de tal organización: el fracaso en la extensión de ontologías dio lugar a los microformatos, pequeños bloques en las que se aporta semántica a lo publicado, atajos a la web semántica aún vigentes.

Pero el objetivo es mucho más ambicioso. Google y sus algoritmos no bastan. Me ha ayudado a entender todo esto, precisamente, un ejemplo en Logicola:

Existe una extensión de la wikipedia, la Dbpedia, cuyo lenguaje, de los más prometedores, se denomina RDF(más referencias al final del artículo).

Podemos hacerle preguntas como esta: jugadores de futbol que llevan el número 11, juegan en un equipo con un estadio de más de 40000 espectadores y han nacido en un país con más de 10 millones de habitantes.

Imaginemos el potencial de poder realizar consultas tan afinadas como esta a toda la www.

Las herramientas típicas de la web2.0 han dado pasos en ese sentido, desde el que acabamos de ver para la wikipedia hasta el mucho más significativo de los blogs, fuente importante de marcado en el sentido de permitirnos, mediante metadatos asociados a cosas como las categorías temáticas, etiquetas y demás elementos relacionales (comentarios, blogroll, mecanismos de enlace mutuo como los pingbacks y los trackbacks o retroenlaces, RSS ), saber cual es, cuando y con quien la información que compartimos.

Ese el valor de la iniciativa de la Universidad de Leipzig que quería presentaros: Triplify, especialmente dirigida al mundo de los cms, a la unificación de la información existente en las tablas de cualquier CMS open source (los que estén escritos, de momento en PHP, como es el caso para la mayoría de los blogs):

Lo que hace, por resumir de forma clara sus funciones, es, en base a las definiciones de la base de datos relacional de aplicaciones web específicas (Wordpress, Openconf, Drupal, Wackowiki, Openjournal, etc…) convertir los resultados de las consultas a lenguajes de estandarización propios de la web semántica, como RDF, JSON o Linked Data. La idea es que, para la mayoría de aplicaciones, un número relativamente pequeño de consultas (entre 3 y 7) es suficiente para extraer la información más relevante. Esto convierte, mediante el software de Triplify, los datos en accesibles para buscadores y recursos semánticos.

El gráfico que acompaña el lanzamiento de Triplify es el que mejor me ha ayudado a comprender la web semántica.

*No os aconsejo, de momento, su instalación. Prevén el lanzamiento de su primera versión pública (que tal vez soluciones los problemas con la privacidad de los que alertan) en breve.

Estaremos alerta…pero mientras y para terminar (disculpad lo denso del post), os dejo algunos recursos explicativos y aplicaciones adicionales:

Otras aplicaciones:

Podíamos leer hace poco en ReadWriteWeb sobre la ausencia de herramientas prácticas aún sobre la web semántica. En otros casos (Anieto2k recoge hasta 557, Readwriteweb se queda en 10) listan infinidad de herramientas, de momento parciales y discutibles.

Dapper es otra de las últimas propuestas, de carácter visual pero bastante discutida, desde cuyos comentarios críticos he podido acceder a algunos consejos parciales más sobre optimización de nuestros espacios para ser amigables a los buscadores semánticos:

Xmlgrddl, sistema opensource que genera salidas de tipo RDF desde páginas HTML. Con el comentado, parece ser de los más prometedores.
Para Wordpress: Cómo convertir tags a semánticos en tu blog
Twine, herramienta para microformatos (en estado beta, hablaremos en próximos posts de ella)

Otros Recursos explicativos: