Desde que instalé el plugin Simple Tags, he estado trabajando denodadamente en gestionar, ordenar y proporcionar la necesaria coherencia al conjunto de etiquetas del blog. La empresa no es fácil, porque, como señalé en el artículo del pasado lunes, tenía algo más de 1.000 etiquetas para sus más de cuatrocientas cincuenta entradas. En estos últimos días, he estado enfrascado en diversas operaciones de limpieza, pero todavía estoy lejos de poder afirmar que he concluido mi labor.
No tengo ninguna duda de que la gestión de las etiquetas del blog es una tarea cuya trascendencia va mucho más allá de la instalación y configuración del plugin Simple Tags (o de cualquiera de sus equivalentes), y del manejo de sus diversas funciones, independientemente de cuán avanzadas sean. En efecto, un conjunto de marcadores semánticos organizado y sistemático, coherente consigo mismo y con el conjunto de las categorías temáticas del blog proporciona información relevante a los visitantes, garantiza una buena posición en los buscadores y otorga a la bitácora una solidez y compacidad sumamente deseables.
El problema es que un blog como el mío, bastante disperso en temática, tiende todavía a dispersarse más si a la variable de la organización del contenido se añade la variable de duración en el tiempo. Al repasar el conjunto de mis etiquetas, me he dado cuenta de que mis criterios han cambiado a lo largo de la historia del blog, pero es que además no han sido pocas las ocasiones en que he ignorado mis propias decisiones o, simplemente, me he olvidado de ellas. El resultado es un conjunto de etiquetas demasiado grande, difícil de manejar, de rentabilidad dudosa y que origina problemas de rendimiento en el blog, a causa del tiempo empleado por el sistema en realizar las consultas a la base de datos.
Por eso considero que puede ser de interés proporcionar algunas orientaciones o puntos de reflexión a quienes mantienen sistemas de etiquetado semántico o a quienes están pensando en la conveniencia de ponerlos en práctica. Para evitar malentendidos, quiero aclarar que mis recomendaciones no tienen ninguna pretensión de universalidad y nacen de una experiencia empírica relativamente limitada, así que sólo tienen la validez que cada cual quiera concederles:
- Mantener el menor número de etiquetas posible y, en todo caso, mantener un número de etiquetas manejable. La relación entre número de etiquetas de mi blog y número de entradas (casi de 3 a 1 antes de comenzar la cura de adelgazamiento; en el momento de escribir este artículo la cifra asciende a 912 etiquetas) indica una clara dispersión temática, un contenido demasiado variado y un etiquetado excesivamente minucioso.
- Mantener al mínimo las etiquetas aplicables a una sola entrada del blog. Yo he incumplido clamorosamente esta norma, pues alrededor de 650 de las algo más de 900 etiquetas del blog sólo corresponden a una única entrada, y sólo 20 están asignadas a 10 o más de entre ellas. Puedo aducir como disculpa que yo suelo adjudicar etiquetas individuales a cada uno de los autores, libros, películas y plugins de los que me ocupo, y que esa decisión permite que mi bitácora ocupe buenos resultados en los buscadores para una amplia variedad de criterios de búsqueda. No obstante, estoy casi seguro de que antes o después tendré que replantearme la decisión, no sólo por los problemas de rendimiento de la base de datos, sino por la imposibilidad material de controlar semejante diversidad conceptual.
- Adoptar un criterio sólido, y bien fundado, respecto a la relación entre la precisión de la designación y la amplitud semántica de cada etiqueta. La pregunta «¿cuán precisa debe ser la amplitud semántica de las etiquetas de un blog?» no puede tener una única respuesta, pues hay un gran número de aspectos (variedad temática, nivel de especialización, resultados que se desean conseguir por parte de los buscadores, posible rentabilidad de la publicidad contextual) que es preciso tener en cuenta para determinarla. Ahora bien, conviene que el autor o autora de un blog haya meditado sobre este punto antes de ponerse a etiquetar sus entradas.
- Evitar la sinonimia y los solapamientos de sentido entre etiquetas diversas. Por ejemplo, a no ser que la mínima diferencia en sus respectivas designaciones se justifique por un planteamiento técnico del blog, no tiene sentido mantener las etiquetas «redes inalámbricas» y «WiFi» (he optado por la segunda), cuyos referentes son en la práctica la misma realidad. Digo lo mismo respecto a la colisión entre conceptos semánticamente solapables, como los de «bitácoras educativas», «blogs educativos» y «blogosfera educativa«, que es el que en última instancia he preferido mantener.
- Evitar las taxonomías y las listas si unas y otras no son rentables. Por ejemplo, yo venía etiquetando las entradas dedicadas a la actualización de las versiones de WordPress con una larguísima lista de etiquetas del tipo «WordPress 2.2.1», «WordPress 2.2.2», etc. Creo que todos estos casos se pueden subsumir perfectamente en uno más amplio, denominado «versiones de WordPress«, que se complementa, a su vez, con la etiqueta actualizaciones.
- Evitar los conceptos cuyo ámbito de designación es excesivamente preciso, y optar por denominaciones más generales. Hasta hace dos días el blog contenía etiquetas como «el yo en los blogs», «el tú en los blogs», «construcción del yo en los blogs», «construcción del tú en los blogs», «enunciatario en los blogs», etc. Todos ellos han ido a parar a un cajón de sastre titulado poética del blog (con el reconocimiento, claro está, a José María González Serna y otros ilustres colegas blogueros, de quienes he tomado prestado el concepto). De todas formas, tengo que admitir que mi fuerte no es la coherencia, pues signo manteniendo una enorme colección de etiquetas con términos como novela de ciencia ficción, cine español, cine norteamericano, novela policíaca, etc., por no hablar de las etiquetas para cada uno de los cineastas y escritores cuyas obras he comentado.
- Suprimir las etiquetas total o parcialmente coincidentes con las categorías temáticas del blog. Mantenerlas es una redundancia tanto desde el punto de vista de la coherencia del etiquetado semántico como de la propia estructura interna de WordPress, pues, como es sabido, a partir de la versión 2.3 se unificó el tratamiento de los términos correspondientes a etiquetas y categorías temáticas mediante un sistema de taxonomía semántica organizado en torno a las tablas wp_terms, wp_term_taxonomy y wp_term_relationships. Recuérdese que, para el caso de que el blog contenga categorías escasamente pobladas, siempre existe la posibilidad de utilizar el Convertidor de categorías a etiquetas, función a la que se accede desde el menú Administrar > Importar.
- Unificar las categorías gramaticales y velar por la ortografía de las etiquetas. No tiene sentido que haya etiquetas en singular y en plural para la misma realidad (por ejemplo, pares del tipo plugin/plugins; como suele hacerse cuando se normalizan las bases de datos, es preferible el plural). Tampoco parece apropiado que comiencen por mayúscula las etiquetas que corresponden a conceptos abstractos y los nombres comunes (en vez de «Recursos didácticos para Lengua y Literatura» es preferible recursos didácticos para Lengua y Literatura), pero sí las que coinciden con nombres propios.
- Aprovechar las etiquetas para establecer en el interior del blog relaciones semánticas provechosas. Yo he utilizado el plugin Simple Tags para disponer, bajo cada uno de los artículos, la típica lista de «entradas relacionadas», pero de la lectura de la extensa documentación que acompaña a este complemento me ha quedado claro que hay infinitas posibilidades: diversos tipos de nubes de etiquetas, etiquetado de páginas estáticas (muy útil si se va a utilizar WordPress para un portal al estilo clásico), listas de etiquetas con formatos especiales para facilitar la navegación entre elementos de contenido, combinaciones de etiquetas basadas en parámetros booleanos, etc.
Claro está que, por más cuidadoso que sea el autor de un blog con el manejo de las etiquetas, no todo en la administración de su bitácora se reduce a tener criterios claros de etiquetado semántico y a ponerlos en práctica de forma sistemática y eficaz. También se requiere que el blog sea capaz de aprovechar el etiquetado de forma eficiente, en especial de cara al subterráneo trabajo de los buscadores. En este sentido, existen magníficas herramientas a disposición de los blogueros que utilizan WordPress, como el plugin Google (XML) Sitemaps Generator, responsable de generar un completísimo fichero sitemap.xml que contiene lo que podríamos llamar «mapa conceptual del blog», en forma de lista de URLs. En ella se incluyen no sólo las referencias a todas y cada una de sus entradas y páginas, sino también los enlaces permanentes que apuntan a las categorías, los autores, las etiquetas y otros posibles criterios de clasificación.
Para que sirva como indicio de la importancia que el etiquetado tiene a efectos de la generación de una potente red de relaciones semánticas en el interior de un blog, baste decir que en el momento de redactar este artículo, La Bitácora del Tigre cuenta con 452 entradas y 12 páginas publicadas, a las que corresponde un fichero sitemap.xml de unas 1.460 líneas. Dicho de otro modo: las etiquetas proporcionan al mapa del blog unas 900 URLs adicionales, sobre las que Google y demás buscadores capaces de leer el mencionado fichero se lanzan con avidez. Que mi blog esté a punto de reventar por sus costuras a causa de semejante aluvión de enlaces es harina de otro costal.
Queda para un tercer artículo de esta serie la dimensión didáctica del etiquetado, de la que he comenzado a ser consciente a lo largo de los trabajos de limpieza y homogeneización que he venido realizando desde la instalación del plugin Simple Tags. A lo largo de los próximos días, tengo intención de explorar estas posibilidades en un artículo que seguramente resultará de interés (aunque es posible que también un poco árido) para mis compañeros y compañeras de Lengua y Literatura: algo así como «el estudio de las relaciones semánticas a partir de las etiquetas de un blog».
También he imaginado una cuarta entrega, dedicada al análisis de las mutuas implicaciones entre el etiquetado del blog y la estadística de visitas y visitantes. Pero, a decir verdad, soy demasiado perezoso (y me faltan conocimientos de estadística aplicada) para meterme a fondo en ese jardín. Anteayer, repasando los resultados de mi cuenta de Google Analytics, vi datos interesantísimos sobre el particular, pero también me di cuenta de que su interpretación es un trabajo de chinos, dicho sea con todos los respetos a los habitantes de ese inmenso y cada vez más próspero país.
adverick dice
Saludos. Muchas gracias por la entrada, plantea muchas consideraciones interesantes, y si se quiere, un amplio campo de investigación relacionado con los contenidos semánticos de la blogosfera. Ojalá algún día dejes (dejemos mejor dicho) la pereza y empecemos a explorar.
Eduardo Larequi dice
Creo que me va a poder la pereza, adverick… Además, me falta base, como dirían los alumnos, para emprender este tipo de investigaciones. En todo caso, gracias por pasarte por aquí.