Web semántica, todo gira alrededor de la Web 3.0, una nueva manera de expresar y consumir datos de forma comprensible para las máquinas, ahora podemos explicarle inequívocamente a la máquina lo que está leyendo, darle significado.

Entradas

Dublin Core y MetaTag DCSext

Dublin Core - Web Semántica

Parece Dublin Core

Si estas puest@ en temas de Web Semántica puede que si encuentras código fuente como el de la muestra lo asocies rápidamente a metadatos expresados mediante el estándar definido por el Dublin Core. Si te suena haber visto por ahí esos metatags cuyo nombre comienza por “DC.” tal vez no debas asumir rápidamente el Dublin Core, posiblemente te confundas…

Estos metatags no son Dublin Core

<meta name="DCSext.wtg_brand" content="XXXXXX" /
<meta name="DCSext.wtg_country" content="ES" />
<meta name="DCSext.wtg_lang" content="es" />
<meta name="DCSext.wtg_bsector" content="XXX" />
<meta name="DCSext.wtg_division" content="XX" />
<meta name="DCSext.wtg_bu" content="XXX" />

¿Qué es el Metatag DCSext?

Lo que acabas de ver son parámetros de consulta de un conocido sistema de seguimiento, medida y analítica web

Web Trends

La etiqueta de Webtrends rastrea el código fuente de la página buscando META tags donde encontrar parámetros de consulta conocidos de Webtrends para añadir los datos recogidos. Por defecto Webtrends sólo reconoce los parametros de consulta nativos y reservados prefijados por los separadores de Namespace “WT.” y “DCS.” y seguidos por su nombre específico de parametro, por ejemplo WT.ti y DCS.dcsuri.

Cosas prácticas relacionadas con Webtrends

 

Google Hummingbird | Análisis detallado de búsqueda semántica y su papel en el algoritmo Colibrí

Google Hummingbird o "Colibrí" es el nombre del último y gran cambio en su algoritmo de búsqueda

Traducción y adaptación al Español del original en Inglés por Joydeep Bhattacharya 30 de octubre 2013

Google ha puesto en marcha la búsqueda semántica en su algoritmo principal por la reciente introducción de Hummingbird. Este es un cambio extraordinario y uno de los más grandes tras Caffeine. Muchos webmasters y comerciantes de Internet todavía sienten cierta confusión respecto a esta nueva tecnología. En este post, voy a tratar de aclarar esta confusión explicando la búsqueda semántica y cómo Google implementa la semántica para predecir la intención buscadores con el fin de mostrar los resultados o devolver respuestas basadas en ellos.

¿Qué es la semántica ?

Semántica implica la búsqueda de la relación entre palabras, frases, símbolos y el significado que conllevan. Implica además el estudio de la lingüística, la sintaxis, la etimología, la comunicación, la semiótica, etc.

La búsqueda semántica

La búsqueda semántica consiste en el estudio y la aplicación de la semántica en la tecnología de búsqueda con el fin de averiguar la verdadera intención que se oculta tras la consulta de búsqueda del usuario y la presentación de las respuestas o un conjunto de resultados que se relaciona estrechamente con lo que el usuario está buscando. Tiene en cuenta la importancia del contexto e identifica una relación adecuada entre los términos utilizados en la consulta de búsqueda antes de presentar los resultados de la búsqueda final.

¿De dónde se aplica ?

Los motores de búsqueda utilizan la semántica para devolver resultados relevantes a la consulta. Consultas ambiguas (aquellas consultas que tienen más de un significado) se descomponen y se procesan a través de un conjunto de palabras predefinidas que ayudan a los motores de comprender el contexto real de la consulta. El uso de la semántica se aplica en las consultas relacionadas con la investigación en que el usuario está buscando respuestas en lugar de navegar a una página web específica. Google aplica la semántica en su Knowledge Graph.

Page Rank y la Relevance Score dos factores básicos para la clasificación de documentos

Google aplica dos factores básicos para juzgar la importancia y relevancia de cualquier página web antes de clasificarlos. Estos factores son el Page Rank ( para medir la popularidad mediante el análisis de la relación con el entorno de los vínculos) y la relevancia (mediante el análisis del uso de palabras clave o buscar términos de consulta utilizados en la página web). Sin embargo, esta forma de clasificación de documentos no ayuda a encontrar esas páginas que pueden ser de interés para la intención de los investigadores (léase “usuarios”) ya que el factor de popularidad puede reducir la clasificación de documentos semánticamente pertinentes. Esta es la razón por la que Google utiliza la semántica para identificar y priorizar los rankings de páginas que tienen contenido semánticamente relevante y no sólo basándose en contar las palabras clave y enlaces entrantes para el análisis de cualquier página web.

Procesar una consulta en un entorno semántico

En la figura siguiente se describen los pasos a seguir en el proceso de la consulta por parte de Google. La consulta de búsqueda que recibe Google se analiza para identificar uno o más miembros (primer y segundo términos de búsqueda). En este proceso consigue identificar sinónimos u otros términos de sustitución. Los sinónimos son conocidos como sinónimos candidatos y aún se descomponen y se procesan como sinónimos calificados. Entonces un motor de relación se utiliza para identificar la relación entre los miembros sobre la base de sus respectivos dominios. Aquí un dominio simplemente es una categoría central de palabras similares (los conocidos como keyword clusters). En primer término de búsqueda queda identificado por el primer dominio que es una categoría semántica que tiene una colección de entidades predefinidas. Del mismo modo, el segundo término queda identificado por un segundo dominio que contiene también una base de datos de entidades similares. Esto ayuda a Google a relacionar los términos con las identidades que resulten más cercanas (un punto fundamental a tener en cuenta aquí es que Google sólo encontrará y relacionará palabras en la consulta con los ya presentes en su base de datos , que es la gráfica del conocimiento o Knowledge Graph, por lo tanto, algunas consultas, aunque semánticamente similares podrían no aparecer). Una búsqueda separada queda a cargo de un motor de consulta con relación de coincidencia de dominio (no confundir con el dominio de la palabra con el “nombre de dominio”, aquí “dominio” significa “categoría”) y el resultado final queda mostrado después de que se identifica una consulta semántica (el motor de búsqueda puede pluralizar o reformular la consulta si es necesario). Por lo tanto, en palabras simples, una consulta compleja introducida por el usuario se descompone y se simplifica con la participación de varios procesos en búsqueda semántica. A partir de entonces , las páginas web de interés se identifican y se muestran como un conjunto final de resultados.

Muchos SEOs y Marketeers en Internet a menudo pierden la parte crucial de la identificación de las consultas relacionadas semánticamente al hacer investigación de palabras clave, porque la consulta principal se descompone en consulta semántica antes de ser procesado por Google. Por lo tanto, aumenta la probabilidad de clasificación cuando el contenido de la página web está escrito teniendo en mente las variantes semánticas que contemplan todas las entidades que coincidan con dominios específicos (Nota de traducción/aclaración: usar familias de significado cercano, transversalidad, en vez de repeticiones verticales de keywords).

Colibrí y la semántica

Hummingbird es un cambio en el algoritmo de búsqueda que utiliza varios factores que ayuda a iniciar la conversación con el buscador y proporciona respuestas reales a las consultas en lugar de devolver documentos que corresponden a la palabra clave. Este es el sueño del Googler Amit Singhal ( vicepresidente senior y director de Búsqueda de Google), que quería construir un motor de búsqueda en plan Star Trek que devuelve respuestas directas a los usuarios para que Google puede ser utilizado como un asistente personal en lugar de un motor de búsqueda. En sus palabras, el destino de la búsqueda es llegar a ser el equipamiento de Star Trek, un asistente perfecto al tu lado. Hummingbird tiene que ver con la conversación y las consultas long tail suelen participar en la conversación. Además, durante la conversación que incluya una o más entidades y aquí es donde Knowledge Graph y la semántica entran. El punto crucial es que Google ha adaptado su algoritmo de búsqueda para manejar consultas complejas y conversacionales introducidas por el usuario. Se ha utilizado la semántica y el Graph para llegar a un conocimiento mucho más profundo de lo que se ha utilizado en el pasado. Como he mencionado antes, no hay que clasificar Hummingbird como factor de clasificación, es un cambio para mejor comprensión de una consulta de búsqueda. Las señales de clasificación documental siguen siendo los mismos Panda , Penguin , etc, que son todos partes del algoritmo principal, que ahora es el colibrí. Factores como la Autoridad de dominio, Page Rank, popularidad social, la relevancia global de contenido, Tf -IDF Score (del inglés Term frequency – Inverse document frequency en relación, no sudes, mira en Wikipedia), la edad del dominio, Google Authorship, uso de MetaData etc todo contribuye a la clasificación de un documento específico. Pero, sin duda podemos utilizar este nuevo modelo para adaptar nuestro contenido existente adaptado a la forma en que una consulta resulta analizada e identificada.

Como se muestra en el siguiente ejemplo, una consulta de conversación como ¿Cuántos años tiene Justin Bieber? devuelve una respuesta directa junto a un gráfico del Conocimiento. En este caso, Justin Bieber es una entidad que Google ha identificado con la ayuda del gráfico de Conocimiento (Knowledge Graph) y predijo con exactitud la respuesta para la consulta del usuario.

Consulta basada en preguntas conversacionales en vez de cadenas de texto específicas

Consulta semántica conversacional, el usuario pregunta en vez de proponer una cadena de texto como consulta.

Hummingbird tiene en cuenta la semántica e identifica la relación entre las consultas de búsqueda que tienen la ayuda de Knowledge Graph antes de presentar los resultados de la búsqueda. Un buen punto a destacar aquí es que la semántica no es nueva para Google y el gigantesco motor de búsqueda ha estado utilizando la semántica por un tiempo bastante largo, pero faltaba una base de datos detallada de la relación de Entidades que podrían ayudar a facilitar la identificación de las entidades. Después de la introducción de la gráfica de conocimiento el 16 de Mayo 2012, Google ya pudo decir que había añadido esa base de datos de Entidades que podría resolver rápidamente el problema de encontrar relación entre las entidades. Por lo tanto, Hummingbird basado en el Knowledge Graph es el nuevo modelo semántico de Google.

 

,

Web semántica: extracción de datos con SPARQL

Web Semantica

De la Web de Contenido a la Web del Conocimiento

Web semántica: SPARQL Cheatsheet para desarrolladores

La Web semántica acumula datos sin parar, esta presentación muestra como extraer datos mediante consultas SPARQL y ofrece fuentes de estudio.

[slideshare id=1589776&doc=sparql-cheat-sheet-090616011306-phpapp01]

Este tipo de datos debería enriquecer todos los proyectos web ya que en pocos años el consumo de datos semánticos será un nicho importante en el mercado de búsqueda. Mis amigos de eData y un servidor así lo entendemos y hemos desarrollado un CMS SEO semántico, cargadito de cosas interesantes además de ser coherente, mantener la integridad de los datos y su capacidad multiidioma.

,

Consultoría SEO | Resumen semanal SEO 3 Octubre 2012

Notas útiles y recordatorios que dejo en mi actividad de consultoría SEO

Este es el resumen del 3 de Octubre de 2012 de SEO Freelance España, consultoría SEO basada en Barcelona con alcance y proyectos internacionales. como cuesta tiempo estar al día en todo lo que ocurre en Internet aprovecho a compartir mis bookmarks y feeds de interés, hoy hay 8 lecturas que te pueden resultar útiles:

generic (feed #3)
twitter (feed #2)
#FF en Jueves para @seoanel84, mañana no podría y vale la pena para ampliar campo http://t.co/BePgMYrN
twitter (feed #2)
Record Manager… el futuro del documentalista http://t.co/B3yilDO5
generic (feed #3)
twitter (feed #2)
Exact-Match-Domains, otro retortijón de Google: EMD algo via SEOmoz http://t.co/5ILEsoio
generic (feed #3)
twitter (feed #2)
No te olvides de #Microsoft, tal vez no sean “cool” pero son “big”: ahí va una perla http://t.co/nTmectRg #herramientas #toolset
twitter (feed #2)
+1 @Nikalytics porqué secuestran? Relativamente habitual! Y dar acceso a Analytics o WMT? (Si paga) ES DEL CLIENTE

 

Ricard Menor consultoria SEO

Tests

Rich Snippets | Test Microdatos Schema.org | Rich Snippets Test 4682

Test Rich Snippets 4682

Ecommerce Sillas de oficina – Estado: Éxito

Rich Snippet conseguido en este test (según Google Structured Data Testing Tool)

Rich Snippet conseguido en este test (según Google Structured Data Testing Tool)

Prueba de implementación de Rich Snippets para el producto Silla de Oficina
la cual tiene las siguientes características:

Puntuación de 4 sobre 5 basada en 11 opiniones
Este producto cuesta 224.10€ y en este momento se encuentra Disponible

Sillas de Oficina DETROIT 1 color Negro y asiento tapizado símil piel, base de aluminio pulido, respaldo alto de malla transpirable, silla basculante, VIDEO DISPONIBLE.

  • Estructura de aluminio pulido
  • Asiento tapizado símil piel

Respaldo alto de malla

  • Mecanismo basculante anti-retorno
  • Base de aluminio
  • Ruedas rodadura blanda para entarimados
  • Colores: blanco y negro

Disponemos de gran variedad de ruedas a combinar con la silla direccional (ruedas de nylon por defecto), topes fijos, parquet, cromadas, cromadas para parquet y modelo G para parquet. Ver en imágenes adicionales.

Por último les animamos a que consulten el resto de nuestro mobiliario de oficina ya que podrán encontrar en nuestra web gran cantidad de modelos de sillas para oficina en diferentes telas, colores, sillas de cuero, sillas de madera, sillas de polipropileno, sillas de goma integral, sillas juveniles, sillas plegables, sillones de dirección, bancadas, sofás, taburetes, mesas,etc.

Video demostración Silla Dirección DETROIT 1
Esta prueba se ha realizado sobre una silla de oficina de Dirección en el ecommerce silleria-oficina.com
ANEXO
A fecha de 6 de Agosto 2013 este test ya ha sido indexado y el resultado concuerda con la prueba:
Rich Snippets test 4682, resultados SERP

Resultados del test Rich Snippets en SERP