¿Necesitas inspiración para seleccionar las palabras clave adecuadas? Entonces has llegado al sitio adecuado. TF*IDF es una funcionalidad que han desarrollado los amigos de OnPage.org . Hoy te contamos cómo esta herramienta única puede ayudarte con tu búsqueda de Keywords.
Optimiza tu tiempo no sólo tu web
El contenido continúa siendo el Rey, como ya se ha dicho en miles de ocasiones, pero el proceso de optimización de contenidos para buscadores evoluciona muy rápido, con los cambios algorítmicos del «maravilloso Zoo que tiene montado Google» y con la profesionalización de la competencia. Cada vez son más los negocios online que apuestan por estrategias de SEO.
Entonces, ¿cómo hago para crear un contenido único y relevante para el usuario y para los buscadores? ¿Cómo puedo lograr posicionarme por encima de mi competencia? Comencemos por el principio: entendiendo cómo funcionan los buscadores…
Cómo funcionan los buscadores respecto a las Keywords
La relación de los buscadores respecto a las palabras clave es tan sencilla como el uso del sentido común: frecuencia de búsqueda de una keyword concreta por un gran número de usuarios y su relevancia en el contenido.
Hablar de Keyword en genérico realmente no aporta ningún valor al contenido, lo importante respecto a las palabras clave y al contenido es: ¿realmente tu contenido aporta valor al lector?, ¿hay una relación «real» entre la información que aparece en las SERPs (Meta Descripción, Título) y el contenido que el usuario encontrará al hacer clic en tu página?
«Si tu contenido realmente tiene sentido para tu usuario, mayor valor tendrá también para los buscadores»
Recuperar toda esta información, cuando hay miles y millones de búsquedas diarias de usuarios, supone un gran reto ya que las máquinas o bots necesitan entender el contenido real en lugar de simplemente almacenar palabras clave en una base de datos. Para ello, de lo que no cabe duda es que las máquinas siempre trabajan de la misma forma y sólo entienden un lenguaje: «Matemáticas».
Entonces, ¿cómo se puede calcular matemáticamente la finalidad con la que se escribe un contenido, la temática del mismo o la intencionalidad de búsqueda del usuario? Ya sabemos cómo funciona la vieja escuela de SEO: «vamos a calcular la densidad de palabras claves por artículo»… Tristemente se ha demostrado que esta es una métrica que carece de valor.
Vale y… ¿Qué hacemos ahora?
TF*IDF es un algoritmo desarrollado por OnPage.org que identifica todas las palabras clave que están relacionadas con un tema específico, en base a los resultados de Google. Es decir, esta herramienta encuentra en tiempo real los términos más importantes y las keywords que Google considera más relevantes en relación a un tema determinado: palabras clave y combinaciones Longtail para que tus textos sean más variados y originales.
Una de las ventajas de esta medida es que no tendrás que preocuparte más por las denominadas Stopwords, palabras que anulan tus esfuerzos en Seo, ya que esta fórmula matemática puede aplicarse a cualquier idioma del mundo.
Voy a intentar explicar este concepto dividiéndolo en dos partes para que puedas entender el potencial de esta herramienta en su conjunto. ¡Vamos a explicar las matemáticas con palabras! O al menos a intentarlo:
- TF: Term Frequency – El TF mide la frecuencia de uso de un término específico en una página o documento. Cuanto más largo sea un contenido mayor serán las veces que se use una keyword dentro del mismo. (Lógico ¿no?) Viene a significar, que la frecuencia de uso de una palabra clave se calculará dependiendo de la extensión de un contenido.
TF = (Número de veces que la palabra clave aparece en el documento) / (Número total de palabras en el documento)
- IDF: Inverse Document Frequency – IDF mide la importancia de un término específico por su relevancia dentro del documento. Dentro de esta métrica se excluyen las palabras vacías (Stopwords) como: “es”, “de”, “el/la” (términos que aparecerán de forma constante dentro de un documento o artículo, pero que realmente carecen de importancia). Para este cálculo se necesita reducir el uso de términos poco importantes e incrementar otros, como los siguientes:
IDF = (Número total de documentos) / (Número total de términos en el documento)
Ejemplo
Imagínate que estás leyendo un documento donde la palabra “coche” aparece 3 veces.
- TF (Term Frequency) de “coche” es (3/100)= 0.03.
- Existen 10 millones de documentos y la palabra “coche” aparece en 1000 de ellos.
- IDF (Inverse Document Frequency) es calculado de la siguiente forma (10.000.000 / 1.000)= 4
- Por tanto el TF*IDF será de 0.03 x 4 = 0.12
Como usar TF*IDF. Paso a Paso. (SCREENSHOTS)
Para comenzar a analizar tu propio texto, sigue los siguientes pasos y comprueba por ti mismo como sacar el máximo partido al Marketing de Contenidos.
- Comenzamos: Pon la keyword o URL que quieres analizar, empieza con la palabra clave para no perder ningún detalle. También puedes seleccionar el idioma y la región donde quieres centrar tu búsqueda. Por defecto, también visualizarás sinónimos agrupados, no obstante puedes cancelar esta opción para que te muestre solo palabras clave específicas.
- A continuación encontrarás todos los resultados pertenecientes a las 15 mejores páginas de Google relativos a la palabra clave que has elegido. Por ejemplo, si eliges “iphone” encontrarás el siguiente gráfico:
- “Proof Keyword Filter” en el margen superior derecho, es una de las prestaciones más importantes para definir las Keywords con las que queremos rankear, palabras claves que deberías usar dentro de tus contenidos.
En la esquina superior izquierda hay otra funcionalidad «Two-word combination», con la que visualizarás resultados de keywords Longtail , combinaciones de palabras clave que son muy útiles a la hora de optimizar tu propio contenido.
- Es el momento de comparar estos resultados con una de tus URLs.
Una vez que has hecho los pasos anteriores, puedes ver en detalle el análisis de tus Keywords más importantes para la optimización de tus contenidos. En este gráfico el color azul oscuro representa el marcador TF*IDF, lo que significa que cuanto mayor sea este resultado, mejor será el contenido de tu web. el azul claro indica el promedio TF*IDF del conjunto completo, ésto significa que cuanto mayor sea la barra, mayor peso tendrá este término en páginas que han usado dicha palabra clave.
Resumiendo, deberías aparecer en la parte verde para estar mejor posicionado que la media, pero no exageres, sino parecerá spam.
- El Editor de Textos es una herramienta que te ayuda a editar textos específicos en tiempo real. Si ya tienes el contenido escrito, cópialo y pégalo en la casilla correspondiente y el editor de textos te mostrará los términos que deberías añadir (verde), utilizar más a menudo (azul) y aquellos que deberías eliminar (rojo).
- Para acabar, en la casilla de “Competencia” podrás ver en qué posición se encuentran tus competidores para cada término y ver si tienen una nota TF*IDF mejor que tu. Resulta siempre interesante ver cómo lo están haciendo tus competidores para poder elegir la mejor estrategia con la que posicionarse
Éste útil gráfico os ayudará a visualizar todo el proceso TD*IDF
Os recomendamos utilizar esta herramienta como guía para generar un contenido único y de mayor valor, especialmente si no quieres sobreoptimizar tus contenidos con un uso excesivo de keywords. Evidentemente esto no excluye que no debas hacer un estudio previo de las palabras clave para las que te gustaría posicionarte. Sin embargo, necesitarás valorar la importancia de las Keywords que estás tratando de clasificar. Como he dicho anteriormente, los expertos en SEO utilizan por igual la fórmula como una base para clasificar el factor de sus páginas y en última instancia, su dominio, así que asegúrate de buscar las palabras clave más relevantes antes de analizar vuestro contenido mediante la fórmula TF*IDF.
En OnPage.org podréis encontrar más información sobre el algoritmo TF*IDF y muchas otras funciones de su software. Además, no os perdáis la posibilidad de crear vuestra propia cuenta gratuita de OnPage.org FREE
Lo del IDF no está nada claro, desde luego 10 millones / 1.000 no da 4. da 10.000, 4 son el número de ceros que tiene.
¿Podeis explicar esto mejor?
Hola Joan,
La fórmula del IDF es un logaritmo (más información en: https://es.onpage.org/wiki/TF*IDF ) . En el ejemplo anterior
sería:
IDF = log (10.000.000 / 1.000 ) = 4
¿Has tenido ya tiempo de probarla? No dudes en contactar conmigo si tienes más preguntas: alicia@onpage.org
Un saludo! 🙂
Hola!
Corregidme si me equivoco, pero en el artículo pone que TF*IDF es un algoritmo diseñado por onpage…Fueron G. Salton et al. http://dl.acm.org/citation.cfm?doid=361219.361220
Hola, tengo una duda… por que entre 10 millones ¿Es una medida estándar? me gustaría saber como se pude aplicar esto manualmente y sin herramientas solo para puro caso de estudio por ello sería bueno saber si las medidas que se prestan son estandarizadas para dichas operaciones. ¿me ayudan con ello por fa?