
TF-IDF para la optimización SEO
Optimiza tu sitio web con TF-IDF de manera práctica
El TF-IDF es una herramienta esencial en el mundo del SEO. Es un algoritmo estadístico que se utiliza en la minería de texto para calcular la frecuencia de las palabras en un documento y determinar su importancia en función de cuántas veces aparecen en otros documentos. Pero, ¿cómo puede el TF-IDF ser útil para ti?
En el inicio de cualquier proyecto de optimización, es crucial conocer las palabras clave que son relevantes para tu sitio web. Aquí es donde entra en juego el TF-IDF.
¿Qué es el TF-IDF y cómo funciona?
La frecuencia del término, o TF para abreviar, es un valor que tiene en cuenta el número de ocurrencias que tiene un término o palabra en un texto determinado. Al analizar la frecuencia del término (TF), puedes identificar qué palabras o términos aparecen con mayor frecuencia en un texto. Cuantas más veces se mencione un término, más relevante será para ese documento en particular.
Por otro lado, la frecuencia de documento inversa (IDF) refleja la idea de que un término que aparece en pocos documentos es más distintivo y, por lo tanto, más valioso que uno que aparece en muchos.
¿Cómo calcular el TF IDF?
TF significa frecuencia del término y se calcula con la ecuación TF = n/d
, o lo que es lo mismo dividiendo el número de veces que aparece un término en un documento (n) por el número total de palabras (d).
El IDF se calcula con la ecuación IDF = log10(N/n)
, donde N representa el número total de documentos y n representa a todos esos documento del corpus que contienen el término de búsqueda. La IDF es una función inversa, lo que significa que cuando aumenta, el poder de discriminación de un término disminuye.
El TF-IDF se calcula multiplicando la frecuencia de términos por la frecuencia de documento inversa TF-IDF = (n/d) x log10(N/n)
.
El TF-IDF se usa para identificar palabras que son representativas de temas dentro de un conjunto de contenidos. Aprende a optimizar tu página web usando el análisis TF-IDF https://t.co/0xHVWQ5T3o #seo #tfidf pic.twitter.com/ESIo93oGnH
— José B. Moreno (@jbmoreno) March 6, 2022
Cómo usar TF-IDF en SEO
Vamos a aprovechar la funcionalidad de esta herramienta que nos permite obtener partes concretas del área de contenidos (para que nos entendamos, el cuerpo del contenido, sin tener en cuenta el texto que está en la cabecera, los menús o el pie de página.) y prepararlo para que detecte todas las URLs donde aparece la palabra clave objetivo de nuestra “página campeona”. Esto lo tienes en la ruta del menú Configuración > Personalizado > Buscar y ¡Que comience el rastreo!.
-
TF:
=ARRAYFORMULA(IF($A2:A="";"";$D2:$D/$C2:$C))
-
IDF:
=ARRAYFORMULA(IF($A2:$A="";"";LOG10(COUNTA($C:$C)/COUNTIF($D:$D;">0"))))
-
TF·IDF:
=ARRAYFORMULA(IF($A2:$A="";"";$F2:$F*$G2:$G))
=QUERY('Listado HTML'!A:H;"SELECT E, A, B, H WHERE H > 0 ORDER BY H DESC";1)El resultado es una lista de páginas que contienen la palabra clave objetivo (indicando cuál es tu página campeona) y que está ordenada por el valor de TF-IDF de manera descendente.
¿Cuáles son las mejores prácticas para aprovechar al máximo el análisis TF-IDF en la optimización de un sitio web?
Para aprovechar al máximo el análisis TF-IDF, yo suelo tener una serie de precauciones, siendo la principal la de trabajar una intención de búsqueda una sola vez y en una páginas que alineo lo mejor posible a la palabra clave objetivo. Así, evito también los problemas que ocasionan los contenidos que se canibalizan entre sí porque trabajan la misma intención de búsqueda.
Por otro lado, y ahora desde el punto de vista técnico, trabajo con bases de datos MySQL porque con herramientas como las hojas de cálculo no se puede hacer el trabajo de manera escalable (no obstante, en el vídeo que te muestro a continuación, pongo un ejemplo con hojas de cálculo para facilitar la comprensión del concepto y cómo empezar a trabajarlo.
Por último y -como especialista en SEO- puedo decirte que el TF-IDF es una herramienta poderosa. No sólo te ayuda a identificar palabras clave relevantes, sino que también te permite ajustar tu estrategia de contenido para satisfacer las necesidades de tu público objetivo. Si quieres mejorar tu posicionamiento en buscadores y aumentar la visibilidad de tu sitio web, el análisis TF-IDF es el camino a seguir.
Algo de lectura sobre el TF-IDF
El libro «Information Retrieval Models: Foundations and Relationships (Synthesis Lectures on Information Concepts, Retrieval, and Services)» ha sido escrito por Thomas Roelleke; en él, se explican los modelos de recuperación de información (IR) como componente central de la investigación de documentos.
¿Tienes alguna experiencia particular con el TF-IDF que quieras compartir? ¿O alguna pregunta sobre cómo implementarlo en tu estrategia de SEO? ¡Dímelo en los comentarios!
4 Comments
Hola 👋 me ha gustado mucho el artículo, es claro y práctico. Mi pregunta es la siguiente, si tienes un ecommerce ¿se manejaría igual esta práctica o tiene alguna variación porque son productos que pueden llegar a ser similares?
Gracias por el artículo.
Hola Emely, te respondo con algunas consideraciones basadas en mi experiencia:
Resumiendo, sí, puedes aplicar el análisis TF·IDF en tu ecommerce, pero adaptándolo a las particularidades de tu sitio.
Si quieres saber más sobre esto o necesitas ayuda en particular, no dudes en contactarme. Puedo ayudarte a mejorar aún más.
¡Espero que esta información te haya sido útil! Si tienes más inquietudes, no dudes en hacerlo saber.
Creo que he cumplido con las especificaciones que me diste. Si hay algún otro ajuste que quieras hacer, sólo házmelo saber. ¡Estoy aquí para ayudarte!
Si lo he entendido bien…ya que estoy aprendiendo sobre esto del SEO, ¿la palabra clave a posicionar la buscas antes de todo? por ejemplo utilizas alguna herramienta y ves que «SEO Freelance» tiene mas ratio en 3 paginas…con screaming frog, ¿luego optimizas la página el particular?
Un saludo.
En realidad, me aprovecho de los informes de Google Search Console para obtener las palabras clave por las que se muestra la página, repaso el potencial de tráfico que tienen con SEMRUSH. Luego paso SCREAMING FROG para ver los ratios TF·IDF y optimizo, sí.