Cómo automatizar la agrupación de palabras clave de SEO por intención de búsqueda con Python

Hay mucho que saber sobre la intención de búsqueda, desde el uso de un aprendizaje profundo para inferir la intención de búsqueda clasificando el texto y descomponiendo los títulos de SERP utilizando técnicas de procesamiento del lenguaje natural (PNL), hasta agrupar en función de la relevancia semántica, con los beneficios explicados.

No solo conocemos los beneficios de descifrar la intención de búsqueda, sino que también tenemos una serie de técnicas a nuestra disposición para la escala y la automatización.

Entonces, ¿por qué necesitamos otro artículo sobre cómo automatizar la intención de búsqueda?

La intención de búsqueda es cada vez más importante ahora que la búsqueda de IA ha llegado.

Mientras que más se encontraba más en la era de búsqueda de 10 enlaces azules, lo contrario es cierto con la tecnología de búsqueda de IA, ya que estas plataformas generalmente buscan minimizar los costos informáticos (por flop) para entregar el servicio.

Los SERP todavía contienen las mejores ideas para la intención de búsqueda

Las técnicas hasta ahora implican hacer su propia IA, es decir, obtener toda la copia de los títulos del contenido de clasificación para una palabra clave dada y luego alimentarla en un modelo de red neuronal (que debe construir y probar) o usar PNL para agrupar palabras clave.

¿Qué pasa si no tiene tiempo o el conocimiento para construir su propia IA o invocar la API de AI abierta?

Si bien se ha promocionado la similitud coseno como la respuesta para ayudar a los profesionales de SEO a navegar por la demarcación de temas para la taxonomía y las estructuras del sitio, todavía mantengo que la agrupación de búsqueda por los resultados de SERP es un método muy superior.

Esto se debe a que la IA está muy interesada en fundamentar sus resultados en SERP y por una buena razón, se modela en los comportamientos del usuario.

Hay otra forma que utiliza la propia IA de Google para hacer el trabajo por usted, sin tener que raspar todo el contenido de SERPS y construir un modelo de IA.

Supongamos que Google clasifica a las URL del sitio por la probabilidad de que el contenido satisfaga la consulta del usuario en orden descendente. Se deduce que si la intención para dos palabras clave es la misma, entonces es probable que los SERP sean similares.

Durante años, muchos profesionales de SEO compararon los resultados de SERP para que las palabras clave infieran la intención de búsqueda compartida (o compartida) para mantenerse al tanto de las actualizaciones centrales, por lo que esto no es nada nuevo.

Leer ¿Qué es el texto alternativo y por qué es importante para el SEO?

El valor agregado aquí es la automatización y escala de esta comparación, que ofrece velocidad y mayor precisión.

Cómo agrupar las palabras clave por intención de búsqueda a escala usando Python (con código)

Suponiendo que tenga sus resultados SERPS en una descarga de CSV, importémoslo en su cuaderno de Python.

1. Importa la lista en tu cuaderno de Python

import pandas as pd
import numpy as np

serps_input = pd.read_csv('data/sej_serps_input.csv')
del serps_input('Unnamed: 0')
serps_input

A continuación se muestra el archivo SERPS ahora importado en un marcador de datos PANDAS.

Imagen del autor, abril de 2025

2. Filtro de datos para la página 1

Queremos comparar los resultados de la página 1 de cada SERP entre palabras clave.

Dividiremos DataFrame en mini Factores de datos de palabras clave para ejecutar la función de filtrado antes de recombinar en un solo marco de datos, porque queremos filtrar en el nivel de palabras clave:

# Split 
serps_grpby_keyword = serps_input.groupby("keyword")
k_urls = 15

# Apply Combine
def filter_k_urls(group_df):
    filtered_df = group_df.loc(group_df('url').notnull())
    filtered_df = filtered_df.loc(filtered_df('rank')

Archivo SERP importado a un Pandas DataFrame.

Imagen del autor, abril de 2025

3. Convertir URL de clasificación a una cadena

Debido a que hay más URL de resultados de SERP que palabras clave, necesitamos comprimir esas URL en una sola línea para representar el SERP de la palabra clave.

Aquí está como:


# convert results to strings using Split Apply Combine 
filtserps_grpby_keyword = filtered_serps_df.groupby("keyword")

def string_serps(df): 
   df('serp_string') = ''.join(df('url'))
   return df # Combine strung_serps = filtserps_grpby_keyword.apply(string_serps) 

# Concatenate with initial data frame and clean 
strung_serps = pd.concat((strung_serps),axis=0) 
strung_serps = strung_serps(('keyword', 'serp_string'))#.head(30) 
strung_serps = strung_serps.drop_duplicates() 
strung_serps

A continuación muestra el SERP comprimido en una sola línea para cada palabra clave.

Imagen del autor, abril de 2025

4. Compare la distancia de SERP

Para realizar la comparación, ahora necesitamos todas las combinaciones de palabras clave SERP emparejadas con otros pares:


# align serps
def serps_align(k, df):
    prime_df = df.loc(df.keyword == k)
    prime_df = prime_df.rename(columns = {"serp_string" : "serp_string_a", 'keyword': 'keyword_a'})
    comp_df = df.loc(df.keyword != k).reset_index(drop=True)
    prime_df = prime_df.loc(prime_df.index.repeat(len(comp_df.index))).reset_index(drop=True)
    prime_df = pd.concat((prime_df, comp_df), axis=1)
    prime_df = prime_df.rename(columns = {"serp_string" : "serp_string_b", 'keyword': 'keyword_b', "serp_string_a" : "serp_string", 'keyword_a': 'keyword'})
    return prime_df

columns = ('keyword', 'serp_string', 'keyword_b', 'serp_string_b')
matched_serps = pd.DataFrame(columns=columns)
matched_serps = matched_serps.fillna(0)
queries = strung_serps.keyword.to_list()

for q in queries:
    temp_df = serps_align(q, strung_serps)
    matched_serps = matched_serps.append(temp_df)

matched_serps

Compare la similitud de SERP.

Lo anterior muestra todas las combinaciones de pares de palabras clave SERP, lo que lo hace listo para la comparación de cadenas SERP.

No hay una biblioteca de código abierto que compara objetos de lista por orden, por lo que la función ha sido escrita para usted a continuación.

Leer Threads cumple dos años, continúa ganando impulso

La función “SERP_COMPARE” compara la superposición de los sitios y el orden de esos sitios entre SERP.


import py_stringmatching as sm
ws_tok = sm.WhitespaceTokenizer()

# Only compare the top k_urls results 
def serps_similarity(serps_str1, serps_str2, k=15):
    denom = k+1
    norm = sum((2*(1/i - 1.0/(denom)) for i in range(1, denom)))
    #use to tokenize the URLs
    ws_tok = sm.WhitespaceTokenizer()
    #keep only first k URLs
    serps_1 = ws_tok.tokenize(serps_str1)(:k)
    serps_2 = ws_tok.tokenize(serps_str2)(:k)
    #get positions of matches 
    match = lambda a, b: (b.index(x)+1 if x in b else None for x in a)
    #positions intersections of form ((pos_1, pos_2), ...)
    pos_intersections = ((i+1,j) for i,j in enumerate(match(serps_1, serps_2)) if j is not None) 
    pos_in1_not_in2 = (i+1 for i,j in enumerate(match(serps_1, serps_2)) if j is None)
    pos_in2_not_in1 = (i+1 for i,j in enumerate(match(serps_2, serps_1)) if j is None)
    
    a_sum = sum((abs(1/i -1/j) for i,j in pos_intersections))
    b_sum = sum((abs(1/i -1/denom) for i in pos_in1_not_in2))
    c_sum = sum((abs(1/i -1/denom) for i in pos_in2_not_in1))

    intent_prime = a_sum + b_sum + c_sum
    intent_dist = 1 - (intent_prime/norm)
    return intent_dist

# Apply the function
matched_serps('si_simi') = matched_serps.apply(lambda x: serps_similarity(x.serp_string, x.serp_string_b), axis=1)

# This is what you get
matched_serps(('keyword', 'keyword_b', 'si_simi'))

Superposición de sitios y el orden de esos sitios entre SERP.

Ahora que las comparaciones se han ejecutado, podemos comenzar a agrupar palabras clave.

Trataremos cualquier palabra clave que tenga una similitud ponderada del 40% o más.


# group keywords by search intent
simi_lim = 0.4

# join search volume
keysv_df = serps_input(('keyword', 'search_volume')).drop_duplicates()
keysv_df.head()

# append topic vols
keywords_crossed_vols = serps_compared.merge(keysv_df, on = 'keyword', how = 'left')
keywords_crossed_vols = keywords_crossed_vols.rename(columns = {'keyword': 'topic', 'keyword_b': 'keyword',
                                                                'search_volume': 'topic_volume'})

# sim si_simi
keywords_crossed_vols.sort_values('topic_volume', ascending = False)

# strip NAN
keywords_filtered_nonnan = keywords_crossed_vols.dropna()
keywords_filtered_nonnan

Ahora tenemos el nombre potencial del tema, las palabras clave SERP Similitud y los volúmenes de búsqueda de cada uno.
Palabras clave de agrupación.

Observará que Keyword y Keyword_B han sido renombrados al tema y la palabra clave, respectivamente.

Ahora vamos a iterar sobre las columnas en el marco de datos utilizando la técnica Lambda.

La técnica Lambda es una forma eficiente de iterar sobre las filas en un marco de datos de Pandas porque convierte las filas en una lista en lugar de la función .itrows ().

Aquí va:


queries_in_df = list(set(matched_serps('keyword').to_list()))
topic_groups = {}

def dict_key(dicto, keyo):
    return keyo in dicto

def dict_values(dicto, vala):
    return any(vala in val for val in dicto.values())

def what_key(dicto, vala):
    for k, v in dicto.items():
            if vala in v:
                return k

def find_topics(si, keyw, topc):
    if (si >= simi_lim):

        if (not dict_key(sim_topic_groups, keyw)) and (not dict_key(sim_topic_groups, topc)): 

            if (not dict_values(sim_topic_groups, keyw)) and (not dict_values(sim_topic_groups, topc)): 
                sim_topic_groups(keyw) = (keyw) 
                sim_topic_groups(keyw) = (topc) 
                if dict_key(non_sim_topic_groups, keyw):
                    non_sim_topic_groups.pop(keyw)
                if dict_key(non_sim_topic_groups, topc): 
                    non_sim_topic_groups.pop(topc)
            if (dict_values(sim_topic_groups, keyw)) and (not dict_values(sim_topic_groups, topc)): 
                d_key = what_key(sim_topic_groups, keyw)
                sim_topic_groups(d_key).append(topc)
                if dict_key(non_sim_topic_groups, keyw):
                    non_sim_topic_groups.pop(keyw)
                if dict_key(non_sim_topic_groups, topc): 
                    non_sim_topic_groups.pop(topc)
            if (not dict_values(sim_topic_groups, keyw)) and (dict_values(sim_topic_groups, topc)): 
                d_key = what_key(sim_topic_groups, topc)
                sim_topic_groups(d_key).append(keyw)
                if dict_key(non_sim_topic_groups, keyw):
                    non_sim_topic_groups.pop(keyw)
                if dict_key(non_sim_topic_groups, topc): 
                    non_sim_topic_groups.pop(topc) 

        elif (keyw in sim_topic_groups) and (not topc in sim_topic_groups): 
            sim_topic_groups(keyw).append(topc)
            sim_topic_groups(keyw).append(keyw)
            if keyw in non_sim_topic_groups:
                non_sim_topic_groups.pop(keyw)
            if topc in non_sim_topic_groups: 
                non_sim_topic_groups.pop(topc)
        elif (not keyw in sim_topic_groups) and (topc in sim_topic_groups):
            sim_topic_groups(topc).append(keyw)
            sim_topic_groups(topc).append(topc)
            if keyw in non_sim_topic_groups:
                non_sim_topic_groups.pop(keyw)
            if topc in non_sim_topic_groups: 
                non_sim_topic_groups.pop(topc)
        elif (keyw in sim_topic_groups) and (topc in sim_topic_groups):
            if len(sim_topic_groups(keyw)) > len(sim_topic_groups(topc)):
                sim_topic_groups(keyw).append(topc) 
                (sim_topic_groups(keyw).append(x) for x in sim_topic_groups.get(topc)) 
                sim_topic_groups.pop(topc)

        elif len(sim_topic_groups(keyw))

A continuación muestra un diccionario que contiene todas las palabras clave agrupadas por la intención de búsqueda en grupos numerados:

{1: ('fixed rate isa',
  'isa rates',
  'isa interest rates',
  'best isa rates',
  'cash isa',
  'cash isa rates'),
 2: ('child savings account', 'kids savings account'),
 3: ('savings account',
  'savings account interest rate',
  'savings rates',
  'fixed rate savings',
  'easy access savings',
  'fixed rate bonds',
  'online savings account',
  'easy access savings account',
  'savings accounts uk'),
 4: ('isa account', 'isa', 'isa savings')}

Peguemos eso en un marco de datos:


topic_groups_lst = ()

for k, l in topic_groups_numbered.items():
    for v in l:
        topic_groups_lst.append((k, v))

topic_groups_dictdf = pd.DataFrame(topic_groups_lst, columns=('topic_group_no', 'keyword'))
                                
topic_groups_dictdf

Imagen del autor, abril de 2025

Los grupos de intención de búsqueda anteriores muestran una buena aproximación de las palabras clave dentro de ellas, algo que un experto en SEO probablemente lograría.

Leer Snapchat comparte información sobre sus esfuerzos en evolución para combatir el contenido relacionado con las drogas

Aunque solo usamos un pequeño conjunto de palabras clave, el método obviamente puede escalarse a miles (si no más).

Activar las salidas para mejorar su búsqueda

Por supuesto, lo anterior podría tomarse más a fondo utilizando redes neuronales, procesando el contenido de clasificación para los grupos más precisos y los nombres de grupos de clúster, como ya lo hacen algunos de los productos comerciales.

Por ahora, con esta salida, puede:

Incorpore esto en sus propios sistemas de tablero de SEO para hacer que sus tendencias e informes de SEO sean más significativos.
Cree campañas de búsqueda mejor remuneradas estructurando sus cuentas de Google ADS por intención de búsqueda para un puntaje de mayor calidad.
Fusionar URL redundantes de búsqueda de comercio electrónico faceta.
Estructurar la taxonomía de un sitio de compras de acuerdo con la intención de búsqueda en lugar de un catálogo de productos típico.

Estoy seguro de que hay más aplicaciones que no he mencionado: no dude en comentar sobre cualquiera importante que ya no haya mencionado.

En cualquier caso, su investigación de palabras clave de SEO obtuvo un poco más de escalable, preciso y más rápido.

Descargue el código completo aquí para su propio uso.

Más recursos:

Imagen destacada: Buch y Bee/Shutterstock

(Tagstotranslate) SEO técnico

Cómo automatizar la agrupación de palabras clave de SEO por intención de búsqueda con Python

Los SERP todavía contienen las mejores ideas para la intención de búsqueda

Cómo agrupar las palabras clave por intención de búsqueda a escala usando Python (con código)

1. Importa la lista en tu cuaderno de Python

2. Filtro de datos para la página 1

3. Convertir URL de clasificación a una cadena

4. Compare la distancia de SERP

Activar las salidas para mejorar su búsqueda

Artículos relacionados

Por qué la búsqueda con IA no está sobrevalorada y en qué centrarse ahora mismo

Cómo crear estrategias de SEO en torno al comportamiento real del cliente

Las 5 fuerzas organizativas ocultas que socavan el SEO empresarial

LEAVE A REPLY Cancel reply

Artículos populares

Martin Splitt de Google revela 3 errores y soluciones de SEO...

7 mejores agencias de marketing de IA para transformar su estrategia...

Las 9 mejores plantillas de calendario de contenido para 2024

10 cosas que deben saber sobre la configuración de la campaña...

Chipotle conecta SMS, Social para celebrar los ‘extras’ del Super Bowl

¿Cuál es la descripción general de Google AI?

Más de 10 SEO informan métricas esenciales para rastrear

OPCIONES EDITORIALES

Nunca es demasiado tarde para considerar comprar las mejores acciones de...

Bluesky agrega apoyo para los indicadores de transmisión en vivo de...

Cómo escribir contenido para cada etapa de su embudo de ventas

Tendencias

Martin Splitt de Google revela 3 errores y soluciones de SEO...

7 mejores agencias de marketing de IA para transformar su estrategia...

Las 9 mejores plantillas de calendario de contenido para 2024

TABLAS POPULARES

Etiquetas populares

Sobre nosotras

Síganos