Google explica el proceso de indexar el contenido principal

- Advertisement -spot_img

Gary Illyes de Google discuti贸 el concepto de “contenido de la pieza central”, c贸mo lo identifican y por qu茅 los 404 suaves son el error m谩s cr铆tico que se interpone en la forma de indexar el contenido. El contexto de la discusi贸n fue el reciente evento de Dive Deep Dive de Google Search en Asia, seg煤n lo resumido por Kenichi Suzuki.

Contenido principal del cuerpo

Seg煤n Gary Illyes, Google hace todo lo posible para identificar el contenido principal de una p谩gina web. La frase “contenido principal” ser谩 familiar para aquellos que hayan le铆do las pautas de la calidad de b煤squeda de Google. El concepto de “contenido principal” se introduce por primera vez en la Parte 1 de las pautas, en una secci贸n que ense帽a c贸mo identificar el contenido principal, que es seguido por una descripci贸n de la calidad del contenido principal.

Las pautas de calidad definen el contenido principal (tambi茅n conocido como MC) como:

鈥淓l contenido principal es cualquier parte de la p谩gina que ayuda directamente a la p谩gina a alcanzar su prop贸sito. MC puede ser texto, im谩genes, videos, caracter铆sticas de la p谩gina (por ejemplo, calculadoras, juegos), y puede ser contenido creado por usuarios del sitio web, como videos, revisiones, art铆culos, comentarios publicados por usuarios, etc.

El MC tambi茅n incluye el t铆tulo en la parte superior de la p谩gina (ejemplo). Los t铆tulos descriptivos de MC permiten a los usuarios tomar decisiones informadas sobre qu茅 p谩ginas visitar. Los t铆tulos 煤tiles resumen el MC en la p谩gina “.

Los Illyes de Google se refirieron al contenido principal como el contenido de la pieza central, diciendo que se usa para “clasificaci贸n y recuperaci贸n”. El contenido en esta secci贸n de una p谩gina web tiene mayor peso que el contenido en el pie de p谩gina, el encabezado y las 谩reas de navegaci贸n (incluida la navegaci贸n de la barra lateral).

Leer  Las suspensiones de perfil comercial de Google aumentan, pero las apelaciones se retrasan

Suzuki resumi贸 lo que dijo Illyes:

“Los sistemas de Google priorizan en gran medida el” contenido principal “(que 茅l tambi茅n llama la” pieza central “) de una p谩gina para la clasificaci贸n y la recuperaci贸n. Las palabras y frases ubicadas en esta 谩rea tienen significativamente m谩s peso que los de encabezados, pies de p谩gina o barras laterales de navegaci贸n. Para clasificarse por t茅rminos importantes, debe asegurarse de que se presenten prominentemente dentro del cuerpo principal de su p谩gina”.

An谩lisis de ubicaci贸n de contenido para identificar el contenido principal

Esta parte de la presentaci贸n de Illyes es importante para acertar. Gary Illyes dijo que Google analiza la p谩gina web representada para ubicar el contenido para que pueda asignar la cantidad de peso apropiada a las palabras ubicadas en el contenido principal.

No se trata de identificar la posici贸n de las palabras clave en la p谩gina. Se trata solo de identificar el contenido dentro de una p谩gina web.

Esto es lo que Suzuki transcribi贸:

“Google realiza un an谩lisis posicional en la p谩gina renderizada para comprender d贸nde se encuentra el contenido. Luego utiliza estos datos para asignar una puntuaci贸n de importancia a las palabras (tokens) en la p谩gina. Mover un t茅rmino de un 谩rea de baja importancia (como una barra lateral) al 谩rea de contenido principal aumentar谩 directamente su peso y potencial para clasificar”.

Conocimiento: El HTML sem谩ntico es una excelente manera de ayudar a Google a identificar el contenido principal y las 谩reas menos importantes. El HTML sem谩ntico hace que las p谩ginas web sean menos ambiguas porque utiliza elementos HTML para identificar las diferentes 谩reas de una p谩gina web, como la secci贸n de encabezado superior, 谩reas de navegaci贸n, pies de p谩gina e incluso para identificar elementos publicitarios y de navegaci贸n que pueden integrarse dentro del 谩rea de contenido principal. Este proceso t茅cnico de SEO de hacer que una p谩gina web sea menos ambigua se llama desambiguaci贸n.

Leer  Google lanza el asistente telef贸nico de IA para llamar a las empresas para usted

Relacionado:

3. La tokenizaci贸n es la base del 铆ndice de Google

Debido a la prevalencia de las tecnolog铆as de IA hoy en d铆a, muchos SEO son conscientes del concepto de tokenizaci贸n. Google tambi茅n usa tokenizaci贸n para convertir palabras y frases en un formato legible por m谩quina para la indexaci贸n. Lo que se almacena en el 铆ndice de Google no es el HTML original; Es la representaci贸n tokenizada del contenido.

Ver tambi茅n: Introducci贸n a LLM para SEO con ejemplos

4. “Los 404 suaves son un error cr铆tico

Esta parte es importante porque enmarca los 404 suaves como un error cr铆tico. Los 404 suaves son p谩ginas que deber铆an devolver una respuesta 404, pero en su lugar devolver una respuesta de 200 OK. Esto puede suceder cuando un SEO o editor redirige una p谩gina web que falta a la p谩gina de inicio para conservar su PageRank. A veces, una p谩gina web faltante redirigir谩 a una p谩gina de error que devuelve una respuesta de 200 OK, que tambi茅n es incorrecta.

Muchos SEO creen err贸neamente que el c贸digo de respuesta 404 es un error que necesita arreglar. Un 404 es algo que necesita arreglar solo si la URL est谩 rota y se supone que apunta a una URL diferente que est谩 en vivo con el contenido real.

Pero en el caso de una URL para una p谩gina web que se ha ido y probablemente nunca regrese porque no ha sido reemplazada por otro contenido, una respuesta 404 es la correcta. Si el contenido ha sido reemplazado o reemplazado por otra p谩gina web, entonces es apropiado en ese caso redirigir la URL anterior a la URL donde existe el contenido de reemplazo.

El punto de todo esto es que, para Google, un 404 suave es un error cr铆tico. Eso significa que los SEO que intentan arreglar un evento que no es de error como una respuesta 404 redirigiendo la URL a la p谩gina de inicio en realidad est谩 creando un error cr铆tico al hacerlo.

Leer  Lo que se necesita para estar al tanto de la b煤squeda local en 2025

Suzuki se帽al贸 lo que dijo Illyes:

“Una p谩gina que devuelve un c贸digo de estado de 200 OK pero muestra un mensaje de error o tiene contenido principal muy delgado/vac铆o se considera un” 40 404 “. Google identifica y elimina activamente estas p谩ginas a medida que desperdician el presupuesto de rastreo y proporcionan una experiencia de usuario deficiente.

Relacionado: Google advierte sobre los errores suaves de 404 y su impacto en el SEO

Comida para llevar

  • Contenido principal
    Google da prioridad a la parte principal de contenido de una p谩gina web determinada. Aunque Gary Illyes no lo mencion贸, puede ser 煤til usar HTML sem谩ntico para describir claramente qu茅 partes de la p谩gina son el contenido principal y qu茅 partes no son.
  • Google toca el contenido para la indexaci贸n
    El uso de la tokenizaci贸n de Google permite la comprensi贸n sem谩ntica de las consultas y el contenido. La importancia para el SEO es que Google ya no se basa en gran medida en las palabras clave de combinaci贸n exacta, que libera a los editores y SEO para centrarse en escribir sobre temas (no palabras clave) desde el punto de vista de c贸mo son 煤tiles para los usuarios.
  • Los 404 suaves son un error cr铆tico
    Los 404 suaves se consideran com煤nmente como algo para evitar, pero generalmente no se entienden como un error cr铆tico que puede afectar negativamente el presupuesto de rastreo. Esto eleva la importancia de evitar 404 suaves.

Ver tambi茅n: C贸mo Bing Ai Search utiliza contenido del sitio web

Imagen destacada de Shutterstock/Krakenimages.com

(Tagstotranslate) Noticias

spot_img
spot_img

Art铆culos relacionados

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Art铆culos populares