Índice de Google: Cómo comprobar el total de páginas indexadas y conseguir que los rastreadores de Google las indexen al instante

Si quieres que tu sitio sea visible en las búsquedas de Google, tiene que formar parte del índice de búsqueda de Google.

Puedes pensar en este índice como una gigantesca biblioteca de sitios web y páginas individuales que Google mantiene para hacer las búsquedas más rápidas.

Si todo va bien, tu sitio web se indexará automáticamente, pero ¿qué pasa si no es así? O ¿qué pasa si sólo se indexan algunas de tus páginas web?

Esta guía te enseñará todo sobre el índice de Google y cómo asegurarte de que todo tu contenido se indexa adecuadamente, lo cual es fundamental para el SEO.

Tabla de contenidos

¿Qué son las páginas web indexadas?

Google mantiene un «índice» de páginas en la web que se actualiza periódicamente para poder generar páginas de resultados del motor de búsqueda (SERPs) más rápidamente. Una vez más, es mejor pensar en este índice como una especie de biblioteca que Google puede ordenar fácilmente cuando sea necesario; si sus páginas no están en el índice, no van a estar en las SERPs.

Google utiliza bots automatizados (conocidos como arañas, o Googlebot, el nombre específico de la araña web de Google) para recorrer constantemente Internet en busca de nuevos contenidos y nuevos sitios web para añadir al índice.

Cualquier página nueva o cantidad significativa de información añadida a una página web es anotada por Google. Cada página de un sitio web es indexada por un rastreador web para el valor del contenido y para futuras solicitudes de búsqueda por parte de los consumidores.

Un futuro cliente de Internet puede buscar utilizando ciertas palabras clave y las palabras clave pueden encontrar una página web con cierto contenido o contenido de la imagen.

Los motores de búsqueda de Google y los rastreadores web conocen cada nuevo bit de información impresa o publicada en una página web a medida que se publica.

¿Por qué se indexan las páginas web?

Cada nueva página web de Internet es indexada por ciertas categorías y otras herramientas de marcado.

Las páginas se indexan porque el contenido y los sitios web en sí necesitan figurar entre los muchos otros sitios web que pueden ser similares.

Una página primero debe ser indexada.

Los bots de Google rastrean un sitio web y crean una copia en caché de cada página. Se añaden a los índices ya completados y se puede crear una nueva jerarquía de páginas valoradas del sitio web, por ejemplo.

En definitiva, el proceso de indexación permite a Google realizar búsquedas en la web de forma más exhaustiva, más precisa y más rápida.

Cómo ser indexado por Google

Entonces, ¿cómo puede asegurarse de que su sitio sea indexado por Google?

Estas son las buenas noticias. Google hace la mayor parte del trabajo por usted.

Si no tiene prisa por indexar sus páginas, y no hay nada anormal en su sitio, todo lo que tendrá que hacer es esperar a que los rastreadores web de Google descubran finalmente su sitio y actualicen el índice en consecuencia. En función de diversas variables, este proceso puede durar desde unas pocas horas hasta varias semanas. Además, incluso cuando su página se indexe, es probable que experimente una volatilidad en las clasificaciones a través de un fenómeno llamado cariñosamente el Baile de Google.

Si está interesado en acelerar el proceso, o si simplemente quiere asegurarse de que Google tiene información precisa, puede enviar un mapa del sitio y/o solicitar la indexación a través de Google Search Console, una herramienta gratuita que Google proporciona a los webmasters. Si aún no lo has hecho, deberás registrarte para obtener una cuenta y verificar la propiedad de tu dominio web.

Una vez hecho esto, dirígete a la «herramienta de inspección de URL» y podrás pegar la URL que quieres que Google indexe.

Si estás interesado en rastrear todo tu sitio, simplemente pega tu dominio de alto nivel y haz clic en «Solicitar indexación». Tenga en cuenta que este proceso podría tardar varios días o más.

Si está dispuesto a trabajar para crear un archivo de mapa del sitio XML, también puede subirlo directamente a Google a través de Google Search Console. En la sección Índice, haga clic en Mapas del sitio y tendrá la opción de subir su mapa del sitio directamente.

¿Cómo puede saber cuántas páginas de su sitio están indexadas por Google?com»

El siguiente es el resultado de una búsqueda de sitio en SEO.co:

Si su sitio no aparece, significa que puede no estar indexado y que puede haber algún problema.

¿Cómo puedo utilizar un comprobador de páginas indexadas de Google?

También puede utilizar un comprobador de páginas indexadas de Google para determinar si sus páginas están indexadas o no. Un comprobador de páginas indexadas de Google se puede utilizar de la siguiente manera:

  • Ingrese su URL en el comprobador de páginas indexadas de Google.
  • La URL es el sitio web que está deseando comprobar sobre su ranking o valor de contenido de la página web.
  • Haga clic en continuar para recibir los resultados de su exploración.

Obtención de detalles sobre las páginas indexadas por Google en Google Search Console

¿Cómo puedo saber cuántas páginas ha indexado Google actualmente para mi empresa?

Si está interesado en profundizar y saber exactamente cuáles de sus páginas se han indexado, su mejor opción es utilizar Google Search Console.

Acceda, diríjase al área de Índice y haga clic en la pestaña Cobertura. Allí podrá generar una lista de «Todas las páginas conocidas»

Aquí obtendrá un desglose de cuántas de sus páginas son actualmente válidas, cuántas son «Válidas con advertencias» y cuántas «Errores» tiene.

Si ve ceros en toda la tabla, significa que hay un problema grave; Google no está indexando su sitio en absoluto.

Si ve un número de páginas en la columna «Válido» igual al número de páginas de su sitio, está todo listo. Si hay páginas en las secciones «Válido con advertencias» o «Error», puedes explorarlas; Google te dirá con precisión qué es lo que está mal y qué debes arreglar para resolver el problema.

Mientras tanto, puedes comprobar si una página específica está indexada utilizando la herramienta de inspección de URL (ya comentada anteriormente). Sólo tienes que copiar/pegar la URL en la herramienta y Google te dirá si la página está presente en el índice de Google o no.

Esto es fantástico para verificar que tus esfuerzos son exitosos si tienes que solucionar una página específica no indexada. También es la forma de conseguir que se indexe de forma instantánea.

Por qué Google no está indexando su sitio

No sucede a menudo, pero cuando lo hace, resulta devastador.

Si va a obtener tráfico orgánico de las búsquedas en línea, tiene que asegurarse de que su sitio es visible; en otras palabras, si quiere aparecer en las páginas de resultados de búsqueda de Google, éste tiene que saber que su sitio existe.

Y si su sitio no está siendo indexado por Google, es como si no existiera.

Si su sitio web no está apareciendo a través de la búsqueda orgánica en absoluto, luche contra la tentación de empezar a entrar en pánico. La mayoría de las veces, esto es simplemente una indicación de algún error o bloqueo que está impidiendo que Google indexe su sitio, y estos problemas son fáciles de solucionar.

Eche un vistazo a estas 10 razones por las que Google podría no estar indexando su sitio, si no se puede encontrar en Google, es probable que uno de estos sea el culpable.

1. Usted no tiene tanto un dominio www como uno no www.

Para el visitante medio de la web, no hay ninguna diferencia real entre una URL que empiece por https:// o por https://www. Ambas conducen, en última instancia, al mismo lugar, por lo que la mayoría de los usuarios y webmasters no le dan importancia. Pero la variante www es en realidad un subdominio de la versión más amplia no www. Para que su sitio web se indexe correctamente, deberá verificar la propiedad de ambos en las Herramientas para webmasters de Google. También puede establecer su dominio preferido, para informar a Google de qué versión desea utilizar principalmente.

2. Google sigue buscando tu sitio.

Si acabas de lanzar un sitio y buscas con entusiasmo en Google para ver tu sitio en la lista, relájate. Normalmente, Google tarda al menos unos días en indexar un sitio nuevo. Si ya han pasado varios días y todavía no ha visto ningún resultado, podría significar que Google está teniendo problemas para indexar su sitio, y eso suele significar que tiene un problema con un mapa del sitio. Si aún no ha creado o subido un mapa del sitio con el formato adecuado, ese podría ser su problema. Una vez corregido, puede «forzar» a Google a rastrear su sitio web a través de Google Search Console.

Este es, con mucho, el culpable más común, por lo que si sus páginas no están indexadas, esto es probablemente lo responsable.

3. Tiene un archivo robots.txt persistente.

Los archivos robots.txt son archivos de instrucciones que pueden indicar a los rastreadores de búsqueda cómo operar.

Ocasionalmente, los desarrolladores o los administradores de contenido utilizarán un archivo robots.txt para evitar que un motor de búsqueda indexe una página determinada intencionalmente (como si la página no está lista para su visualización pública).

Esencialmente, el archivo se comunica con los rastreadores de Google y les dice que no indexen un sitio o una página específica de ese sitio, por lo que si actualiza o elimina el archivo, dejará de tener un problema de indexación.

Realice un análisis exhaustivo del código de su sitio web y actualice cualquier instancia de los archivos robots.txt que no estén en su lugar por un motivo específico.

Aún así, deberá dar a Google unos días para que indexe su sitio después de corregir el archivo erróneo.

4. Google está experimentando errores de rastreo. Google está experimentando errores de rastreo.

No sucede a menudo, pero existe la posibilidad de que Google tenga problemas para rastrear algunas de sus páginas web.

Si su página principal se indexa, pero no todas sus páginas internas, podría ser un síntoma de un simple error de rastreo. Acceda a Google Search Console y haga clic en «Rastreo» y, a continuación, en «Errores de rastreo»

Esto le llevará a una lista de las páginas de su sitio que están experimentando errores de rastreo. Estos errores son a veces atribuibles a los archivos robots.txt, detallados anteriormente, pero también pueden ser el resultado de errores de DNS o errores del servidor, ambos fácilmente corregibles en la mayoría de las circunstancias.

5. El contenido duplicado está interfiriendo con los rastreadores.

Si sigue las mejores prácticas de marketing de contenidos, esto no debería ser un problema, pero hay circunstancias en las que puede existir contenido duplicado en su sitio, como variaciones de una «página maestra» diseñada para audiencias ligeramente diferentes.

Si Google detecta múltiples instancias de contenido duplicado, los rastreadores del motor de búsqueda pueden confundirse y abandonar la indexación de su sitio por completo.

La forma más fácil de corregir esto es deshacerse del contenido duplicado.

Si eliminar el contenido duplicado por completo no es una opción, puede utilizar redireccionamientos 301 o archivos robots.txt selectivos para asegurarse de que Google sólo rastrea una instancia de cada página.

6. Su sitio tiene problemas de carga. Su sitio tiene problemas de carga.

Si Google va a indexar su sitio, éste debe estar activo.

Esto significa que si tiene un problema de carga cuando Google intenta indexar su sitio, podría perder la oportunidad de ser indexado.

Los tiempos de carga excesivamente largos son a veces el problema; si este es el caso, puede disminuir los tiempos de carga configurando un sistema de caché decente, reduciendo el tamaño de sus imágenes e instalando algunas aplicaciones para que el sitio funcione más rápido. También es posible que su alojamiento no sea fiable, lo que provoca caídas intermitentes que interrumpen los intentos de indexación de Google.

7. Está utilizando lenguajes de codificación mal optimizados.

Google tiene algunas preferencias fuertes cuando se trata del tipo de código en su sitio. HTML es uno de los lenguajes más fáciles de indexar, pero no todas las opciones son tan afortunadas.

JavaScript y AJAX, por ejemplo, son compatibles con Google, pero no se indexan tan fácilmente como el HTML.

Si su sitio está construido en AJAX o JavaScript y su estructura no es la adecuada, Google podría tener problemas para indexar sus páginas.

8. Estás siendo bloqueado por el .htaccess o la configuración de privacidad.

Si tienes un sitio de WordPress, es posible que accidentalmente tengas activada la configuración de privacidad; puedes desactivarla en la pestaña «Privacidad».

También es posible que estés usando un archivo .htaccess para tu sitio web en el servidor.

Aunque los archivos .htaccess son útiles en la mayoría de los casos, a veces pueden interferir con la indexación del sitio.

9. Tienes una indicación Noindex o Nofollow en algún lugar de la etiqueta meta.

Al igual que el archivo robots.txt, se trata de una adición que puede enmascarar las páginas de su sitio para que no las encuentren los rastreadores de los motores de búsqueda. Revisa el código de tu sitio y busca la etiqueta «noindex» en algún lugar de un meta título. Si la encuentras en algún lugar, habrás diagnosticado al instante tu problema de indexación. Simplemente elimine la etiqueta y reemplácela si es necesario, y debería estar de vuelta en la vía rápida para la indexación en los motores de búsqueda.

10. Has sido golpeado con una penalización masiva.

Cuando Google penaliza a los sitios, normalmente lo hace bajando los rangos y, por tanto, la visibilidad y el tráfico. Sin embargo, hay casos raros y extremos en los que Google penaliza un sitio eliminándolo completamente de los índices.

Este es un tipo de penalización manual reservada para infracciones graves, por lo que no debes preocuparte por esto a menos que hayas hecho algo muy malo a los ojos de Google.

Si te han desindexado de esta manera, probablemente ya hayas sido notificado por Google, así que, a menos que ese sea el caso, no tienes que preocuparte de que no te indexen como castigo.

Una vez que tu sitio sea indexable, dale a Google unos días para que se ponga al día. Deberías empezar a ver tu sitio en los resultados del motor de búsqueda en breve.

Si sigues teniendo problemas, es posible que tu problema de indexación sea más complejo de lo habitual.

Si estás apareciendo, pero estás clasificando muy bajo, podría ser una indicación de que tu sitio es todavía nuevo y no tiene mucha autoridad, o podría ser una indicación de una penalización.

De cualquier manera, mantenerse comprometido con las mejores prácticas durante un período prolongado de tiempo es la mejor manera de aumentar su visibilidad.

¿Cómo corregir un problema si las páginas de mi sitio web no están siendo listadas?

Si su sitio no está completamente indexado en Google, podría estar perdiendo mucho tráfico (e ingresos). Si las páginas no aparecen en las SERPs de Google, no son especialmente descubribles.

Si descubre que algunas (o todas) de sus páginas no están siendo indexadas, siga los siguientes pasos:

1. Utilice Google Search Console para comprobar qué páginas no se indexan. ¿No se indexa todo el sitio o sólo un puñado de páginas? Como puede sospechar, cuantas más páginas falten, mayor será el problema.

2. Identifique la causa principal del problema. Aunque no sea un experto técnico, debería ser capaz de averiguar la causa de su problema. Revise la sección anterior para conocer las posibles razones por las que Google podría no indexar su sitio. Si su sitio es nuevo y ninguna de sus páginas está indexada, puede tratarse de un retraso natural. Si no es el caso, es probable que tenga un archivo robots.txt, un bloqueador de privacidad u otra pieza de código que esté impidiendo que sus páginas se indexen.

3. Corrija el problema y envíe un mapa del sitio actualizado. Sea cual sea el problema, trabaje para corregirlo. Cuando haya terminado, puede enviar un mapa del sitio actualizado a Google. En Google Search Console, seleccione «Añadir una propiedad» y suba el mapa del sitio actualizado. Una vez que haya terminado, puede utilizar la herramienta «Fetch as Google» para solicitar específicamente que un robot rastree la página designada. Solo tienes que introducir la URL, elegir Escritorio o Móvil y hacer clic en Obtener. Este proceso tardará algún tiempo, pero una vez completado, Google evaluará sus páginas para la indexación.

Si está atascado con páginas no indexadas y no está seguro de cuál es el problema, siga estos pasos básicos para la solución de problemas:

  • Elimine cualquier bloqueador de rastreo en su archivo robots.txt. Compruebe su archivo robots.txt en yourdomainhere.com/robots.txt. Allí, puede utilizar CTRL + F para buscar «Googlebot» y «*». Si tiene alguna línea que especifique User-agent: Googlebot o User-agent: * (que se dirige a todos los bots), las páginas que desautoricen no se indexarán en Google. En algunos casos, esto puede ser ventajoso, pero más a menudo, es una simple barrera para la indexación. Actualice su archivo robots.txt en el backend para resolver este problema.
  • Elimine las etiquetas noindex perdidas. Del mismo modo, si tiene alguna etiqueta content=»noindex» en sus metaetiquetas, los robots de búsqueda de Google no indexarán su contenido. Este es un problema sencillo de encontrar y solucionar, incluso si no tiene conocimientos de codificación.
  • Elimine las etiquetas canónicas que no sean precisas. Las etiquetas canónicas son etiquetas de página opcionales que indican a Google qué versión de su página es la preferida, la «canónica». Algunas páginas tienen una etiqueta canónica autorreferente que indica a Google que esta es la única versión. Sin embargo, si se implementa de forma incorrecta, una etiqueta canónica podría indicar a Google que busque una página canónica diferente, una que no existe. Si esto ocurre, podría interferir con el proceso de indexación de Google. Si este es su problema, debería aparecer como un error de rastreo en Google Search Console.
  • Actualice su mapa del sitio. Googlebot debería ser capaz de descubrir todo tu contenido de forma orgánica, pero puedes crear y actualizar tu mapa del sitio XML para estar seguro. Sube esto a través de Google Search Console para ayudar a Google a «ver» todo el espectro de tu sitio.

Y recuerda, la mayoría de las personas preocupadas por que sus sitios no sean indexados simplemente no han esperado lo suficiente.

Si sólo han pasado unas horas o un par de días desde que su sitio web se puso en marcha, intente ser paciente.

Las arañas de Google son buenas en lo que hacen, pero tardan algún tiempo en trabajar.

¿Cómo se valoran y clasifican las páginas del sitio web?

El hecho de que las páginas de su sitio web estén indexadas no significa que vayan a ser muy visibles en las búsquedas de Google. Esto se debe a que Google quiere asegurarse de que los usuarios de las búsquedas de Google encuentren el mejor contenido posible cuando realicen una búsqueda.

Google categoriza las páginas en función de su relevancia y las clasifica según su fiabilidad (o «autoridad»), por lo que, aunque sus páginas estén indexadas, es posible que no aparezcan en las búsquedas de su público objetivo.

La optimización para motores de búsqueda (SEO) es el proceso de realizar cambios dentro y fuera del sitio para aumentar la probabilidad de que sus páginas aparezcan en el ranking.

Es un tema extraordinariamente profundo que no se puede cubrir suficientemente en un solo artículo, pero si es nuevo en el mundo del SEO, estos son algunos de los factores de clasificación más importantes que vale la pena considerar:

    • Relevancia del contenido. Google necesita asegurarse de que su contenido se ajusta a la intención de los usuarios de las búsquedas. En los viejos tiempos del SEO, esto significaba introducir palabras y frases clave específicas en todo el sitio. Hoy en día, Google es demasiado sofisticado para caer en este truco; en su lugar, es mejor responder a las preguntas específicas que un usuario pueda tener o cubrir un tema específico de forma natural y en profundidad.
    • Calidad del contenido. Google quiere que sólo el mejor contenido sea clasificado lo suficientemente alto como para que un usuario haga clic. Su contenido debe ser profundo, conciso y bien escrito. Debe citar varias fuentes, cubrir el tema en su totalidad y no tener errores.
    • Encabezados y etiquetas. El código de fondo de sus páginas también es importante. Incluir etiquetas de título, meta descripciones y encabezados concisos y cargados de palabras clave puede aumentar su potencial de clasificación.
    • Enlaces externos. Uno de los mejores indicadores de fiabilidad, en lo que respecta a Google, es un enlace que apunte a su página desde un sitio externo. Cuantos más enlaces entrantes tenga, y cuanto más autoridad tengan esos enlaces (es decir, que provengan de una fuente fiable), mejor.
    • Enlaces internos. También es útil que tus páginas estén bien enlazadas entre sí, para que los usuarios puedan navegar fácilmente de una página a otra de tu sitio. También facilita el rastreo de su sitio por parte de Googlebot.
  • Velocidad de carga y factores técnicos. Google también tiene en cuenta una serie de factores técnicos relacionados con el rendimiento de su página. Por ejemplo, las páginas que están optimizadas para móviles y las que se cargan rápidamente tienden a clasificarse mejor que las que no lo están y no pueden.

¿Cómo puedo atraer más tráfico y ventas convertidas a mi negocio en Internet?

Incluso si usted tiene un producto convincente y un modelo de negocio fantástico, no importará a menos que la gente sea capaz de descubrir su negocio en primer lugar.

Y la mejor manera de hacer que su negocio sea descubrible en la era moderna es a través del motor de búsqueda de Google.

La indexación es el primer paso. Después de leer esta guía, deberías ser capaz de conseguir que tu sitio web se indexe correctamente en Google, incluso si tienes que seguir algunos pasos de solución de problemas para hacerlo.

A partir de ahí, tendrás que dedicar tu atención a aumentar tu clasificación en las SERPs de Google con la ayuda de la construcción de enlaces, la creación de contenido y otras tácticas de SEO. Si está interesado en obtener más información, o si está listo para comenzar una estrategia de SEO desde cero, póngase en contacto con nosotros hoy para una consulta gratuita!

Resumen

El índice de Google es un archivo de contenido web que utiliza para manejar las búsquedas de los usuarios más rápido, y conseguir que su sitio sea indexado es de vital importancia.

Afortunadamente, suele ser un asunto sencillo conseguir la indexación, incluso si se encuentra con algunos obstáculos en el camino.

Una vez indexado, la única manera de asegurarse de que su sitio es visible para los nuevos usuarios es aumentar su clasificación en las SERP, y la única manera de hacerlo es a través del SEO.

  • Autor
  • Postes recientes
Director de Marketing en SEO.co
En sus más de 9 años como comercializador digital, Sam ha trabajado con innumerables pequeñas empresas y empresas de Fortune 500 y organizaciones como NASDAQ OMX, eBay, Duncan Hines, Drew Barrymore, Washington, DC basado en la firma de abogados Price Benowitz LLP y la organización de derechos humanos Amnistía Internacional.
Es un ponente recurrente en la serie de conferencias Search Marketing Expo y un TEDx Talker. Hoy en día trabaja directamente con clientes de alto nivel en todos los verticales para maximizar el ROI de SEO dentro y fuera del sitio a través del marketing de contenidos y la construcción de enlaces. Conecta con Sam en Linkedin.

Los últimos posts de Sam Edwards (ver todos)
  • Baidu SEO: La guía definitiva para la optimización de la búsqueda en Baidu.com – 25 de marzo de 2021
  • Indexación en motores de búsqueda vs. Clasificación en motores de búsqueda: ¿Cuál es la diferencia? – March 23, 2021
  • Clics de Búsqueda vs. Volumen de Búsqueda: ¿Cuál es la diferencia, dónde debo centrarme? – 18 de marzo de 2021

Deja una respuesta

Tu dirección de correo electrónico no será publicada.