Hosting de calidad y barato para tu Wordpress:

Hosting SSD Wordpress

Este post con identificación 1520, con web https://www.exabyteinformatica.com/tienda/foro/que-es-el-crawling-t1520.html y con una longitud de 76 caracteres, ha sido procesada satisfactóriamente. dentro de cada sección del foro, encontrarás mushrooms rojos y verdes. ¿Has jugado a Mario World? Si es que no sigue leyendo: cada seta roja te hace crecer intelectualmente (los temas o posts) y cada seta verde (foros y subforos) te descubre una nueva aptitud.Si quieres decir la tuya al respecto de este tema o de cualquier otro, préviamente a poder escribir tus comentarios tienes que registrarte, tranquil@ es y será siempre GRATIS.

Registrándote aceptas haber leído y estar de acuerdo con las Normas generales del foro. El comportamiento más esencial es el respeto por los demás usuarios. De detectar alguna actividad sospechosa y si trasciende a más, tu cuenta puede ser dada de baja definitivamente de nuestro sistema.

En exaforo valoramos por encima de todo las opiniones personales de las personas que lo forman, es por esto que te pediremos que por favor, lo que nos escribas no sea un plagio de otra web o de otro miembro; si nuestro sistema anti-spam detecta que tu contenido no és único, el sistema puede borrarlo automáticamente sin avisar.

A modo de conclusión, el equipo humano de Exaforo te desea una provechosa estancia con nosotros y te animamos a que revises los temas que más te interesan del foro para extraer y aportar el máximo de información posible.

¡Agradecidos de tenerte con nosotr@s y esperamos leerte pronto!

Datos internos informativos (No hagas caso de estos datos, son para los administradores de Exaforo)

Fecha y hora de carga de esta página: 20/092018 a las 01:36:51
Memória total usada: 7485656

¿Por qué aparece el logo de Paypal en los temas? ¿Cobra Exaforo por usar su foro? No cobramos por usar el foro y el logo de Paypal es el de las donaciones. Tener en marcha un servidor 24/365, costear el hosting, los certificados digitales SSL, nuestros equipos…todo esto conlleva un coste que tratamos de sufragar mediante las donaciones. Nuestra aportación, cuando adquirimos equipos nuevos, consiste en donar nuestros viejos equipos a centros educativos con pocos recursos para que su alumnado (la mayoría niños) puedan desempeñar las asignaturas de tecnología y el centro pueda cubrir unos pocos puntos de trabajo. Tus donaciones no solo nos ayudan a nosotros sino también a los niños de las escuelas. Por eso es tan importante, porque a pesar que nosotros fomentamos el conocimiento libre, las herramientas para desempeñar dicho trabajo no lo son.

Más abajo verás un botón con el logo de Paypal. Si haces clic en el botón, te llevará a la página oficial de Paypal, allí dentro, con tu cuenta de Paypal, puedes hacer la donación del importe que tú quieras. Nosotros no pedimos un mínimo, puedes donar 1 céntimo de € si quieres o la cantidad que tú quieras. Si donas o no donas, solo te diremos una cosa: ¡Muchas gracias por habernos leído hasta aquí!

Qué es el crawling?  Qué es el crawling?

Valoración de éste post
4.23 / 5 de 1291 votos



Mensajes: 956


Puntos totales:

Enhorabuena!

32




El contenido de este artículo o información está sujeto a una licencia Creative Commons BY (CC-BY), puedes divulgar públicamente este contenido pero deberás hacer mención del autor: Kernel e indicar la dirección web de esta página: https://www.exabyteinformatica.com/tienda/foro/que-es-el-crawling-t1520.html

The content of this article or any related information is under the Creative Commons license BY, you can republish this content freely but you must mention the author of this article: Kernel and indicate the URL of this page: https://www.exabyteinformatica.com/tienda/foro/que-es-el-crawling-t1520.html

Bajo licencia de Creative Commons


¿Qué es un crawling?

Google para decidir qué páginas indexa en su base de datos y por consiguiente puede luego posicionar visita todas las páginas que puede de cada dominio en internet. Para ello utiliza lo que se llama un Crawler, un rastreador Web que comienza con una lista de direcciones URL para visitar.

A medida que el rastreador visita estas direcciones URL, identifica todos los hipervínculos en la página y los añade a la lista de URL para visitar.

Uno de los principales problemas a los que se enfrenta Google es que el número de posibles URL rastreadas que genera el software del lado del servidor le hace tener que dedicar cada vez más recursos al proceso de visitar las páginas web. Para decidir cuántas páginas visita Google asigna a cada dominio lo que llamamos un Crawl budget y cuando lo agota deja ese proyecto y pasa al siguiente.

Visita Exaforo.com


Por esto es importante optimizar el proceso de crawling pues si consumimos nuestro crawl budget en páginas no importantes podemos
encontrarnos que las páginas que nos interesa posicionar no son visitadas por el crawler y por tanto no se posicionarán.

Teniendo en cuenta que el ancho de banda para la realización de rastreos no es ni infinito ni gratis, se hace indispensable para rastrear la Web, no sólo en una forma escalable, pero eficiente, sino también alguna medida razonable de calidad o frescura debe ser mantenido. Un crawler debe elegir con cuidado en cada paso qué página siguiente visitar.

Por ello cuando el crawler se encuentra con errores, problemas de acceso, redirecciones o mucho contenido duplicado suele terminar ignorando grandes secciones de la web.

Hemos de evitar que la web de:

Errores 404 : Si una de nuestras páginas enlaza a una dirección incorrecta (error 404) el crawler la sigue y se encuentra con que no existe. Le hemos hecho perder el tiempo y una petición. Además aunque hoy de un error 404 no dejará de volver a visitarla en el futuro por si hay cambios y vuelve a estar disponible por eso hemos de corregir todos los errores 404 que tiene la web.

Redirecciones internas : enlazamos una página pero al llegar a esa página le decimos al crawler que esta dirección no es la correcta que vaya a esta otra. Hemos vuelto a consumir recursos cuando lo óptimo habría sido enviarlo desde el principio a la dirección correcta.

Contenido vacío o duplicado : La capacidad de la programación web de generar contenido vacío es infinita. Hemos de controlar los parámetros de las urls y la programación para que no generen contenido vacío o duplicados.

Velocidad de carga : cuando el crawler hace una petición a una web tiene que esperar a que esta responda y le envíe los contenidos de la urls que está visitando. Cómo el número de peticiones simultáneas que puede realizar no es infinito una web que tarda mucho en contestar es rápidamente ignorada.



No te pierdas el tema anterior: Novato en SEO, alguien ha leído estos libros?

Salta al siguiente tema: Best Practice for Long Tail keywords on ecommerce?

Quizás también te interese:
Si has encontrado información útil en Exaforo, ayúdanos a seguir creciendo. Muchas gracias por confiar en nosotros!


Volver a Posicionamiento


cron