Please enable / Por favor activa JavaScript!
Por favor activa el Javascript![ ? ]
Servidores VPS rápidos, escalables y muy económicos:

Servidor VPS SSD Optimizados

Este post con identificación 1520, con la URL https://www.exabyteinformatica.com/tienda/foro/que-es-el-crawling-t1520.html y con una longitud de 76 caracteres, se ha cargado correctamente. dentro de cada sección del foro, encontrarás mushrooms rojos y verdes. ¿Has jugado a Mario World? Si es que no sigue leyendo: cada seta roja te hace crecer intelectualmente (los temas o posts) y cada seta verde (foros y subforos) te descubre una nueva aptitud.Si quieres escribir un comentario en este foro o en cualquiera del resto, el paso previo para poder comentar es registrarte,tranquil@ es y será siempre GRATIS.

Registrándote aceptas haber leído y estar de acuerdo con las Normas generales del foro. No cuesta nada agradecer un comentario de alguien o de no insultarle, el respeto es el valor más preciado que intentamos fomentar. Si detectamos una actividad ilícita en tu cuenta o haces abuso de spam, podemos cancelar tu cuenta permanente o temporalmente.

Cuando decidas escribir para nosotr@s, por favor, no copies y pegues contenido que ya exista en otra página web o que ya sea de otro usuario. Ten en cuenta que si detectamos contenido duplicado, el sistema anti-spam procederá a borrarlo sin prévio aviso.

A modo de conclusión, el equipo humano de Exaforo te desea una provechosa estancia con nosotros y te animamos a que revises los temas que más te interesan del foro para extraer y aportar el máximo de información posible.

¡Esperamos leerte pronto, muchas gracias por dedicarnos una parte de tu tiempo!

Datos internos informativos (No hagas caso de estos datos, son para los administradores de Exaforo)

Fecha y hora de carga de esta página: 22/112017 a las 19:24:24
Memória total usada: 7470544

¿Y el logo de Paypal? ¿Exaforo no era sin ánimo de lucro? Y así es, para poder usar Exaforo nadie cobra nada, fíjate bien que el botón de Paypal es el de donaciones. Mantener la web en un servidor encendido 24 horas, contratar la conexión a internet de alta velocidad para que goces de peticiones rápidas, pagar los certificados SSL,…es decir, los costes de mantenimiento.

Nuestros pocos fondos van destinados a mantener siempre en marcha los sistemas y cuando adquirimos equipos nuevos, los viejos solemos donarlos a escuelas y centros educativos que tienen pocos recursos para adquirir equipos informáticos. Por eso tus donaciones son muy importantes ya que no solo nos ayudan a nosotros sino también a niños en edad escolar, al profesorado y a los centros educativos en general. En exaforo creemos en la formación libre y que sea accesible a todo el mundo. Si crees poder ayudarnos haciendo una donación para que sigamos creciendo como hemos ido haciendo desde 2003, te estaremos muy agradecidos, el importe de la donación lo pones tú, nosotros no pedimos una cantidad fija, piensa que puedes donar hasta mínimo 1 céntimo. Dones o no dones, muchas gracias por habernos leído hasta el final. Más abajo tienes el botón de “Donar con Paypal” (no hace falta que des tu número de la tarjeta, el botón te dirige a la página oficial de Paypal y desde su formulario puedes hacer la donación desde tu cuenta Paypal).

Qué es el crawling?  Qué es el crawling?

Valoración de éste post
4.23 / 5 de 642 votos



Mensajes: 954


Puntos totales:

Enhorabuena!

32





El contenido de este artículo o información está sujeto a una licencia Creative Commons BY (CC-BY), puedes divulgar públicamente este contenido pero deberás hacer mención del autor: Kernel e indicar la dirección web de esta página: https://www.exabyteinformatica.com/tienda/foro/que-es-el-crawling-t1520.html

The content of this article or any related information is under the Creative Commons license BY, you can republish this content freely but you must mention the author of this article: Kernel and indicate the URL of this page: https://www.exabyteinformatica.com/tienda/foro/que-es-el-crawling-t1520.html

Bajo licencia de Creative Commons


¿Qué es un crawling?

Google para decidir qué páginas indexa en su base de datos y por consiguiente puede luego posicionar visita todas las páginas que puede de cada dominio en internet. Para ello utiliza lo que se llama un Crawler, un rastreador Web que comienza con una lista de direcciones URL para visitar.

A medida que el rastreador visita estas direcciones URL, identifica todos los hipervínculos en la página y los añade a la lista de URL para visitar.

Uno de los principales problemas a los que se enfrenta Google es que el número de posibles URL rastreadas que genera el software del lado del servidor le hace tener que dedicar cada vez más recursos al proceso de visitar las páginas web. Para decidir cuántas páginas visita Google asigna a cada dominio lo que llamamos un Crawl budget y cuando lo agota deja ese proyecto y pasa al siguiente.

Visita Exaforo.com


Por esto es importante optimizar el proceso de crawling pues si consumimos nuestro crawl budget en páginas no importantes podemos
encontrarnos que las páginas que nos interesa posicionar no son visitadas por el crawler y por tanto no se posicionarán.

Teniendo en cuenta que el ancho de banda para la realización de rastreos no es ni infinito ni gratis, se hace indispensable para rastrear la Web, no sólo en una forma escalable, pero eficiente, sino también alguna medida razonable de calidad o frescura debe ser mantenido. Un crawler debe elegir con cuidado en cada paso qué página siguiente visitar.

Por ello cuando el crawler se encuentra con errores, problemas de acceso, redirecciones o mucho contenido duplicado suele terminar ignorando grandes secciones de la web.

Hemos de evitar que la web de:

Errores 404 : Si una de nuestras páginas enlaza a una dirección incorrecta (error 404) el crawler la sigue y se encuentra con que no existe. Le hemos hecho perder el tiempo y una petición. Además aunque hoy de un error 404 no dejará de volver a visitarla en el futuro por si hay cambios y vuelve a estar disponible por eso hemos de corregir todos los errores 404 que tiene la web.

Redirecciones internas : enlazamos una página pero al llegar a esa página le decimos al crawler que esta dirección no es la correcta que vaya a esta otra. Hemos vuelto a consumir recursos cuando lo óptimo habría sido enviarlo desde el principio a la dirección correcta.

Contenido vacío o duplicado : La capacidad de la programación web de generar contenido vacío es infinita. Hemos de controlar los parámetros de las urls y la programación para que no generen contenido vacío o duplicados.

Velocidad de carga : cuando el crawler hace una petición a una web tiene que esperar a que esta responda y le envíe los contenidos de la urls que está visitando. Cómo el número de peticiones simultáneas que puede realizar no es infinito una web que tarda mucho en contestar es rápidamente ignorada.



No te pierdas el tema anterior: Novato en SEO, alguien ha leído estos libros?

Salta al siguiente tema: Best Practice for Long Tail keywords on ecommerce?

Quizás también te interese:
Si has encontrado información útil en Exaforo, ayúdanos a seguir creciendo. Muchas gracias por confiar en nosotros!


Volver a Posicionamiento