
¿No puedes evitar el bloqueo de IP? Prueba este truco de "Shift".
Hermanos dedicados a rastrear entender, ahora anti-escalada ladrones del sistema, no se mueve para bloquear la IP, especialmente con el selenio, tales como características del navegador, es simplemente un objetivo vivo. El año pasado, tengo un proyecto, acaba de ejecutar media hora fue bloqueado más de 200 IP, casi rompió el teclado.
Y entonces encontré un truco malvado...Poner un chaleco de proxy en Selenium. El principio es como jugar juegos en línea para abrir un pequeño número, cada vez que inicie sesión en una identidad diferente. Aquí se recomienda utilizar el proxy dinámico residencial ipipgo, su grupo de IP es lo suficientemente profunda, he probado las continuas 24 horas de datos en ejecución sin ser prohibido.
from selenium import webdriver
proxy = "123.123.123.123:8888" dirección proxy proporcionada por ipipgo
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument(f'--proxy-server=http://{proxy}')
driver = webdriver.Chrome(options=opciones_cromo)
No dejes que la web vea tu verdadera cara
No basta con cambiar la IP, también hay que cambiar la huella digital del navegador. Algunos sitios web filtrarán la IP real a través de WebRTC, que es cuando necesitasdoble protección::
1. Desactivar la fuga de WebRTC
chrome_options.add_argument("--disable-blink-features=AutomationControlled")
chrome_options.add_experimental_option("excludeSwitches", ["enable-automation"])
2. Agentes de usuario aleatorios
| Tipo de equipo | Programa recomendado |
|---|---|
| Windows (ordenador) | Selección aleatoria de las versiones 120-124 de Chrome UA |
| Mac | Utilizando Safari versión 16-17 UA |
El sentido del ritmo en el cambio de IP es importante
He visto a demasiados novatos cometer este error, ya sea cambiar demasiado fuerte y ser tratado como un bot, o cambiar demasiado lento y ser baneado. Sugerencia basada en los baches por los que he pasado:
- Sitio web ordinario: cambio de IP cada 30-50 peticiones
- Sitio crítico: cambio cada 5-10 solicitudes
- Con el modo de conmutación inteligente de ipipgo, puede adaptarse automáticamente a la frecuencia de detección del sitio web objetivo.
¿Qué pasa si me quedo sin IP?
Hubo una captura de datos doble 11 y el pool de IPs tocó fondo de repente. Más tarde se descubrió queUso jerárquico de la PI::
- Uso de la IP del centro de datos para la detección de la primera ronda
- Adquisición de datos del núcleo de procesamiento IP residencial
- Conserve la IP móvil de 5% para situaciones imprevistas
El Pool de Proxy Híbrido de ipipgo soporta este tipo de estrategia, cambiando automáticamente los tipos de IP para diferentes escenarios, ahorrándole muchos dolores de cabeza.
Guía práctica para evitar el pozo
Recientemente ayudé a un amigo a poner a punto un proyecto de rastreo, utilizando estas configuraciones para obtener 500.000 datos en tres días:
La autenticación proxy se gestiona automáticamente
proxy_auth_plugin = crear_extensión_proxy(
proxy_host="gateway.ipipgo.com",
proxy_port=9021,
proxy_user="Su cuenta",
proxy_pass="clave dinámica"
)
chrome_options.add_extension(proxy_auth_plugin)
Preguntas frecuentes QA
P: ¿Qué debo hacer si el proxy se agota a menudo?
R: Compruebe si la función de retención de sesión está activada, ipipgo background puede establecer el modo de conexión larga.
P: ¿Cómo puedo comprobar si el agente está en vigor?
R: Visite http://ip.ipipgo.com/checkip para ver las IP de salida utilizadas actualmente
P: ¿Qué configuración se requiere para un proyecto de nivel empresarial?
R: Contacte directamente con el servicio de atención al cliente de ipipgo para abrir un agente dedicado, ¡soporta más de 100 conmutaciones simultáneas por segundo!
Estos trucos son dinero real para las lecciones aprendidas, especialmente con la función de enrutamiento inteligente de ipipgo que evita automáticamente los segmentos IP etiquetados. Recientemente han sacado un nuevo paquete de protección contra la huella digital del navegador, y van a probar el agua el mes que viene, y entonces compartirán con vosotros los resultados reales de las pruebas.

