
Te enseñamos a usar curl para disfrazarte de navegador real
Recientemente, muchos amigos que se dedican a la recopilación de datos se preguntan por qué siguen siendo identificados por los sitios web a pesar de haber utilizado IPs proxy. Esto es como si vas a la mascarada, aunque lleves máscara pero postura al andar seguirás siendo reconocido por los conocidos. Hoy hablaremos de como rizar el rizo a esta "herramienta de recogida de datos" para hacer un camuflaje completo, centrándonos en como combinar el servicio de proxy ipipgo para que la web no pueda reconocerte.
¿Qué demonios es una huella digital del navegador?
En pocas palabras, el sitio web identifica si usted es un bot o no por más de 20 características, comúnmente:
Tres características principales que deben tenerse en cuenta:
1. User-Agent (como su peinado)
2. Información del encabezado de la solicitud (similar al estilo de vestir)
3. Características de la dirección IP (como la postura al caminar)
Una gran cantidad de novatos piensan que acaba de obtener un proxy IP en el final de la cuestión, de hecho, como sólo se cambió de ropa no se cambió de zapatos, el sitio todavía puede atraparte. Tenemos que utilizar el proxy dinámico residencial de ipipgo, con los siguientes trucos para realmente sigilo.
Rizo camuflaje configuración de cuatro piezas
He aquí una configuración de un caso real (una solución con la que ayudé a un cliente de comercio electrónico el año pasado):
curl -L
-H "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, como Gecko) Chrome/91.0.4472.124 Safari/537.36"
-H "Accept-Language: zh-CN,zh;q=0.9"
-H "Sec-Fetch-Mode: navigate"
--proxy http://user:pass@gateway.ipipgo.io:9021
https://target-site.com
vigilar cuidadosamente-proxyLos parámetros aquí utilizan el canal proxy de ipipgo, tienen más de 30 millones de IPs residenciales en su pool proxy, que es mucho más fiable que las IPs regulares de la sala de servidores.
Lista de cabeceras de solicitud que deben establecerse
| encabezado de la solicitud | demostración correcta | falsa demostración |
|---|---|---|
| Usuario-Agente | Contiene información completa sobre la versión | Garabatos personalizados |
| Accept-Encoding | gzip, deflate, br | Sin fijar ni garabatear |
| Referencia | La dirección real de la página del preludio | fijo |
He aquí un escollo con el que hay que tener cuidado:No utilice generadores aleatorios¡! Muchos sitios comprueban las cabeceras de las peticiones individuales para ver si se contradicen. Recomendamos utilizar la biblioteca de huellas dactilares de navegador proporcionada por ipipgo, que coincide automáticamente con las características reales de los dispositivos.
El juego avanzado de la IP proxy
La diferencia entre un agente normal y un agente premium es como un teléfono público y una línea privada:
Proxy ordinario:
- Tiempo de supervivencia de la IP <5 minutos
- Demora de solicitud>2 segundos
- Tasa de éxito<60%
Proxy ipipgo:
- Retención de sesión 30 min +
- Respuesta media 800ms
- Tasa de éxito 97%+
Específicamente.Estrategia de rotación de PISe recomienda cambiar la IP cada 50 peticiones manteniendo el mismo User-Agent. Esto no es fácil de activar el control de viento, pero también puede mantener la continuidad de la sesión.
Preguntas frecuentes
P: ¿Qué pasa si sigo bloqueado después de utilizar estos métodos?
R: Primero compruebe la calidad de la IP, muchas IP de proxy gratis entran pronto en la lista negra. Se recomienda cambiar ipipgo exclusivo paquete de proxy, cada IP es una dirección limpia por primera vez.
P: ¿Tengo que mantener mi propio grupo de IP?
R: ¡No es necesario en absoluto! El backend de ipipgo filtrará automáticamente las IPs inválidas, y también puede encontrar automáticamente el mejor nodo de exportación de acuerdo con el sitio web de destino.
P: ¿Cómo se controla la frecuencia de adquisición?
R: Recuerda la mnemotecnia:"Intervalos aleatorios + operaciones de tiempo compartido". Lo mejor es añadir una espera aleatoria de 0,5-3 segundos entre peticiones, que puede acelerarse convenientemente durante las primeras horas de la mañana.
Por último, me gustaría recordarles que incluso los medios técnicos más sofisticados no pueden separarse de un servicio proxy fiable. Al igual que nuestro equipo está utilizando ahora ipipgo versión empresarial, viene con encabezado de solicitud función de camuflaje automático, que la configuración manual es mucho más preocupante. En particular, suSistema inteligente de rutasLa función de evitar automáticamente los segmentos IP bloqueados realmente corta mucho el pelo.

