
Le enseñará a utilizar cURL para colgar el proxy para obtener datos
Los rastreadores deben entender que el hierro viejo, el acceso directo desnudo al sitio en cuestión de minutos en la IP bloqueada. esta vez tenemos que sacrificar la IP proxy esta arma mágica, hoy tomamos la navaja suiza en la línea de comandos cURL para demostrar cómo utilizar la IP proxy para agarrar con seguridad los datos.
Empecemos con algo seco.La dirección del servidor proxy para ipipgo es la siguiente: http://username:password@gateway.ipipgo.com:8020 Sólo tienes que sustituir el nombre de usuario y la contraseña por la información de autenticación de tu cuenta. Anota esta dirección, tendrás que hacer la prueba más tarde.
Configuración del agente Triple Axe
Cuando escriba comandos en el terminal, añada un-xpodrá colgar el proxy. A modo de ejemplo:
curl -x http://user123:pass456@gateway.ipipgo.com:8020 https://target-site.com/data.json
Esto es algo a tener en cuenta.Tres puntos claveEl tipo de proxy debe ser correcto (http/https/socks5), el puerto no debe estar escrito incorrectamente y la información de autenticación no debe omitirse. Si se devuelve el código de error 407, es probable que la contraseña de la cuenta sea incorrecta.
| parámetros | corresponde al inglés -ity, -ism, -ization | valor de ejemplo |
|---|---|---|
| -x / -proxy | Especificar un servidor proxy | http://user:pass@gateway.ipipgo.com:8020 |
| -U / -proxy-usuario | Configuración individual de la información de autenticación | usuario:pass |
Miniteatro de captura del mundo real
Supongamos que desea capturar el precio de un sitio de comercio electrónico, en primer lugar utilice ipipgo'sinterfaz taquimétricaElige un nodo rápido:
curl -x http://user:pass@gateway.ipipgo.com:8020 https://speedtest.ipipgo.com/latency
Ver que el tiempo de respuesta devuelto está dentro de los 200 ms indica que este nodo es suficientemente rápido. A continuación, a la cosa real:
curl -x http://user:pass@gateway.ipipgo.com:8020 -H "User-Agent: Mozilla/5.0" -L https://mall.com/product/12345 -o datos_precios.html
hacer hincapié enRecuerda añadir el parámetro -L para seguir automáticamente la redirección, y -o para guardar el resultado en un archivo. Si se encuentra con un error de certificado, puede añadir el parámetro -insecure para omitir la verificación, pero el entorno formal debe utilizarse con precaución.
Botiquín para casos difíciles
P: ¿Qué debo hacer si no puedo conectarme al agente?
R: Primero haz ping a gateway.ipipgo.com para ver si pasa, luego comprueba la fecha de caducidad de la cuenta. Se recomienda utilizar ipipgoInterfaz de detección de supervivencia:: https://status.ipipgo.com/checkip
P: ¿Cómo cambio de una IP regional a otra?
R: En el panel de control de ipipgo, seleccione el punto de acceso para la región especificada, por ejemplo, si desea el nodo de Shangai, utilice sh.gateway.ipipgo.com:8030, recuerde que los puertos pueden ser diferentes en diferentes regiones.
P: ¿Qué debo hacer si me bloqueo con frecuencia?
R: En el comando cURL agregue el parámetro -proxy-negotiate para habilitar la conmutación automática, con el servicio de rotación dinámica de ipipgo, cada minuto cambia automáticamente la IP, la tasa medida en vivo puede ser más de 98%.
Consejos privados para entendidos
1. Utilización-connect-timeoutEstablece un tiempo de espera de 5 segundos. No esperes a que el nodo falle.
2. Escriba el parámetro proxy en el archivo de configuración ~/.curlrc, para no tener que escribir el comando cada vez.
3. Cuando necesite un proxy https, recuerde cambiar la cabecera del protocolo a https://.
4. Apoyo empresarial al ipipgoProxy de adquisición dinámica APIEl pool IP es adecuado para escenarios que requieren un gran número de pools IP.
Por último, anon, ipipgo ha estado recientemente en elpaquete de pago por usoNo estoy seguro de si usted es un nuevo usuario, pero me gustaría darle una prueba de 5G de tráfico. La calidad de su agente residencial es realmente superior, la última vez que abrí 200 hilos al mismo tiempo no fueron bloqueados, hacer la recolección de datos hermano mayor puede probar.

