
Vamos, hablemos del proxy wget.
Recientemente, un montón de hierro viejo haciendo la recopilación de datos están preguntando cómo utilizar wget bajo las cosas con autenticación de usuario y contraseña. Esta cosa es simple, pero también simple, pero también problemático. Vamos a romperlo hoy y lo frota en pedazos, para que pueda aprender en tres minutos.
Veamos por qué necesitamos la certificación proxy.
Por ejemplo, si compra un paquete proxy de ipipgo, la dirección que le dan tiene este aspecto:http://username:password@gateway.ipipgo.com:8080. El truco está en que tienes que poner la contraseña en la petición. Si simplemente no te gusta en la línea de comandos, wget no la reconocerá y tendrás que usar parámetros específicos.
Práctico para ajustarse a los parámetros de certificación
He aquí la cuestión. Recuerda estos dos parámetros de oro de la asociación:
wget --proxy-user=su número de cuenta
--proxy-contraseña=su contraseña
http://目标网址
Tenga en cuenta que estos dos parámetros tienen que serse producen por parejasni uno menos. Cuando uses el proxy de ipipgo, recuerda cambiar la contraseña de tu cuenta por la información de autenticación que te dan.
No te asustes cuando encuentres errores, los conductores veteranos te enseñan a desminar
He aquí un escollo habitual para los novatos:
Código de error 407: Se requiere autenticación proxy
Esto significa que el servidor proxy no está recibiendo información de autenticación. Compruebe primero tres cosas:
1. ¿Está invertida la contraseña de la cuenta?
2. ¿Faltan dos signos menos delante de los parámetros?
3. ¿Es correcto el número de puerto de la dirección proxy?
El método del perfil del vago
Si utilizas el proxy todos los días, es demasiado engorroso tener que modificar los parámetros cada vez. En el~/.wgetrcAñade estas líneas al archivo:
use_proxy = on
http_proxy = http://用户名:密码@gateway.ipipgo.com:端口
https_proxy = http://用户名:密码@gateway.ipipgo.com:端口
Después de hacer esto, cada vez que utilices wget, irá automáticamente al proxy. Los usuarios de ipipgo deben tener en cuenta que su dirección proxy debe ser la dirección exclusiva que se muestra en la consola.
Tiempo de control de calidad: las preguntas más frecuentes en un solo lugar
P: ¿Qué pasa si hay símbolos especiales en mi contraseña?
R: Envuélvalo entre comillas, por ejemplo -proxy-password="Abc123″.
P: ¿Cómo puedo alternar entre el uso de varios agentes al mismo tiempo?
R: Cambie temporalmente el proxy añadiendo el parámetro -no-proxy a la línea de comandos, o cambie el archivo .wgetrc.
P: ¿Tiene efecto el agente de ensayo?
R: Primero conwget -O- http://httpbin.org/ipVer si la IP devuelta es una IP proxy
¿Por qué recomendar el servicio proxy de ipipgo?
Después de usar 7 u 8 servicios proxy, no es por nada que acabé encerrándome en ipipgo:
1. autenticación flexible, soporte para nombre de usuario contraseña / lista blanca dos modos
2. tasa de supervivencia del nodo proxy de 99%, conmutación automática fuera de línea
3. optimizado para escenarios de recopilación de datos, el número de concurrencia para dar suficiente
Especialmente si está realizando un proyecto de rastreo a largo plazo, su paquete deProxies estáticos de larga duraciónEs un verdadero ahorro, un agente puede durar medio mes sin cambiar.
El último recordatorio: prácticas seguras para recordar
Dos comentarios finales:
- No escribas contraseñas en texto plano en los scripts.
- Prueba el agua con una lima pequeña.
- 403 error compruebe primero la estrategia anti-subida del sitio de destino
- El fondo de ipipgo puede ver el consumo en tiempo real, ¡recuerda comprobar tu factura con regularidad!
Si has hecho esto, ya eres un maestro del proxy wget. Si usted tiene alguna nueva pregunta, bienvenido a ipipgo sitio web oficial para encontrar servicio al cliente chica regañando, sus respuestas técnicas pueden ser más detalladas que mi hombre marrón.

