¿Cuál es la diferencia entre Puppeteer y Selenium?
El viejo hierro de las pruebas de automatización debe haber oído hablar de estas dos herramientas, pero muchas personas no pueden distinguir entre su puerta de entrada. En pocas palabras, Puppeteer es como un francotirador profesional, especializada en Chrome, mientras que Selenium es más como una navaja suiza, lo que el navegador se puede tirar. Por ejemplo, usted quiere a la recogida por lotes de precios de comercio electrónico, con Puppeteer más rápido; si usted tiene que ser compatible con diferentes navegadores para probar, no es Selenium.
¿Cómo funcionan las IP proxy en estas dos herramientas?
Hacer la recopilación de datos es el mayor dolor de cabeza es IP bloqueada, esta vez usted tiene que confiar en el proxy IP para renovar sus vidas. En Puppeteer para colgar proxy, el código se parece a un ladrón refrescante:
const puppeteer = require('puppeteer');
async function ejecutar() {
const browser = await puppeteer.launch({
args: ['--proxy-server=http://user:pass@ipipgo-proxy.com:8080']
});
// Funcionamiento normal después de eso...
}
La configuración del proxy de Selenium es algo más prolija y debe manejarse con objetos Options:
from selenium import webdriver
proxy = "ipipgo-proxy.com:8080"
options = webdriver.ChromeOptions()
options.add_argument(f'--proxy-servidor={proxy}')
driver = webdriver.Chrome(options=opciones)
Delimitar el foco de atención:Independientemente del marco que utilice, recuerde elegir un servicio de agencia fiable. Como ipipgo casa dinámica IP residencial, viene con la función de sustitución automática de IP, puede evitar eficazmente el mecanismo anti-escalada.
¿Cuál es la mejor manera de elegir entre estas dos monturas?
Es más intuitivo dar a los chicos toda la tabla comparativa:
término de comparación | Titiritero | Selenio (informática) |
---|---|---|
Navegadores compatibles | Serie Cromo | Navegador completo |
velocidad de ejecución | la velocidad del rayo | nivel medio |
dificultad inicial | Tres días sin clase. | Es una semana de práctica. |
Compatibilidad con proxy | HTTP/Socks están bien. | Algunos de los controladores deben configurarse |
Si tienes prisa y tienes que lidiar con páginas web complejas, no puedes equivocarte con Puppeteer. Pero si tu padre quiere ver los resultados de Firefox, entonces deberías usar Selenium.
Preguntas frecuentes QA
P: ¿Por qué sigue bloqueado incluso después de colgar el proxy?
R: En su mayoría agente de calidad no es buena, muchos agentes libres en el mercado son diez mil personas montar. Recomendado para utilizar ipipgo exclusiva piscina IP, cada sesión con una nueva IP, pro-medición puede llevar un tesoro anti-escalada.
P: ¿Y si necesito utilizar varios navegadores a la vez?
R: Tienes que usar un pool de IPs proxy en este punto, asignando diferentes IPs a cada instancia del navegador. La API de ipipgo soporta la obtención de IPs en bloque, así que puedes meterlas en un bucle y usarlas:
ip_list = get_ipipgo_ips(count=5) toma 5 IPs frescas a la vez
for ip in ip_list:
Ejemplo de inicio de un navegador con un proxy
P: ¿Qué debo hacer si encuentro un CAPTCHA?
R: Un buen agente puede reducir la probabilidad de activación del CAPTCHA, pero realmente encontrado o tienen que recoger la plataforma de codificación. Se recomienda añadir un mecanismo de reintento de fallo en el código, la detección de la CAPTCHA cambiará automáticamente ipipgo nueva IP para reintentar.
Di algo desde el corazón.
Lo que más miedo me da de la automatización no son los bugs de código, sino ser chantajeado por la web de destino. He utilizado siete u ocho servicios de proxy, y finalmente he utilizado ipipgo durante mucho tiempo sólo por el bien de la estabilidad. Él tiene una función de "IP checkup" es bastante interesante, puede detectar automáticamente si el proxy está expuesto, que es particularmente útil para los hermanos que necesitan para ejecutar secuencias de comandos durante mucho tiempo.
¡Por último, me gustaría recordar a los novatos: no seas perezoso en la configuración del proxy! He visto a la gente debido a la configuración del proxy no son correctos, difícil de Selenio en la "carrera de cara ium", corriendo medio día sólo para encontrar que la IP no surtió efecto. Se recomienda establecer la configuración del proxy en elwhatismyip.comEste es el tipo de sitio para probar si el proxy funciona antes de empezar oficialmente a trastear con él.