
¿Se te ha roto el CAPTCHA? Resuelve primero esta ventana
Esas herramientas gratuitas de reconocimiento de CAPTCHA que hay en Internet, por decirlo sin rodeos, son procesamiento de imágenes + aprendizaje automático. Es como enseñar a un niño de tres años a reconocer números, tienes que mostrarle 100 imágenes con números. Proyectos de código abierto como Tesseract estas cosas, tratando de CAPTCHA digital simple bien, se encontró con la deformación distorsionada de los ciegos.
Las IP proxy son la mitad de la batalla en este caso.
¿Sistema CAPTCHA hardcore con su propia IP? ¡Espere a que se bloquee en un colador!Proxy dinámico residencial para ipipgoTe permite cambiar de "cara" cada vez que haces una petición, lo que es como jugar a la Ópera de Sichuan, donde el servidor no puede averiguar de dónde vienes realmente. Aquí están los datos del mundo real:
| Tipo de agente | porcentaje de éxito en el reconocimiento | probabilidad de prohibición |
|---|---|---|
| Ningún agente | 38% | 72% |
| Agente general | 55% | 41% |
| ipipgo Residencial Dinámico | 82% | 9% |
Manos a la obra para construir un CAPTCHA killer
Esta es una castaña en Python, recuerda instalar primero estas librerías:
pip install peticiones opencv-python pytesseract
El código central está escrito de esta manera (recuerde cambiar a su propia cuenta proxy ipipgo):
importar solicitudes
from PIL import Imagen
proxies = {
http: http://用户名:密码@gateway.ipipgo.com:9021, https: http://用户名:密码@gateway.ipipgo.com:9021
https: https://用户名:密码@gateway.ipipgo.com:9021
}
resp = requests.get('dirección captcha', proxies=proxies)
con open('captcha.jpg', 'wb') como f.
f.write(resp.content)
Haciendo escala de grises con OpenCV
img = cv2.imread('captcha.jpg', 0)
Recoge el código de reconocimiento de Tesseract aquí...
Guía para evitar trampas: cinco errores comunes de los principiantes
1. Muere por una IP:Utiliza la función de cambio automático de ipipgo, no esperes a que te bloqueen para cambiar.
2. Omitir el preprocesamiento de imágenes:Sin reducción de ruido, sin binarización, el reconocimiento directo es ciego.
3. Uso de proxy pools gratuitos:Esos agentes públicos fueron borrados por el sistema CAPTCHA hace mucho tiempo.
4. Ignorar los ajustes de tiempo de espera:Sugerido para trabajar con la función de cambio rápido de 5 segundos de ipipgo.
5. CAPTCHA Complejo Rígido:Si te encuentras con Google reCAPTCHA, debes rodearlo.
Caso práctico: inicio de sesión automático en un sitio de comercio electrónico
Recientemente ayudó a un amigo para conseguir el caso, utilizando ipipgo IP residencial del Reino Unido + modelo de auto-formación, para mencionar la tasa de reconocimiento de 23% a 68%. el punto clave está aquí:
AutoSwitch después de cada fallo
from ipipgo import AutoSwitchProxy
proxy = AutoSwitchProxy(region='uk')
headers = proxy.add_headers()
Cuando falla el reconocimiento de captcha
if 'captcha_error' in response.text: proxy.rotate_ip()
proxy.rotate_ip() segundos para una nueva IP
Cinco preguntas que sin duda querrá hacer
P: ¿Tengo que utilizar un apoderado de pago?
R: Nueve de cada diez agentes gratuitos fracasan, los nuevos usuarios de ipipgo tienen 2G de tráfico gratuito, ¡suficiente para probar el agua!
P: ¿Cómo elegir la zona de agentes?
R: Mira la ubicación del servidor web de destino, la estación nacional con la provincia de IP, la estación de ultramar se recomienda elegir los Estados Unidos / Alemania residencia
P: ¿Qué hace que ipipgo sea mejor que el resto?
R: Su reserva de IP será "autorreparable", eliminará automáticamente la IP bloqueada, ¡para mantener la disponibilidad de 95% o más!
P: ¿Qué debo hacer si encuentro un captcha deslizante?
¡R: Deslizador simple puede ser simulado con selenio, la complejidad de la propuesta en la plataforma de codificación, no lo haga usted mismo!
P: ¿Por qué sube y baja mi tasa de reconocimiento?
R: Compruebe la calidad de la IP, utilice la API de ipipgo para comprobar la IP actual.Caducidadresponder cantandocalificación crediticia
Por último: el reconocimiento CAPTCHA no es una forma seria, se recomienda utilizarlo en sus propias pruebas del sistema. Si realmente quieres usarlo comercialmente, es mejor ir a través de la interfaz regular, no te metas en problemas. ipipgo tiene técnicos que pueden consultar con usted sobre soluciones de cumplimiento, no te metas.

