
Wird CAPTCHA geknackt? Finde zuerst diese Fensterscheibe heraus
Diese kostenlosen CAPTCHA-Erkennungstools im Internet sind, um es ganz offen zu sagen, Bildverarbeitung + maschinelles Lernen. Es ist, als würde man einem dreijährigen Kind beibringen, Zahlen zu erkennen, indem man ihm 100 Bilder mit Zahlen zeigt. Open-Source-Projekte wie Tesseract dieses Zeug, den Umgang mit einfachen digitalen CAPTCHA okay, stieß verzerrt Verformung des blinden.
Proxy-IPs sind in diesem Fall die halbe Miete.
Hardcore CAPTCHA-System mit eigener IP? Warten Sie darauf, dass es in ein Sieb gesperrt wird!Dynamischer Wohnsitz-Proxy für ipipgoSo können Sie bei jeder Anfrage Ihr "Gesicht" ändern, was wie ein Spiel mit der Sichuan-Oper ist, bei dem der Server nicht herausfinden kann, woher Sie wirklich kommen. Hier sind die Daten aus der realen Welt:
| Agent Typ | Erfolgsquote bei der Erkennung | Wahrscheinlichkeit eines Verbots |
|---|---|---|
| Kein Agent | 38% | 72% |
| Generalvertreter | 55% | 41% |
| ipipgo Dynamischer Wohnungsbau | 82% | 9% |
Praktische Übungen zur Erstellung eines CAPTCHA-Killers
Hier ist ein Fuchs in Python, denken Sie daran, diese Bibliotheken zuerst zu installieren:
pip install anfragen opencv-python pytesseract
Der Kerncode ist so geschrieben (denken Sie daran, zu Ihrem eigenen ipipgo-Proxy-Konto zu wechseln):
Anfragen importieren
von PIL importieren Image
proxies = {
'http': 'http://用户名:密码@gateway.ipipgo.com:9021', 'https': 'http://用户名:密码@gateway.ipipgo.com:9021'
'https': 'https://用户名:密码@gateway.ipipgo.com:9021'
}
resp = requests.get('captcha-Adresse', proxies=proxies)
with open('captcha.jpg', 'wb') as f.
f.write(resp.content)
Graustufenbildung mit OpenCV
img = cv2.imread('captcha.jpg', 0)
Holen Sie sich den Tesseract-Erkennungscode hier ab...
Leitfaden zur Vermeidung von Fallstricken: fünf häufige Fehler von Neulingen
1. die für eine IP:Verwenden Sie die automatische Umschaltfunktion von ipipgo und warten Sie nicht, bis Sie blockiert werden, bevor Sie umschalten.
2. die Bildvorverarbeitung überspringen:Keine Rauschunterdrückung, keine Binarisierung, direkte Erkennung ist blind.
3. die Nutzung von kostenlosen Proxy-Pools:Diese öffentlichen Bediensteten wurden schon vor langer Zeit durch das CAPTCHA-System ausgeblendet.
4. die Zeitüberschreitungseinstellungen ignorieren:Vorgeschlagen, mit der 5-Sekunden-Schnellschaltfunktion von ipipgo zu arbeiten
5. starres komplexes CAPTCHA:Wenn Sie auf Google reCAPTCHA stoßen, sollten Sie es umgehen.
Praxisfall: automatische Anmeldung auf einer E-Commerce-Website
Kürzlich half ein Freund, den Fall zu bekommen, mit ipipgo's UK Residential IP + Self-Training-Modell, die Erkennungsrate von 23% bis 68%. der wichtigste Punkt ist hier:
AutoSwitch nach jedem Fehler
von ipipgo import AutoSwitchProxy
proxy = AutoSwitchProxy(region='uk')
headers = proxy.add_headers()
Wenn die Captcha-Erkennung fehlschlägt
if 'captcha_error' in response.text: proxy.rotate_ip()
proxy.rotate_ip() Sekunden für eine neue IP
Fünf Fragen, die Sie unbedingt stellen sollten
F: Muss ich einen bezahlten Bevollmächtigten einsetzen?
A: Neun von zehn Gratis-Agenten scheitern, neue ipipgo-Benutzer haben 2G kostenlosen Traffic, genug, um das Wasser zu testen!
F: Wie wählt man den Bereich des Agenten aus?
A: Schauen Sie sich das Ziel Web-Server-Standort, inländische Station mit der Provinz IP, Übersee-Station wird empfohlen, die Vereinigten Staaten / Deutschland Wohnsitz wählen
F: Was macht ipipgo besser als die anderen?
A: Ihr IP-Pool wird "selbstheilend" sein, automatisch die blockierte IP entfernen, um die Verfügbarkeit von 95% oder mehr zu erhalten!
F: Was soll ich tun, wenn ich auf ein rutschendes Captcha stoße?
A: Einfache Schieberegler können mit Selenium simuliert werden, die Komplexität des Vorschlags auf der Codierung Plattform, tun Sie es nicht selbst!
F: Warum steigt und fällt meine Erkennungsrate?
A: Prüfen Sie die IP-Qualität, verwenden Sie die API von ipipgo, um die aktuellen IPs zu prüfenHaltbarkeitsdauerim Gesang antwortenKreditwürdigkeit
Und schließlich: Die CAPTCHA-Erkennung ist keine seriöse Methode, es wird empfohlen, sie für eigene Systemtests zu verwenden. Wenn Sie es wirklich kommerziell nutzen wollen, ist es besser, über die reguläre Schnittstelle zu gehen, bringen Sie sich nicht in Schwierigkeiten. ipipgo hat Techniker, die mit Ihnen über Compliance-Lösungen beraten können, machen Sie nicht nur herum.

