
Spiel mit der Tarnung von Anfrage-Headern: Crawler-Anfragen ähneln mehr den Aktionen echter Menschen
Ältere Fahrer, die mit Webanfragen arbeiten, wissen, dass viele Websites das Verhalten von Maschinen anhand von Merkmalen in der Kopfzeile von Anfragen erkennen. So wie ein Sicherheitsbeamter im Supermarkt auf Leute achtet, die immer den gleichen Artikel nehmen, wird auch der Server ein Auge auf Anfragen haben, die mit dem Standard-Curl konfiguriert sind. DiesmalMasquerading des Anfrage-Headers + Proxy-IPDie Kombination der Kombination ist besonders wichtig, unsere eigenen ipipgo's Proxy-Service nur zu helfen, die Jungs, um dieses Problem zu lösen.
Anfrage für eine Dreifach-Axt mit Kopftarnung
Der erste Schritt istHerausnehmen von MerkmalsparameternEs ist eine gute Idee, curl zu verwenden, um Anfragen mit User-Agent-Parametern zu senden. Wenn Sie eine Anfrage mit curl senden, geben Sie standardmäßig den User-Agent an. Das ist so, als würden Sie eine Uniform tragen, um einkaufen zu gehen, und den Leuten klar sagen, dass Sie zum Arbeiten hier sind.
curl -H "Benutzer-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36"
-H "Accept-Language: zh-CN,zh;q=0.9"
-H "Referer: https://www.example.com/"
--proxy http://user:pass@proxy.ipipgo.cn:8080
https://target-site.com
Der zweite Zug istzufällige Anordnung der ParameterSchreiben Sie nicht in einer festen Reihenfolge wie Annehmen, Verbindung, Gastgeber. Schreiben Sie nicht in einer festen Reihenfolge wie Accept, Connection, Host, genau wie beim Kartenspielen, spielen Sie nicht immer in der Reihenfolge von König und Königin. Getestete Partner wissen, dass die Überlebensrate von ungeordneten Request Headern auf 30% oder mehr steigen kann.
Proxy IPs Gold-Partner
Das Ändern des Request Headers allein reicht nicht aus, Sie müssen mit dem dynamischen Proxy von ipipgo arbeiten. IhrIP-Pool für PrivatpersonenEs gibt diese Vorteile:
- Simulation des Nutzerverhaltens in der Realität
- Automatischer Wechsel der Exit-IP alle 5 Minuten
- Unterstützung von Socks5/Htp-Doppelprotokollumschaltung
Denken Sie daran, einen Timeout-Parameter hinzuzufügen, wenn Sie ihren Proxy verwenden, um ein Hängenbleiben zu vermeiden:
curl --proxy http://dynamic.ipipgo.cn:3128
--proxy-connect-timeout 15
---max-time 30
-H "Cache-Control: max-age=0"
https://target-site.com
Praktischer Leitfaden zur Vermeidung der Grube
Neulinge fallen oft in diese Schlaglöcher:
1. SSL-Fingerabdruck-LeckEinige Websites erkennen TLS-Handshake-Funktionen, daher wird empfohlen, den Befehl curl wie folgt zu ergänzen--tlsv1.2Angegebene Version
2. Zeitzonen-Exposition: Denken Sie daran, hinzuzufügenX-Zeitzone: Asien/ShanghaiDieser gemeinsame Kopf
3. Gerät AuflösungMobilitätsanfragen sollten gestellt werden mitGeräte-Auflösung: 1080x1920diese Art von Parametern
Häufig gestellte Fragen QA
F: Beeinflusst die Reihenfolge der Kopfzeile der Anfrage wirklich die Erkennung?
A: So wie eine E-Commerce-Plattform die Position von Accept-Encoding und Accept-Language überwacht, hat unsere Testgruppe Zehntausende von Anfragen mit dem ipipgo-Proxy durchgeführt, und die Abfangrate der ungeordneten Konfiguration war niedriger als die der Standardkonfiguration 47%
F: Wie hält ein dynamischer Agent eine Sitzung aufrecht?
A: ipipgo'sSitzungstragende AgentenUnterstützung von 30 Minuten fester IP, Hinzufügen von Curl--proxy-keepaliveParameter funktioniert.
F: Wie erkenne ich die Wirkung der Tarnung?
A: Es wird empfohlen, die offizielle Website von ipipgo zu nutzenWerkzeug zur TarnungserkennungWenn Sie Ihren curl-Befehl eingeben, können Sie die Ergebnisse der Parameter sehen.
Upgrade-Spiel-Empfehlungen
Die alten Hasen verwenden ipipgo.Intelligenter Routing-AgentDie besten Ausgangsknoten können automatisch entsprechend der Ziel-Website angepasst werden. Zum Beispiel, wenn Sie das Bild Station klettern wollen, wird auf das mobile Netzwerk IP geschnitten werden, und wenn Sie in Daten-Schnittstelle engagieren wollen, können Sie die Daten-Center-Linie, die besonders einfach zu konfigurieren ist in curl nehmen:
curl --proxy http://smartroute.ipipgo.cn:8888
-H "X-Proxy-Mode: image_crawler"
https://image-site.com
Abschließende Bemerkung: Request-Header-Masquerading ist keine Metaphysik, der Schlüssel ist mehr Testen und Optimieren. Das Tolle an der Verwendung von ipipgo-Proxys ist, dass sieÜberwachung von Abhördaten in EchtzeitWenn Sie keine Verwarnung erhalten können, können Sie sofort eine Verwarnung erhalten, was viel besser ist, als nur damit herumzuspielen.

