
Hands-on mit Curl zur Verschleierung von Browser-Fingerabdrücken
Alte Hasen, die sich mit der Sammlung von Netzwerkdaten beschäftigen, wissen, dass das System zur Kontrolle des Windes auf der Website immer raffinierter wird. Proxy-IP ist nicht genug.Wenn Ihre Anfrage in der Kopfzeile erscheint, werden Sie innerhalb weniger Minuten als Bot erkannt.Das erste, worüber wir sprechen werden, ist, wie man curl verwendet, um UA-Parameter (User Agent) zu setzen. Heute wollen wir uns ansehen, wie man mit curl UA-Parameter (User-Agent-Parameter) setzt, und zwar mit dem Proxy-Service von ipipgo, dem als echte Person getarnten Sammelprozess.
Was zum Teufel ist UA?
Es ist einfach Ihre Web-ID. Wenn Sie zum Beispiel eine Website mit Chrome besuchen, wird sie standardmäßig mit einer solchen Markierung versehen:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, wie Gecko) Chrome/114.0.0.0 Safari/537.36
Wenn Ihre curl-Anfrage diesen Parameter nicht enthält, sieht der Server ihn:
curl/7.81.0
Ist das nicht so, als würde man sein Gehirn als "Ich bin ein Roboter" bezeichnen?
Praktische Konfiguration der Curl-Parameter
Einfach trocken, kopieren und einfügen funktioniert:
curl -H "User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, wie Gecko) Chrome/114.0.0.0 Safari/537.36"
--proxy http://user:pass@gateway.ipipgo.com:9020
https://目标网站.com
Beachten Sie hier zwei wichtige Punkte:
| Parameter | Anweisungen |
|---|---|
| -H | Setzen Sie den Request-Header, gefolgt von der spezifischen UA-Zeichenfolge |
| -Vollmacht | Geben Sie die Adresse des Proxyservers an, verwenden Sie hier den Residential Proxy von ipipgo. |
Die drei Fallstricke der UA-Konfiguration
1. Seien Sie nicht faul und verwenden Sie StandardwerteEinige Entwickler versuchen, Zeit zu sparen, indem sie "python-requests/2.28″ schreiben, was sofort die
2. Achten Sie auf Versions-UpdatesVerwenden Sie keine Browser-Versionsnummer, die drei Jahre alt ist, sie ist auf den ersten Blick eine Fälschung.
3. Die richtige Ausrüstung für die richtige AufgabeMobile UA für die mobile Erfassung und Desktop für den PC verwenden
Besser mit ipipgo agent
Es reicht nicht aus, UA zu wechseln.Die echte IP-Adresse wird Sie verraten. Verwenden Sie den Dynamic Residential Proxy von ipipgo, um die Ausgangs-IP für jede Anfrage für eine andere Region zu ändern. z.B. um eine zufällige Rotation einzurichten:
curl -H "Benutzer-Agent: Ihr UA"
--proxy http://user:pass@rotate.ipipgo.com:9030
https://目标网站.com
Bei dieser Kombination von Schlägen kann das Windkontrollsystem der Website nicht erkennen, ob es sich um eine reale Person oder ein Programm in Aktion handelt.
Häufig gestellte Fragen QA
F: Was soll ich tun, wenn ich immer noch erkannt werde, obwohl ich die UA korrekt eingestellt habe?
A: Zur Überprüfung anderer Request-Header-Parameter (Accept-Language, Referer, etc.) wird empfohlen, ipipgo's umfangreiche Proxy-Pakete zu verwenden, die über eine Request-Header-Reinigungsfunktion verfügen
F: Muss ich meine eigene UA-Bibliothek pflegen?
A: Das Enterprise-Paket von ipipgo bietet eine in Echtzeit aktualisierte UA-Datenbank, so dass Sie sich nicht selbst darum kümmern müssen!
F: Was sollte ich tun, wenn meine Proxy-IP häufig ausfällt?
A: Wählen Sie ein Paket mit intelligentem Switching, wie z.B. die Platinum Edition von ipipgo, das automatisch ausgefallene Knoten eliminiert, um eine Verfügbarkeitsrate von 99,9% aufrechtzuerhalten.
Eine letzte Bemerkung.Setzen Sie keine freien Mitarbeiter ein!Diese öffentlichen Proxy-Pools sind schon lange von der Website geschwärzt worden. ipipgo's exklusiver Proxy ist etwas teurer, aber die Erfolgsrate ist es definitiv wert. Jetzt registriert auch senden 10G Verkehr Versuch, genug zu testen.

