
Warum bleibt curl immer in der Umleitung stecken, wenn eine Proxy-IP verwendet wird?
engagiert in Crawling Freunde müssen diese Situation angetroffen haben: die Website mit Curl anfordern, natürlich sollte die Seite automatisch springen tot nicht Daten zurück. Vor allem nach der Verwendung eines Proxy-IP.Fehlerquote bei der Umleitung verdoppelt sich direkt. Hier ist eine kalte - Websites über 60% werden mehr als 3 Seitensprünge in der Anmelde-/Authentifizierungssitzung einrichten.
// Typische Fehlerdemonstration (Umleitungsverfolgung nicht aktiviert)
curl -x http://代理IP:端口 http://example.com/login
Zu diesem Zeitpunkt kann der Server einen 302-Statuscode zurückgeben, aber Ihr curl sitzt fest wie ein Holzpflock. ipipgos Techniker hat das herausgefunden.Bei Abfragen ohne den Parameter -L besteht eine 78% hohe Wahrscheinlichkeit, dass kritische Daten verloren gehen.insbesondere bei der Verwendung dynamischer Agentenpools.
Drei Tricks, damit die Locken gehorsam den Sprüngen folgen
Tipp 1: Aktivieren Sie den Tracking-Modus(Als würde man einen Hund an der Leine führen.)
curl -L -x http://用户名:密码@ipipgo proxy IP:port Ziel-URL
Diese -L-Parameter ist curl's GPS-Navigation, Begegnung 301/302 Status-Code wird automatisch auf die neue Adresse zu jagen. Beachten Sie, dass der Proxy-Format von ipipgo mit Account-Passwort, nicht lernen, einige Tutorials nur schreiben IP nicht Authentifizierung.
Tipp Nr. 2: Kopfzeilen-Informationsbarrikade(verhält sich wie ein normaler Browser)
curl -L -x http://ipipgo代理IP:端口
-H "Benutzer-Agent: Mozilla/5.0"
-H "Referer: https://上一级页面"
Ziel-URL
Viele Websites prüfen den Request-Header, wenn man die IP des Wohn-Proxys von ipipgo mit dieser Tarnung verwendet, kann die Erfolgsquote von 40% bis 90%+ genannt werden.
| Parameter | Wirkung | empfohlener Wert |
|---|---|---|
| -max-redirs | Anti-Unendlichkeitssprung | Empfohlen 5-8 Mal |
| -connect-timeout | Zeitüberschreitung der Verbindung | 15 Sekunden sind optimal. |
Aufzeichnungen über tatsächliche Kampffälle (Lektionen, die durch Blut und Tränen gelernt wurden)
Als ich letzte Woche einen der kostenlosen Proxys testete, blieb ich bei 10 aufeinanderfolgenden Anfragen auf der Verifizierungsseite hängen. Der Wechsel zu ipipgo'sLanglebige statische IPDanach stellte sich heraus, dass es sich um ein Cookie handelte, das nicht mit dem richtigen Cookie geliefert wurde - es stellte sich heraus, dass einige Websites mit dem Cookie der ursprünglichen Anfrage springen.
// Korrekte Körperhaltung (Cookies speichern und verwenden)
curl -L -x http://ipipgo代理IP:端口
-c cookies.txt -b cookies.txt
Ziel-URL
Hier ist eine geschmacklose Operation: Verwenden Sie ipipgo'sFunktion zur geografischen Bindung von IPWenn Sie die Proxy-IP mit dem Standort des Servers abgleichen, der die Seite aufruft, ist die Antwortgeschwindigkeit direkt dreimal so hoch.
Leitlinien zur Minenräumung bei gemeinsamen Problemen
Q:Habe ich alles richtig konfiguriert oder ist der Sprung fehlgeschlagen?
A: neunzig Prozent ist der Proxy-IP wurde die Ziel-Website zog schwarz, eilen, um ipipgo ändernDedizierte IP von hoher QualitätVerwenden Sie nicht diese beschissenen Gemeinschaftspools.
F: Ich bekomme einen chaotischen Code nach dem Sprung?
A: 80% gzip-Kompression, denken Sie daran, den Parameter -compressed hinzuzufügen:
curl -L --compressed -x http://ipipgo代理IP:端口 Website
F: Wie kann ich feststellen, ob der Sprung erfolgreich war?
A: Fügen Sie den Parameter -v hinzu, um den detaillierten Prozess zu sehen, wobei Sie sich auf diese beiden Stellen konzentrieren:
< HTTP/1.1 302 Found
< Standort: https://跳转地址
Ein letzter kalter Tipp: Verwenden Sie ipipgosAutomatische API-IP-ÄnderungFunktion, mit dem Curl Retry-Parameter, können vollautomatische Sprung-Tracking zu erreichen, kann die spezifische Konfiguration Schema ihrer Familie Technologie zu fertigen Skripten zu finden.

