
Wir zeigen Ihnen, wie Sie pip verwenden, um das Proxy-IP-Auflösungstool zu installieren.
Kürzlich fragte eine Menge von Datenerfassung Freunde Lao Zhang, warum sie schrieb der Crawler ist immer blockiert IP, diese Sache ist wirklich nicht kompliziert, der Schlüssel zum Programm, um eine "Schutzkleidung" tragen. Heute werden wir nag, wie pip zu verwenden, um diejenigen zu installieren können automatisch die Proxy-IP-Bibliothek zu lösen, durch die Art und Weise, eine zuverlässige Proxy-Dienstleister.
Was muss ich vorbereiten, bevor ich das Lager belade?
Zuerst müssen Sie sicherstellen, dass Sie es auf Ihrem Computer haben.Python 3.6 und höherHalten Sie die Tastenkombination win+R gedrückt, geben Sie cmd ein und tippen Sie in das schwarze Fenster.python --versionSie werden die Version sehen können. Wenn die Version zu alt ist, empfehlen wir, direkt zur offiziellen Website zu gehen, um eine neue Version zu erhalten.
Um zum Beispiel die requests-Bibliothek zu installieren
pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple
Beachten Sie, dass hier die Tsinghua Mirror Source verwendet wird, und die Download-Geschwindigkeit viel schneller sein kann. Wenn Sie eine Meldung erhalten, dass die Pip-Version alt ist, führen Siepython -m pip install --upgrade pipUpgrade nach unten.
Proxy-IP-Auflösung in der realen Welt - dreifache Axt
Hier sind drei Bibliotheken, die ich getestet und für gut befunden habe, wobei wir uns auf die erste konzentrieren:
| Bibliotheksname | Besonderheiten | Anwendbare Szenarien |
|---|---|---|
| anfragen-html | Selbst-parsing | Einfache Webseitenerfassung |
| scrapy | Rahmen für die berufliche Ebene | Groß angelegte Projekte |
| pyquery | jQuery-Syntax | Komplexe Seitenanalyse |
Tatsächlicher Codeschnipsel (denken Sie daran, ihn durch Ihren eigenen Proxy zu ersetzen)
from requests_html import HTMLSession
proxies = {
'http': 'http://user:password@ipipgo-proxy.com:9020',
'https': 'http://user:password@ipipgo-proxy.com:9020'
}
session = HTMLSession()
Antwort = session.get('https://目标网站', proxies=proxies)
print(response.html.find('title'))
Konzentrieren Sie sich hierauf.Proxies-ParameterHier wird das von ipipgo bereitgestellte Tunneling-Proxy-Format verwendet. Deren Proxys müssen die IPs nicht manuell wechseln, was besonders einsteigerfreundlich ist.
Leitlinien für die Entminung häufiger Fallstricke
F: Was soll ich tun, wenn ich beim Laden der Bibliothek immer wieder Fehler erhalte?
A: Prüfen Sie zunächst, ob das Netzwerk keinen Proxy geöffnet hat. Manchmal wird der globale Proxy geöffnet, anstatt eine Verbindung zur Pip-Quelle herzustellen. Es wird empfohlen, die Proxy-Software vorübergehend auszuschalten und es erneut zu versuchen.
F: Der Code läuft durch, aber es können keine Daten abgerufen werden?
A: 80% der Proxy-IP wird von der Ziel-Website erkannt. Diesmal zu ändernHochwertige Agentenwie z. B. die exklusiven IP-Pakete von ipipgo, bei denen jede IP eine echte Wohn-IP ist, die von einer echten Person genutzt wurde.
F: Wie kann ich feststellen, ob eine Vollmacht in Kraft ist?
A: Fügen Sie dem Code eine Test-URL hinzu:session.get('http://httpbin.org/ip')um festzustellen, ob die zurückgegebene IP eine Proxy-IP ist.
Warum empfehlen Sie ipipgo?
Nicht umsonst sperrt man ipipgo, nachdem man den Proxy-Dienst über drei Jahre lang genutzt hat:
- Inländischer, selbst gebauter Serverraum, Latenz kann innerhalb von 50 ms kontrolliert werden
- Unterstützung von Pay-as-you-go, Neueinsteiger erhalten einen kostenlosen 1G-Traffic-Test
- Exklusives AngebotMechanismus für fehlgeschlagene WiederholungsversucheAutomatische IP-Umschaltung
Besondere Erwähnung ihrerIntelligente Routing-FunktionDas System kann automatisch den Proxy-Knoten zuordnen, in dem sich die Ziel-Website befindet. Wenn Sie z. B. japanische Websites erfassen möchten, weist das System automatisch die Export-IP des Serverraums Tokio zu.
Upgrade-Spiel-Tipps
Wenn Sie ein langfristiges Sammelprojekt durchführen, empfiehlt es sich, die Proxy-Konfiguration in eine separate Konfigurationsdatei zu schreiben:
config.py
PROXY_CONFIG = {
'proxy_host': 'ipipgo-proxy.com',
'proxy_port': 9020,
'passwort': 'ihr passwort'
}
Dann verweisen Sie auf diese Konfiguration in der Hauptanwendung, so dass es bequem ist, den Proxy-Dienstanbieter später zu ändern. Übrigens kann der Hintergrund von ipipgo die API-Aufrufe in Echtzeit anzeigen, was besonders bei der Fehlersuche hilfreich ist.
Abschließend möchte ich Neulinge daran erinnern, keine kostenlosen Agenten für billig zu verwenden. Bevor ein Kunde gierig nach billig, die Ergebnisse der Sammlung von all den gefälschten Daten, und schließlich haben zu überarbeiten, um zu wiederholen. Professionelle Dinge oder zu ipipgo solche professionellen Dienstleister zuverlässig, sparen Sie Zeit, um zwei weitere Projekte, die zurück sind zu nehmen.

