
Utilisation de cURL pour jouer avec l'en-tête Host de l'IP du proxy
Récemment, beaucoup de vieux ferrailleurs ont demandé pourquoi l'utilisation d'un proxy IP pour accéder au site est toujours bloquée. Il existe une barrière cachée appeléeParamètres de l'en-tête de demande d'hôteL'en-tête de l'hôte est le code clé. C'est comme lorsque vous vous rendez à un poste de messagerie pour récupérer un colis, il ne suffit pas de dire votre nom, vous devez indiquer le code d'enlèvement, et l'en-tête de l'hôte est ce mot clé.
Qu'est-ce qu'une tête d'hôte ?
En termes simples, l'en-tête Host indique au serveur : "Je cherche le site web xxx". Certains sites web vérifient ce paramètre et, s'ils constatent qu'il ne correspond pas à l'adresse de la visite réelle, ils vous bloquent en tant que robot.
curl -H "Host : www.target.com" http://1.2.3.4
La ligne de code ci-dessus revient à dire : "Bien que je sois connecté à l'IP 1.2.3.4, mais en fait pour trouver www.target.com的". À ce stade, l'IP du proxy doit être accompagnée d'une modification de l'en-tête Host, faute de quoi elle sera exposée en quelques minutes.
Paramètres pratiques du proxy cURL en quatre étapes
Voici un marron utilisant le service proxy d'ipipgo :
curl -x http://user:pass@proxy.ipipgo.io:8080
-H "Host : www.targetsite.com"
https://目标网站真实IP地址
Points à voir absolument :
| paramètres | correspond à l'anglais -ity, -ism, -ization | valeur de l'exemple |
|---|---|---|
| -x | Spécifier un serveur proxy | proxy.ipipgo.io:8080 |
| -H | Définition de l'en-tête de la requête | Hôte : www.xxx.com |
Scène de renversement courante AQ
Q:Pourquoi y a-t-il encore un 403 après avoir défini l'en-tête Host ?
R : 80% est la qualité de l'IP du proxy n'est pas bonne, avec ipipgo.Proxies statiques de longue duréeL'en-tête Host est automatiquement adapté.
Q : Dois-je définir plusieurs en-têtes de requête en même temps ?
R : Il est recommandé d'ajouter un camouflage User-Agent :
-H "Host : www.xx.com" -H "User-Agent : Mozilla/5.0..."
Q : Que dois-je faire si l'IP proxy ne parvient soudainement pas à se connecter ?
R : Le back-office d'ipipgo dispose d'unCommutation intelligentele changement de ligne automatique est 10 fois plus rapide que le changement manuel.
Guide pour éviter la fosse
1) Lorsque vous rencontrez une erreur de certificat SSL, n'oubliez pas d'ajouter le champ-k(mais ne l'utilisez pas pour des opérations sensibles)
2. ne pas fixer le délai d'attente à plus de 30 secondes, suggérer d'utiliser le délai d'attente d'ipipgo.Canal de 5 secondes
3) Si vous devez changer fréquemment d'hôte, vous pouvez utiliser leur pool de proxy dynamique API pour gagner du temps.
Et enfin, le support proxy d'ipipgo !Pré-liaison de l'en-tête d'hôteLe site web de l'entreprise a été configuré directement en arrière-plan, de sorte que vous n'avez même pas besoin de modifier le code. Le test réel avec leur agent résidentiel + les paramètres d'hébergement corrects, le taux de réussite de la collecte peut monter en flèche de 30% à 90%+.

