
Les mains en l'air avec le curl pour jouer avec l'en-tête de l'hôte
Beaucoup de vieux briscards qui font de la collecte de données ont rencontré cette situation : ils ont manifestement utilisé une IP proxy, le site cible ou identifié un trafic anormal. Cette fois-ci, il est probable que le site soit planté dans leFuite de l'en-tête de l'hôteC'est la fosse. Aujourd'hui, nous allons nous pencher sur la façon de déguiser parfaitement une requête en utilisant une IP proxy avec un en-tête Host personnalisé.
Qu'est-ce qu'une tête d'hôte ?
En termes simples, ce produit est comme l'étiquette de l'adresse sur la liste du courrier. Par exemple, vous commandez dans un est (en supposant que l'IP du proxy), mais la facture du courrier écrit sur l'orthographe "entrepôt XiyuXi", qui ne peut pas porter des gangs. curl par défaut apportera l'adresse réelle de la demande Host header, ce qui expose le fait que vous utilisez le proxy.
Site de roulement typique (ne copiez pas ceci directement !)
curl https://代理IP --header "Host : www.target.com"
Quatre étapes pour une bonne posture
Recommandé iciProxy résidentiel dynamique pour ipipgoLe pool d'IP de leur maison est ridiculement grand, et j'ai personnellement testé que 50 threads sont ouverts en même temps sans faire sauter l'IP. des opérations spécifiques :
curl -x http://user:pass@gateway.ipipgo.io:8080
--connect-to ::www.target.com
-H "Host : www.target.com"
https://目标网站
prendre noteparamètre -connect-toCette opération sordide, permet de contourner la résolution DNS en spécifiant directement la cible, avec l'en-tête Host comestible de meilleure qualité. L'adresse de passerelle utilisée ici est ipipgo, différents paquets peuvent ne pas avoir le même port, n'oubliez pas de vérifier l'arrière-plan.
Guide pratique pour éviter la fosse
Récemment, j'ai rencontré un problème étrange alors que j'aidais un client à comparer les prix du commerce électronique : j'ai ajouté l'en-tête Host, mais le résultat était 404.Le certificat SSL ne correspond pasLa solution est double :
Option 1 : Désactiver la validation des certificats (convient aux environnements de test)
curl -k -x ip ipgo adresse proxy...
Option 2 : Forcer la spécification SNI (recommandé pour les environnements de production)
curl --resolve www.target.com:443:代理IP...
Un petit clin d'œil à ipipgo'sRoutage intelligentqui fait automatiquement correspondre le certificat SSL du site cible, il n'est donc pas nécessaire de les ajouter manuellement.
séance de questions-réponses
Q : Dois-je configurer un en-tête Host si j'utilise le proxy ipipgo ?
R : Son offre avancée comprend le camouflage de l'en-tête de l'hôte, mais des paramètres personnalisés peuvent correspondre plus précisément aux besoins de l'entreprise.
Q : Pourquoi le système renvoie-t-il 403 Forbidden ?
R : Quatre-vingt pour cent de l'IP est la station cible tirée au noir, il faut se dépêcher de changer l'ipipgo.Agent exclusif d'entrepriseL'ensemble est doté d'une rotation automatique de l'IP.
Q : Dois-je modifier le User-Agent en même temps ?
R : C'est nécessaire ! Il est recommandé d'utiliser des bibliothèques d'UA aléatoires, car ipipgo dispose d'un générateur d'UA prêt à l'emploi dans le backend !
Conseils pour les joueurs avancés
Lorsque vous rencontrez un site où l'anti-escalade est particulièrement stricte, vous pouvez essayer l'optionEn-tête d'hôte doubleMéthode de jeu. Commencez par insérer deux hôtes dans l'en-tête de la requête :
-H "Host : www.target.com"
-H "X-Forwarded-Host : www.fake.com"
Dans le cadre de l'initiative de l'ipipgoobscurcissement de l'en-tête de la demandepeut tromper le mécanisme anti-escalade du 90%. Mais attention à la détection de l'ordre HEADER du site cible, qui doit faire l'objet d'une analyse spécifique.
Enfin, ne perdez pas votre temps avec les proxys gratuits. La dernière fois que j'ai testé un pool de proxy open source, 8 IP sur 10 étaient blacklistées, alors autant aller chez ipipgo.forfait de paiement à l'utilisationAu moins, chaque demande est garantie de manger de la PI fraîche. Ce que vous ne comprenez pas peut être directement frappé sur leur service client technique, la vitesse de réponse est plus rapide que certains des vendeurs.

