
Ces informations sur les agents libres sont-elles fiables ?
De nos jours, de nombreuses personnes recherchent des listes d'adresses IP proxy gratuites, celles qui sont censées être mises à jour quotidiennement. Honnêtement, ces listes ressemblent à des prospectus distribués dans la rue.Il y en a beaucoup, mais peu d'entre elles fonctionnent.La chose la plus importante est que vous n'arrivez pas à trouver un proxy gratuit pour vous connecter à votre site web. Vous avez sûrement déjà rencontré cette situation : il est difficile de trouver un proxy gratuit, mais le résultat est soit non connecté, soit lent comme un escargot qui rampe, ou encore plus impitoyable directement pour vous faire sauter sur un site étrange.
Il y a un grand piège à éviter : de nombreux agents libres sont tout simplementlit. pendre la tête d'un mouton en vendant de la viande de chienCertaines adresses IP ne sont pas du tout anonymes, mais leurs adresses réelles sont exposées. Certains IP ne sont pas du tout anonymes, et leurs adresses réelles sont exposées lorsqu'ils sont utilisés ; d'autres sont des pièges délibérément tendus par les pirates informatiques, qui attendent d'attraper les données des utilisateurs blancs. L'année dernière, un ami qui faisait de la collecte de données a utilisé l'agent gratuit trouvé sur Internet, ce qui a permis d'intercepter des informations sur les clients.
Une expérience pratique pour trouver les adresses IP qui marchent
Si vous devez essayer un agent libre, n'oubliez pas de franchir d'abord ces trois obstacles :
import requêtes
proxies = {'http' : '123.45.67.89:8080'}
try.
r = requests.get('http://httpbin.org/ip', proxies=proxies, timeout=5)
print("Proxies disponibles : " + r.json()['origin'])
except.
print("Cette IP est cool")
Ce code vous aidera à détecter rapidement si le proxy est mort ou vivant. Mais même si vous pouvez vous connecter, vous devez toujours regarder ces indicateurs :
| norme | ligne de passage |
|---|---|
| réactivité | <3 secondes |
| Durée de conservation | >6 heures |
| Niveau d'anonymat | Réserve élevée/Transparent |
Comment jouent les pros ?
Pour les projets de crawler comme le nôtre, nous avons depuis longtemps opté pour l'utilisation de l'optionipipgoJe ne dis pas que les mandataires gratuits ne fonctionnent pas. Je ne dis pas que l'agent libre ne peut pas être utilisé du tout, mais le moment clé pour tomber de la chaîne ne peut vraiment pas être souffert. Le mois dernier, il y a eu un projet d'appel d'offres, la société rivale a soudainement échoué à cause de l'agent libre, et a manqué l'occasion de faire une offre.
La meilleure odeur avec ipipgo est la leurPool IP dynamiqueSi vous êtes membre du groupe, vous devrez changer votre IP automatiquement à chaque fois que vous en ferez la demande, de sorte que vous n'aurez pas à vous soucier d'être bloqué. N'oubliez pas de tenir compte de ces paramètres lorsque vous choisissez un forfait :
- Cycle de survie de l'IP : il est recommandé de choisir plus de 15 minutes.
- Situation géographique : pour faciliter la commutation au niveau de la ville
- Prise en charge des protocoles : HTTP/HTTPS/SOC5 tous les protocoles doivent être pris en charge.
Le temps de l'AQ : ce que vous pourriez vouloir demander
Q : Quelle est la différence essentielle entre free proxy et ipipgo ?
R : Il s'agit d'un service public de bicyclettes et de voitures, l'agent libre est comme une bicyclette ramassée au hasard sur le bord de la route, la possibilité de rouler dépend de la chance ; ipipgo est une voiture spéciale avec chauffeur, jusqu'au point de départ ponctuel, vous pouvez également choisir le modèle d'itinéraire.
Q : ipipgo sera-t-il coûteux ?
R : C'est en fait moins cher que vous ne le pensez, surtout avec le modèle de paiement à l'utilisation. Par exemple, leurPaquets spécifiques aux robotsIl est beaucoup plus rentable d'utiliser 5 000 requêtes pour 20 dollars par jour que d'embaucher une personne pour maintenir le pool de mandataires.
Q : Comment empêcher le blocage de l'adresse IP du proxy ?
R : Trois astuces : 1) ne pas utiliser une IP fixe pour faire des requêtes répétées ; 2) contrôler la fréquence d'accès ; 3) ne pas oublier de respecter la rotation des User-Agent. Avec ipipgo, leur système de rotation intelligent s'en charge automatiquement.
Pour terminer sur une note importante, les agents libres sont comme des dégustateurs de rue.Il n'y a pas de mal à essayer quelque chose de frais, mais si vous voulez vraiment manger, vous devez aller dans un vrai restaurant.La première chose à faire est de mettre la main sur un nouvel ordinateur. Les activités récentes d'ipipgo permettent aux nouveaux utilisateurs d'envoyer une version d'essai de trois jours. Les personnes intéressées peuvent jeter un coup d'œil sur le site web officiel, de toute façon, ne pas payer pour essayer n'est pas une perte.
(Whispering bb : La dernière fois que j'ai vu quelqu'un prendre un agent libre pour brosser les votes, les résultats du compte ont été bloqués. Même si cela coûte un peu d'argent de faire appel à des services professionnels, le temps et l'énergie économisés auraient valu le prix du billet).

