
Engagez-vous dans la collecte de données, les patrons regardent, main dans la main pour vous apprendre à utiliser le proxy IP pour saisir la laine ZoomInfo !
Récemment, des amis du commerce extérieur se sont plaints que les données de l'entreprise sur ZoomInfo ne pouvaient pas être saisies. Soit le compte est bloqué, soit la page web tourne en rond. Je connais bien ce problème et je vais donc le décomposer pour vous donner quelques conseils.
ZoomInfo attrape trois grands puits, dans combien d'entre eux avez-vous marché ?
Commençons par quelques sites de renversement courants :
1) Juste après l'exploration de 200 données, l'adresse IP est mise sur liste noire.
2) La page web affiche une erreur 403 bien que le crawler soit activé.
3. les informations sur les entreprises de différentes régions ne peuvent pas être chargées.
Neuf fois sur dix, c'est l'exposition à l'IP qui est en cause, et les techniciens de ZoomInfo ne se laissent pas faire.Accès à haute fréquence, IP fixe, fonctionnement anormalCe sont là quelques traits de caractère qui attirent les gens.
L'IP par procuration est la loi du goût véritable
Cette chose l'est, franchement.Le gilet qui vous couvre.Le site ZoomInfo voit les logs d'accès comme s'il s'agissait d'un utilisateur normal naviguant sur le site. Par exemple, si vous utilisez le proxy résidentiel d'ipipgo et changez l'adresse IP d'une personne réelle pour chaque requête, ZoomInfo verra les logs d'accès comme s'il s'agissait d'un utilisateur normal qui navigue, et vous ne pourrez pas dire s'il s'agit d'une machine ou d'une personne réelle.
| prendre | Agent général | proxy dynamique ipipgo |
|---|---|---|
| Nombre de demandes par jour | 500 fois doivent être bloquées | 100 000+ solide |
| Taux de répétition IP | 50% et plus | Dans la limite de 0,3% |
tutoriel pratique
Prenez Python par exemple, et utilisez le service proxy d'ipipgo pour perturber la collecte de données :
importation de requêtes
from itertools import cycle
Liste des proxies du backend ipipgo
proxies = [
"http://user:pass@gateway.ipipgo:9020",
"http://user:pass@gateway.ipipgo:9021".
... Préparer au moins 20+ noeuds
]
proxy_pool = cycle(proxies)
for page in range(1, 100) : current_proxy = next(proxy_pool)
current_proxy = next(proxy_pool)
try : current_proxy = next(proxy_pool)
response = requests.get(
"https://www.zoominfo.com/search",
proxies={"http" : current_proxy},
headers={"User-Agent" : "Mozilla/5.0 (Windows NT 10.0) what's random"}, timeout=10
timeout=10
)
Ajoutez votre code d'analyse ici...
print(f "Page {page} capturée avec succès !")
except Exception as e.
print(f "Échec avec {current_proxy}, passage automatique au suivant")
Attention ciblée :N'utilisez jamais l'agent utilisateur par défaut de Python dans les en-têtes. Il est recommandé de changer aléatoirement le logo de votre navigateur toutes les 50 requêtes.
Temps consacré à l'assurance qualité (les patrons le demandent souvent)
Q : Est-il possible d'utiliser une procuration gratuite ?
R : Ne soyez pas ridicule ! Ces proxys publics sont enregistrés depuis longtemps par ZoomInfo, avec dix accrochages à neuf. Le proxy exclusif d'ipipgo, bien qu'il coûte de l'argent, gagne en IP propre et stable.
Q : Comment définir la fréquence de commutation IP ?
R : En fonction de la quantité de données, la recommandation générale est la suivante :
- Saisir 10 000 entrées par jour : changement d'IP toutes les 100 entrées
- Saisie de plus de 50 000 données : changement tous les 20 articles
- Collecte de données transnationales : les adresses IP des différents pays doivent être utilisées séparément.
Q : Qu'est-ce qui fait qu'ipipgo est meilleur que les autres ?
R : Sa famille possède trois grandes compétences : 1) une véritable bibliothèque d'adresses IP résidentielles, 2) le nettoyage automatique des adresses IP figurant sur la liste noire, 3) la prise en charge d'un positionnement précis par pays/ville. La dernière fois que j'ai aidé un client à obtenir des données d'une entreprise américaine de matériel médical, le taux de réussite a directement doublé avec une adresse IP locale à Los Angeles.
L'ultime magie anti-blocage
Rappelez-vous ces trois choses à faire et à ne pas faire :
✅ Demander à des intervalles aléatoires (fluctuation de 0,5 à 3 secondes)
✅ Simuler les mouvements de la souris
✅ Nettoyer régulièrement les cookies
Ne pas faire de raid sur la collection au milieu de la nuit
❌ Ne pas opérer à un point fixe dans le temps
❌ Ne pas utiliser l'IP chinoise pour capter des données européennes et américaines.
Enfin, je voudrais dire que la collecte de données est un jeu du chat et de la souris. L'utilisation des bons outils (comme ipipgo) permet de faire 80% moins de détours, après tout, les choses professionnelles doivent être faites par un professionnel. Nous avons aidé plus de deux douzaines d'entreprises de commerce extérieur à obtenir des données, bon usage !

