
Ne laissez pas l'IP vous freiner ! Proxy suspendu PHP cURL pratique
Le vieux fer à repasser engagé dans la collecte de données comprend sûrement que le site cible a bloqué l'IP plus rapidement que le livre. La semaine dernière, des amis du commerce électronique et moi-même nous sommes plaints du fait qu'ils utilisaient PHP pour faire grimper le prix des produits concurrents ; au bout d'une demi-heure, plus de 20 adresses IP étaient bloquées. Cette fois, il est nécessaire d'utiliser un proxy IP pour sauver la scène ; aujourd'hui, nous prenons le cURL le plus couramment utilisé pour ouvrir le couteau, afin de vous apprendre à changer d'adresse IP en douceur.
Ne marchez pas dans les puits avec la configuration de base de cURL
Commençons par un exemple illustrant la facilité avec laquelle un novice peut se retourner :
$ch = curl_init() ;
curl_setopt($ch, CURLOPT_URL, "Destination URL") ;
curl_exec($ch) ;
Écrire de cette manière équivaut à se promener nu sur Internet, le site cible peut trouver votre véritable IP en quelques minutes :CURLOPT_PROXY(adresse de procuration),CURLOPT_PROXYTYPE(type de protocole),CURLOPT_TIMEOUT(délai d'attente).
Exemple de code proxy
Prenons l'exemple du proxy Socks5 d'ipipgo (veillez à remplacer le mot de passe de votre propre compte) :
$proxy = 'socks5://user:pass@proxy.ipipgo.net:端口' ;
$ch = curl_init() ;
curl_setopt($ch, CURLOPT_URL, "https://目标网站") ;
curl_setopt($ch, CURLOPT_PROXY, $proxy) ;
curl_setopt($ch, CURLOPT_PROXYTYPE, CURLPROXY_SOCKS5) ; curl_setopt($ch, CURLOPT_PROXYTYPE, CURLPROXY_SOCKS5) ;
curl_setopt($ch, CURLOPT_TIMEOUT, 15) ; curl_setopt($ch, CURLOPT_TIMEOUT, 15) ;
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1) ; curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1) ;
$result = curl_exec($ch) ;
if(curl_errno($ch)){
echo 'Rollover : '.curl_error($ch) ;
}
curl_close($ch) ;
Rappel de la clé : si vous rencontrez des problèmes avec les certificats SSL, la fonctionNe jamais utiliser CURLOPT_SSL_VERIFYPEER=>falseLa position correcte pour cette opération dangereuse est de demander au service clientèle d'ipipgo de vous mettre en relation avec un certificat exclusif.
Conseils pour l'accord des paramètres
Ajustez ces paramètres en fonction du scénario de l'entreprise :
| prendre | Configurations recommandées |
|---|---|
| acquisition haute fréquence | Délai d'attente 8-10 secondes + proxy de commutation automatique |
| Téléchargement de fichiers volumineux | Timeout 30 secondes + Exclusive IP |
| Simuler la connexion | Activer le stockage des COOKIE + IP résidentielles statiques |
Foire aux questions QA
Q : La configuration du proxy est réussie mais je ne peux pas me connecter ?
R : Vérifiez d'abord si le port est ouvert, utilisez telnet pour tester la connectivité. Les utilisateurs d'ipipgo peuvent aller en arrière-plan pour générer une IP de test temporaire.
Q : Comment choisir un package pour Enterprise Capture ?
R : L'accès à haute fréquence se fait par le biais d'un accès résidentiel dynamique (version entreprise), tandis que le besoin d'une identité fixe nécessite l'utilisation d'un accès résidentiel statique. N'essayez pas d'être bon marché et d'utiliser des IP partagées, qui sont bloquées par lots.
Où trouver un agent fiable ?
Recommandé par mon propre frèreipipgoLe temps de latence mesuré par la ligne spécialisée TK peut être réduit à 200 ms près. L'accent est mis sur trois avantages :
- Pool d'IP dynamiques mis à jour quotidiennement 20%IP ressources, ne pas avoir peur d'être bloqué
- Le client est doté d'un routage intelligent qui sélectionne automatiquement le nœud le plus rapide.
- L'assistance technique répond en quelques secondes. La dernière fois que j'ai envoyé un ordre de travail à 3 heures du matin, quelqu'un m'a répondu !
Les prix des forfaits sont clairement indiqués (2024.08 dernier prix) :
Dynamic Residential (Standard) à partir de $7.67/GB
Dynamic Residential (Enterprise) à partir de $9.47/GB
Résidentiel statique 35 $/unité/mois
Enfin, il faut savoir que la collecte par proxy n'oublie pas de contrôler la fréquence des requêtes, même la meilleure IP ne peut pas supporter un bombardement de centaines de fois par seconde. Personnellement, je vous suggère de prendre les ressources de test gratuites pour vous entraîner, puis de vous familiariser avec l'environnement de production.

