IPIPGO proxy ip Script gratuit de vérification de l'adresse IP d'un proxy : partage de code de détection automatisée en Python

Script gratuit de vérification de l'adresse IP d'un proxy : partage de code de détection automatisée en Python

Main dans la main pour vous apprendre à tamiser l'IP proxy gratuit peut être utilisé pour ramper le vieux fer les gens savent, l'IP proxy gratuit neuf sur dix est un gouffre. Aujourd'hui, faisons quelque chose de concret, utilisons Python pour écrire un script de détection automatisé, trois minutes pour passer au crible l'IP qui peut être utilisée. Pas de panique, le code ne fait que vingt lignes, l'homme blanc peut aussi être utilisé directement. import....

Script gratuit de vérification de l'adresse IP d'un proxy : partage de code de détection automatisée en Python

手把手教你筛出能用的免费代理IP

搞爬虫的老铁们都知道,免费代理IP十个有九个是坑。今天咱们整点实在的,用Python写个自动化检测脚本,三分钟筛出能用的IP。别慌,代码就二十行,小白也能直接套用。


import requests
from concurrent.futures import ThreadPoolExecutor

def check_proxy(proxy):
    try:
        resp = requests.get('http://httpbin.org/ip', 
                          proxies={'http': proxy, 'https': proxy},
                          timeout=5)
        return proxy if resp.json()['origin'] in proxy else None
    except:
        return None

with open('proxy_list.txt') as f:
    proxies = [line.strip() for line in f]

with ThreadPoolExecutor(max_workers=50) as executor:
    results = executor.map(check_proxy, proxies)
    
with open('valid_proxies.txt', 'w') as f:
    f.write(''.join(filter(None, results)))

脚本核心套路拆解

这玩意儿看着简单,其实藏着三个Conseils pour éviter les pièges: :

1. 用httpbin.org做验证,比直接访问百度更靠谱(有些代理会伪造百度响应)

2. 多线程开到50并发,实测这个数不会触发反爬又能保证速度

3. 严格比对返回IP和代理IP,防住那些lit. pendre la tête d'un mouton en vendant de la viande de chien的假代理

Guide pratique pour éviter la fosse

最近发现有些免费代理会玩时间差把戏:验证时能用,真到用的时候就掉链子。解决办法是在脚本里加个二次验证:


def double_check(proxy):
    for _ in range(3):   连续测三次
        if not check_proxy(proxy):
            return False
    return True

Les défauts inhérents à l'agence libre

就算脚本再牛,免费代理这些硬伤没得治:

Type de problème probabilité d'occurrence résultat
突然失联 78% 爬虫中途挂掉
La réponse éclairée est à la vitesse de la tortue 65% L'efficacité des acquisitions s'effondre
IP occulté 43% 触发网站反爬

正经解决方案

要搞正经项目,还是得用ipipgo的代理服务。他家动态住宅代理有个绝活——IP存活时间自定义,做数据采集能省30%流量费。比如爬电商评论时,把IP时效设成30分钟,刚好够爬完一个商品页。

Données de comparaison dans le monde réel :


| 代理类型   | 平均响应速度 | 可用率 | 日均掉线次数 |
|------------|--------------|--------|--------------|
| 免费代理   | 2.8s         | 12%    | 47次         |
| ipipgo动态 | 0.3s         | 99.6%  | 0.2次        |

Questions fréquemment posées

Q:验证通过的代理用的时候还是报错?
A : 80% rencontrésLe piège de l'actualité,免费代理平均存活时间就7分钟,建议验证后立即使用

Q:超时时间设多久合适?
A:根据业务场景灵活调整,做实时数据抓取建议3秒,做历史数据备份可以放到10秒

Q:怎么再提速?
A:把max_workers调到100,同时把验证地址换成自己服务器(避免httpbin.org的访问限制)

升级姿势推荐

当项目需要hautement concomitantepeut-être长期稳定运行时,直接上ipipgo的静态住宅代理。特别是做海外电商价格监控时,他家静态代理能做到同一个城市出口IP维持12小时不断线,完美模拟真实用户行为。

最近有个骚操作:用他家TikTok解决方案+代理IP做直播数据监控,直接省了三分之二的服务器开销。关键是能绕过平台的地理限制,搞竞品分析简直不要太爽(当然要在合规范围内操作哈)。

Cet article a été initialement publié ou compilé par ipipgo.https://www.ipipgo.com/fr/ipdaili/47190.html

scénario d'entreprise

Découvrez d'autres solutions de services professionnels

💡 Cliquez sur le bouton pour plus de détails sur les services professionnels

Vente de fin d'année de nouvelles IP dynamiques 10W+ pour les États-Unis

Fournisseur professionnel de services d'IP proxy étrangers-IPIPGO

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Nous contacter

Nous contacter

13260757327

Demande de renseignements en ligne. QQ chat

Courriel : hai.liu@xiaoxitech.com

Horaires de travail : du lundi au vendredi, de 9h30 à 18h30, jours fériés.
Suivre WeChat
Suivez-nous sur WeChat

Suivez-nous sur WeChat

Haut de page
fr_FRFrançais