
Teach your browser to hang a proxy IP
浏览器挂代理最简单粗暴的方法就是改系统设置。拿Chrome举例,在设置里搜”代理”,找到”打开您计算机的代理设置”,这里能看到手动设置代理的选项框。把从ipipgo拿到的IP地址和端口填进去,比如112.89.xx.xx:8800这种格式。记得保存设置后最好重启下浏览器。
要是嫌每次手动改太麻烦,可以装SwitchyOmega这类插件。新建个情景模式,选代理协议(HTTP/HTTPS/SOCKS5看情况),把ipipgo提供的认证信息填进去。这里有个坑要注意:如果是动态住宅IP,得勾选Automatic IP switching的选项,不然IP可能用着用着就失效了。
// 示例:Python requests库设置代理
import requests
proxies = {
"http": "http://用户名:密码@gateway.ipipgo.net:端口",
"https": "http://用户名:密码@gateway.ipipgo.net:端口"
}
response = requests.get("目标网址", proxies=proxies)
爬虫老司机必备技巧
搞爬虫的兄弟最怕遇到反爬,这时候就得靠代理IP池。用ipipgo的动态住宅代理,建议选rotating pattern of sessions,每次请求自动换IP。这里教你们个绝招:把代理IP和User-Agent做组合随机,反爬识别率能降七成。
实测过Scrapy框架的话,在middlewares.py里加这段代码最稳当:
class ProxyMiddleware(object):
def process_request(self, request, spider):
request.meta['proxy'] = "http://用户代码:访问密钥@动态代理入口"
粘性会话要加这个参数
request.meta['dont_retry'] = True
碰到需要登录的网站,记得开sticky session模式,让同一个IP保持20分钟以上。ipipgo后台可以设置会话时长,别超过目标网站的正常用户操作时间就行。
API对接防坑指南
对接API最容易栽在认证环节。ipipgo的接口需要传三个参数:app_key,timestamprespond in singingsign。重点说下签名生成,要用HMAC-SHA256加密,别用MD5这种过时的算法。
建议先在Postman里调试好再写代码。这里给个成功响应的示例:
{
"code": 200,
"data": {
"proxy": "123.456.xx.xx:3128",
"expire_time": 600
}
}
要是返回错误码403,八成是白名单没设对。去ipipgo控制台把服务器出口IP加进去,别傻乎乎直接用本地IP测试。
Handbook on Mine Clearance of Common Problems
Q: What can I do if the agent can't connect?
先ping下网关地址,能通则检查认证信息,特别注意密码里有没有特殊字符。还不行的话,在ipipgo后台换个接入点试试,不同地区的网关稳定性有差异。
Q:IP生效时间太长?
动态代理默认5秒生效,如果超过10秒没反应,可能是IP池库存问题。建议切换国家/地区,或者联系客服开通高速通道。
Q:爬虫速度被拖慢?
适当调整并发数和超时时间,建议参考这个配置表:
| Business Type | 推荐并发 | timeout setting |
|---|---|---|
| Product Collection | 50 threads | 15 seconds. |
| Price monitoring | 30 threads | 20 seconds. |
| 数据挖掘 | 10 threads | 30 seconds |
选套餐避坑诀窍
ipipgo的动态住宅分标准和企标套餐,主要区别在IP数量和QPS限制。普通用户选标准版足够,要是做海外数据采集,记得开City-level positioning功能。他们的静态住宅代理适合需要长期固定IP的场景,比如社交账号运营,不过价格贵三成左右。
有个隐藏技巧:月初买套餐会送5%的流量包,赶上有活动还能叠加优惠。企业用户记得申请Dedicated Export IP,能避免和他人共享网关导致连带封禁。

