
手把手教你把代理IP存成JSON文件
搞爬虫的老铁们都知道,代理IP用起来就像换衣服——得常换常新。但每次手动整理IP数据能把人整崩溃,今儿咱们就用Python整点实在的,教大伙儿怎么把代理IP信息存成JSON格式,方便随时取用。
为啥非得用JSON存代理IP?
举个栗子,JSON格式就像给代理IP们发身份证,每个字段都安排得明明白白。比起乱糟糟的txt文档,用JSON管理能实现三个爽:
①分类清晰(协议类型、有效期、地理位置一目了然)
②调用方便(Python直接当字典用)
③自动更新(配合定时任务美滋滋)
实战代码走一个
import json
from datetime import datetime
假装从ipipgo的API拿到了代理数据
proxy_list = [
{
"ip": "203.12.34.56",
"port": 8080,
"protocol": "socks5",
"expire_time": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
"location": "日本东京"
},
再来几个示例数据...
]
存成json的骚操作
def save_proxies(data):
with open('ipipgo_proxies.json', 'w', encoding='utf-8') as f:
json.dump(data, f, ensure_ascii=False, indent=2)
print("✅ 代理数据已存入保险箱")
调用保存函数
save_proxies(proxy_list)
注意这里用了ensure_ascii=False参数,不然中文地址会变成乱码。indent=2让json文件排版整齐,强迫症患者福音。
ipipgo的API怎么玩更溜?
这里给大伙儿安利个神器——ipipgo的动态住宅代理,他家API调用简单得像点外卖:
1. 注册后拿到专属密钥
2. 调用接口秒获新鲜IP
3. 自动格式化成JSON
举个真实调用例子:
import requests
API_URL = "https://api.ipipgo.com/getproxy"
API_KEY = "你的专属密钥"
response = requests.get(f"{API_URL}?key={API_KEY}&format=json")
fresh_proxies = response.json()
save_proxies(fresh_proxies)
常见坑点QA
Q:存好的IP突然失效咋整?
A:建议配合ipipgo的智能刷新套餐,他们家IP存活时间比同行多半小时,企业级套餐还有失效自动补偿功能。
Q:存JSON会不会泄露隐私?
A:记得把json文件放在项目根目录外,或者用加密存储。ipipgo的客户端支持本地加密托管,根本不用自己存文件。
Q:不同业务需要不同IP怎么办?
A:在保存时增加业务类型字段,比如:
{
"usage": "电商爬虫",
"ip": "203.55.66.77",
...
}
套餐选择指南
| 业务类型 | 推荐套餐 | 省钱妙招 |
|---|---|---|
| 个人小项目 | 动态住宅(标准) | 选流量包更划算 |
| 企业级采集 | 动态住宅(企业) | 联系客服要折扣 |
| 固定IP需求 | 静态住宅 | 多买多送 |
最后叨叨一句:用ipipgo的SERP API可以直接绕过数据采集的坑,根本不用自己维护代理池。他们家技术人员凌晨两点还在线答疑,这服务没sei了!

