• 微信公众号:美女很有趣。 工作之余,放松一下,关注即送10G+美女照片!

0基础爬虫

开发技术 开发技术 5小时前 1次浏览

1、配环境

点击下载python:https://www.python.org/ftp/python/3.7.7/python-3.7.7-amd64.exe

D:PythonPython37Scripts

然后跟着视频做。

2、装pandas、time和retrying库

pip install pandas

3、跑代码

import pandas as pd
import time
from retrying import retry

@retry
def post(i):
    url=f'http://www.sxredcross.org.cn/index/donation/lovedetails/id/13.html?name=&donor=&time_start=2021-10-06&time_end=2021-10-10&id=13&page={i}'
    df=pd.read_html(url,encoding='utf-8')[0]
    return df

# 爬取第1-11页
for i in range(1,11):
    df=post(i)
    df.to_csv('1-11.csv',mode='a+',encoding='utf-8',header=None,index=0)
    print(f'-********-第{i}页',time.strftime('时间:%Y-%m-%d %H:%M:%S-********-',time.localtime(time.time())))
    if i==float(end)-1:
        print('n--------搞定啦啦,1-11.csv')

程序员灯塔
转载请注明原文链接:0基础爬虫
喜欢 (0)