很多情况下,在一个爬虫里面需要存储不同的表,那么相应的在items.py里定义不同的类定义不同的字段,在scrapy里如何实现呢?
一、items.py定义
items里定义不同类,不同的字段,每个类里是对应的是每个表的字段
1 | from scrapy import Item, Field |
二、piplines如何分别存储
爬虫主程序里分别导入items.py里两个类实例化以后,进行了存储,yield item提交给pipline处理,pipline如何进行分别存储呢?用if isinstance(item, items.py里面的类)
进行判断就可以了。
CXYMysql是我操作数据库的类
1 | from jianshutotal.class_mysql import CXYMysql |