文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
14.2 定义 Item
创建完工程后,首先要做的不是编写Spider,而是定义Item,确定我们需要提取的结构化数据。主要定义两个Item,一个负责装载用户信息,一个负责装载用户关系。代码如下:
class UserInfoItem(scrapy.Item): # define the fields for your item here like: # id user_id = scrapy.Field() # 头像img user_image_url = scrapy.Field() # 姓名 name = scrapy.Field() # 居住地 location = scrapy.Field() # 技术领域 business = scrapy.Field() # 性别 gender = scrapy.Field() # 公司 employment = scrapy.Field() # 职位 position = scrapy.Field() # 教育经历 education = scrapy.Field() # 我关注的人数 followees_num = scrapy.Field() # 关注我的人数 followers_num = scrapy.Field() class RelationItem(scrapy.Item): # 用户id user_id =scrapy.Field() # relation 类型 relation_type =scrapy.Field() # 和我有关系的人的id列表 relations_id = scrapy.Field()
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论