您现在的位置是:家装资讯
爬虫项目01-山东省招标与采购网
2019-01-28 00:00家装资讯
简介# -*- coding: utf-8 -*- import scrapy from scrapy.cmdline import execute from urllib.parse import urljoin """ 山东省采购与招标网 """ class SdbSpider(scrapy.Spider): name = sdb allowed_domains = [www.sdbidding.org.cn] # 招标公告 #中标公示 #...
# -*- coding: utf-8 -*-
import scrapy
from scrapy.cmdline import execute
from urllib.parse import urljoin
"""
山东省采购与招标网
"""
class SdbSpider(scrapy.Spider):
name = 'sdb'
allowed_domains = ['www.sdbidding.org.cn']
# 招标公告 #中标公示 #采购公告 #成交公示
start_urls = ['http://www.sdbidding.org.cn/bulletins?infoType=11', 'http://www.sdbidding.org.cn/bulletins?infoType=12', 'http://www.sdbidding.org.cn/bulletins?infoType=13&type=1','http://www.sdbidding.org.cn/bulletins?infoType=14&type=2']
def start_requests(self):
num = 0
for start_url in self.start_urls:
while num<=20:#默认爬取得页数,默认爬取20页
num+=1
yield scrapy.FormRequest (start_url,formdata={"pageNo":str(num)},callback=self.get_page)
def get_page(self,response):
start_url=response.url
urls=response.xpath('//td[@class="tit"]//a//@href').extract()
for url in urls:
end_url=urljoin(start_url,url)
yield scrapy.Request(url=end_url,callback=self.get_content)
def get_content(self,response):
#正文处理
title = response.xpath('//h3//text()').extract()[0]
print(title)
ctime = response.xpath('//div[@class="detail-title"]//p//text()').extract()[0]
print(ctime)
content = response.xpath('//div[@class="details"]//p//text()').extract()[0]
print(content)
content_xml = response.xpath('//div[@class="details"]')
print(content_xml)
if __name__ == '__main__':
execute(["scrapy", "crawl", "sdb"])
基于scrapy框架,只是简单写了一下
有什么不好的地方欢迎大家指正,有什么错误也欢迎大家给我指出来,谢谢大家
欢迎大家多多关注,多多支持小编Tags:爬虫,项目,01-,山东省,招标,采购网,coding,ut
相关文章
随机图文
-
这几类房子值得购买,未来升值空间大,优势性多
伴随着社会经济逐渐进入到发展的阶段,如今市场上早已拥有各种不一样的房子,这就能够有效增加大家在买房时... -
2020年最佳搅拌机
A厨房主食几十年来,搅拌机是乔迁、婚礼和毕业礼物的首?H绻?阆胍?煽诘谋?郴虮?骋?希??鞘悄阕詈玫难≡瘛D... -
iPhone11和11 Pro,2个月后:超宽摄像头仍然是我们的
在三星Galaxy Note 10和Google Pixel 4等新手机发布的季节里,iPhone 11、11 Pro和Pro Max一开始就给我留下... -
如果能在19号战机上幸存下来的话,电影院看起来会大不
电影院是我高中时的第二个家。由于一系列奇怪的家庭环境,我在大四的时候撞上了六个朋友的沙发、被褥和客床...