Mac Python环境 miniConda +scrapy 搭建
简单快捷的方式搭建Python环境,避免污染和麻烦的依赖问题
minoConda安装
1.到清华镜像下载最新的miniConda.sh脚本
2.然后bash安装bash ~/Downloads/Anaconda3-4.4.0-MacOSX-x86_64.sh
(修改为你的路径)
3.安装完毕打开命令行(我这里是iTerm),输入conda回车,有提示信息
4.我们用conda create -n 环境名(随便取) 创建和系统环境隔离的python环境,创建完毕的提示(我的环境名叫apple)
5.source activate apple
进入环境,进入后会在最前面显示apple
Scrapy安装
6.安装scrapy conda pip install scrapy
7.创建scrapy项目 conda scrapy startproject tutorial
8.按照scrapy官网教程创建第一个爬虫(或者复制下面的内容到tutorial下面的spiders目录,取名为quotes_spider.py)
import scrapy
class QuotesSpider(scrapy.Spider):
name = "quotes"
def start_requests(self):
urls = [
'http://quotes.toscrape.com/page/1/',
'http://quotes.toscrape.com/page/2/',
]
for url in urls:
yield scrapy.Request(url=url, callback=self.parse)
def parse(self, response):
page = response.url.split("/")[-2]
filename = 'quotes-%s.html' % page
with open(filename, 'wb') as f:
f.write(response.body)
self.log('Saved file %s' % filename)
9.然后执行 tutorial scrapy crawl quotes
10.爬取结束