Mac Python环境 miniConda +scrapy 搭建
简单快捷的方式搭建Python环境,避免污染和麻烦的依赖问题
minoConda安装
1.到清华镜像下载最新的miniConda.sh脚本
2.然后bash安装bash ~/Downloads/Anaconda3-4.4.0-MacOSX-x86_64.sh(修改为你的路径)
3.安装完毕打开命令行(我这里是iTerm),输入conda回车,有提示信息
4.我们用conda create -n 环境名(随便取) 创建和系统环境隔离的python环境,创建完毕的提示(我的环境名叫apple)
5.source activate apple进入环境,进入后会在最前面显示apple
Scrapy安装
6.安装scrapy conda pip install scrapy
7.创建scrapy项目 conda scrapy startproject tutorial
8.按照scrapy官网教程创建第一个爬虫(或者复制下面的内容到tutorial下面的spiders目录,取名为quotes_spider.py)
import scrapy
class QuotesSpider(scrapy.Spider):
    name = "quotes"
    def start_requests(self):
        urls = [
            'http://quotes.toscrape.com/page/1/',
            'http://quotes.toscrape.com/page/2/',
        ]
        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse)
    def parse(self, response):
        page = response.url.split("/")[-2]
        filename = 'quotes-%s.html' % page
        with open(filename, 'wb') as f:
            f.write(response.body)
        self.log('Saved file %s' % filename)
9.然后执行 tutorial scrapy crawl quotes
10.爬取结束