Mac Python环境 miniConda +scrapy 搭建

简单快捷的方式搭建Python环境,避免污染和麻烦的依赖问题


minoConda安装

1.到清华镜像下载最新的miniConda.sh脚本

2.然后bash安装bash ~/Downloads/Anaconda3-4.4.0-MacOSX-x86_64.sh(修改为你的路径)

3.安装完毕打开命令行(我这里是iTerm),输入conda回车,有提示信息

avatar

4.我们用conda create -n 环境名(随便取) 创建和系统环境隔离的python环境,创建完毕的提示(我的环境名叫apple)

avatar

5.source activate apple进入环境,进入后会在最前面显示apple

avatar


Scrapy安装

6.安装scrapy conda pip install scrapy

7.创建scrapy项目 conda scrapy startproject tutorial

8.按照scrapy官网教程创建第一个爬虫(或者复制下面的内容到tutorial下面的spiders目录,取名为quotes_spider.py)

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"

    def start_requests(self):
        urls = [
            'http://quotes.toscrape.com/page/1/',
            'http://quotes.toscrape.com/page/2/',
        ]
        for url in urls:
            yield scrapy.Request(url=url, callback=self.parse)

    def parse(self, response):
        page = response.url.split("/")[-2]
        filename = 'quotes-%s.html' % page
        with open(filename, 'wb') as f:
            f.write(response.body)
        self.log('Saved file %s' % filename)

9.然后执行 tutorial scrapy crawl quotes

10.爬取结束


参考

miniconda官方文档 scrapy官方文档