NewsSpider

爬取今日头条，网易，腾讯等新闻,并建立简单的搜索引擎

Go to file

lzjqsdd db6bd39356 添加数据库写入功能		2016-04-24 00:17:26 +08:00
ml	添加数据库写入功能	2016-04-24 00:17:26 +08:00
news_spider	添加数据库写入功能	2016-04-24 00:17:26 +08:00
tutorial	增加今日头条简版一个内容板块的抓取，网站限制最多500页	2016-04-19 10:49:43 +08:00
.gitignore	增加UserAgent池防止爬虫被禁，增加进程锁防止同时开启多个爬虫写入同一个文件出现错误数据	2016-04-23 12:34:35 +08:00
README.md	Update README.md	2016-04-23 15:36:42 +08:00

包含网站：

git clone https://github.com/lzjqsdd/NewsSpider.git
cd NewsSpider/news_spider
scrapy crawlall

scrapy crawl toutiao