[CrawlSpider] - Scrapy爬虫详解

摘要:对CrawlSpider类的用法进行详解,重点关注其中的 Rule 和 LinkExtractor的用法以及process_links和process_req方法的使用。摘抄目的是对scrapy中的LinkExtractor的使用(一)的补充和说明。

- 阅读全文 -

linux执行后台可执行文件后自删除脚本

摘要:linux执行可执行文件后,删除可执行文件以规避硬盘文件检查。因为linux特殊机制,可执行文件执行后,是可以删除的。所以把可执行文件放入后台执行,然后把硬盘上的文件删除,可以规避一定的检测。

- 阅读全文 -