Scrapy：无法覆盖__init__function

问题描述：

我创建了一个从CrawlSpider继承的蜘蛛。Scrapy：无法覆盖__init__function

我需要使用__init__功能，但总是收到此错误：

代码：

class mySpider(CrawlSpider): 

def __init__(self): 
    super(mySpider, self).__init__() 
    .....

这是我得到的错误： KeyError异常蜘蛛没有发现：mySpider。

没有__init__功能一切正常

'super'的语义有时可能会让人困惑。试试'CrawlSpider .__ init __（self）'。 – 2012-07-21 17:53:05

答

你需要把它像这样：

def __init__(self, *a, **kw): 
    super(MySpider, self).__init__(*a, **kw) 
    # your code here

工作例如：

class MySpider(CrawlSpider): 
    name = "company" 
    allowed_domains = ["site.com"] 
    start_urls = ["http://www.site.com"] 

    def __init__(self, *a, **kw): 
     super(MySpider, self).__init__(*a, **kw) 
     dispatcher.connect(self.spider_closed, signals.spider_closed)

这里的init，使用了蜘蛛注册scrapy信号，我在这个例子中需要蜘蛛而不是通常在管道中

还不算好。我做self.name =“公司” 我所做的：scrapy爬行公司同样的错误 – DjangoPy 2012-07-21 18:13:57

KeyError异常蜘蛛没有发现：公司我需要不同的方式运行呢？ – DjangoPy 2012-07-21 18:16:56

有没有一个函数可以重写来执行我的预刮操作而不是init？ – DjangoPy 2012-07-21 18:18:31

Scrapy：无法覆盖__init__function

相关推荐

Scrapy：无法覆盖initfunction