ScrapyでCSSセレクターを使用してhrefを取得する

Question

href値を取得したい：

<span class="title"> <a href="https://www.example.com"></a> </span>

私はこれを試しました：

Link = Link1.css('span[class=title] a::text').extract()[0]

しかし、私は<a>。 href内のリンクを取得するにはどうすればよいですか？

paul trmbrth · Accepted Answer

あなたが探しているのは：

_Link = Link1.css('span[class=title] a::attr(href)').extract()[0] _

span "class"属性も一致させるので、次のように書くこともできます

_Link = Link1.css('span.title a::attr(href)').extract()[0] _

_::text_疑似要素と::attr(attributename)機能疑似要素は[〜＃〜] not [〜＃〜]標準のCSS3セレクターであることに注意してください。これらはScrapy 0.20のCSSセレクターの拡張機能です。

編集（2017-07-20）：Scrapy 1.0以降、.extract_first()の代わりに.extract()[0]を使用できます

_Link = Link1.css('span[class=title] a::attr(href)').extract_first() Link = Link1.css('span.title a::attr(href)').extract_first() _

Eddy · Answer

Link = Link1.css('span.title a::attr(href)').extract_first()

Jorgesys · Answer

これは仕事をします：

Link = Link1.css('span.title a::attr(href)').extract()