91免费永久国产在线观看,国产精品高清视亚洲乱码

[爬蟲學(xué)習(xí)筆記]ScrapySharp簡單封裝為Requester

2019.05.27

為了便于使用及日后的擴(kuò)展，將Scrapy簡單封裝為了Requester，具體代碼如下：

using System;using System.Collections.Generic;using Crawler.Common;namespace Crawler.Protocol{ public class Requester { private Uri Url { get; set; } private Browser Browser { get; set; } public Requester(string url, Dictionary<string, string> headers = null, Browser browser = null) { var u = new Uri(url); //檢測(cè)地址是域名還是IP地址,如果是域名,則使用DnsResolver解析為IP地址 var leftPart = u.GetLeftPart(UriPartial.Authority).Replace(u.GetLeftPart(UriPartial.Scheme), ''); //正則匹配是否為IP地址 if (!RegexHelper.IsMatch(leftPart, @'\d+\.\d+\.\d+\.\d+\w')) { var dns = new DnsResolver(leftPart); if (dns.IsSuccess) u = new Uri(url.Replace(leftPart, dns.Record.Address.ToString())); } Url = u; Browser = browser ?? new Browser(); if (headers == null) return; foreach (var header in headers) Browser.Headers[header.Key] = header.Value; } public string GetHtml() { return Browser.DownloadString(Url); } public byte[] GetFile() { return Browser.NavigateToPage(Url).RawResponse.Body; } }}

考慮到可能對(duì)ScrapyBrowser做一些擴(kuò)展（例如增加對(duì)FTP等其他協(xié)議的支持），故新建了Browser類繼承自ScrapyBrowser類：

using ScrapySharp.Network;namespace Crawler.Protocol{    public class Browser : ScrapingBrowser    {    }}

原文：http://www.cnblogs.com/JiaoWoWeiZai/p/5866977.html

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

打開APP，閱讀全文并永久保存查看更多類似文章

MouseGestures2目前的鼠標(biāo)手勢(shì)和鼠標(biāo)手勢(shì)方向

Chromium之cef3的.net封裝(定制化的瀏覽器)

winForm的淘寶請(qǐng)求之路

Js獲取url中的參數(shù)

Perl 之LWP 與 WEB 的基本使用

delphi中dcef如何自定義referer信息？

更多類似文章 >>

免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版