尖叫青蛙網(wǎng)絡(luò)爬蟲軟件

2019.10.27

Screaming Frog SEO Spider for Mac是一款專門用于抓取網(wǎng)址進(jìn)行分析的網(wǎng)絡(luò)爬蟲開發(fā)工具，你可以通過這款軟件來快速抓取網(wǎng)站中可能出現(xiàn)的損壞鏈接和服務(wù)器錯(cuò)誤，或是識別網(wǎng)站中臨時(shí)、永久重定向的鏈接循壞，同時(shí)還能檢查出網(wǎng)址、網(wǎng)頁標(biāo)題、說明以及內(nèi)容等信息中心可能出現(xiàn)的重復(fù)問題。喜歡這款軟件嗎？

軟件介紹

Screaming Frog SEO Spider for Mac是一個(gè)網(wǎng)站爬蟲，允許你抓取網(wǎng)站的網(wǎng)址，并獲取關(guān)鍵要素，分析和審計(jì)技術(shù)和現(xiàn)場搜索引擎優(yōu)化。

功能特色

1、找到斷開的鏈接

立即抓取網(wǎng)站并找到損壞的鏈接（404s）和服務(wù)器錯(cuò)誤。批量導(dǎo)出錯(cuò)誤和源URL以進(jìn)行修復(fù)，或發(fā)送給開發(fā)人員。

2、審核重定向

查找臨時(shí)和永久重定向，識別重定向鏈和循環(huán)，或上傳URL列表以在站點(diǎn)遷移中進(jìn)行審核。

3、分析頁面標(biāo)題和元數(shù)據(jù)

在抓取過程中分析頁面標(biāo)題和元描述，并識別網(wǎng)站中過長，短缺，缺失或重復(fù)的內(nèi)容。

4、發(fā)現(xiàn)重復(fù)內(nèi)容

使用md5算法檢查發(fā)現(xiàn)完全重復(fù)的URL，部分重復(fù)的元素（如頁面標(biāo)題，描述或標(biāo)題）以及查找低內(nèi)容頁面。

5、使用XPath提取數(shù)據(jù)

使用CSS Path，XPath或regex從網(wǎng)頁的HTML中收集任何數(shù)據(jù)。這可能包括社交元標(biāo)記，其他標(biāo)題，價(jià)格，SKU或更多！

6、審查機(jī)器人和指令

查看被robots.txt，元機(jī)器人或X-Robots-Tag指令阻止的網(wǎng)址，例如'noindex'或'nofollow'，以及規(guī)范和rel =“next”和rel =“prev”。

7、生成XML站點(diǎn)地圖

快速創(chuàng)建XML站點(diǎn)地圖和圖像XML站點(diǎn)地圖，通過URL進(jìn)行高級配置，包括上次修改，優(yōu)先級和更改頻率。

8、與Google Analytics集成

連接到Google AnalyticsAPI并針對抓取功能獲取用戶數(shù)據(jù)，例如會話或跳出率和轉(zhuǎn)化次數(shù)，目標(biāo)，交易和針對目標(biāo)網(wǎng)頁的收入。

9、抓取JavaScript網(wǎng)站

使用集成的Chromium WRS渲染網(wǎng)頁，以抓取動態(tài)的，富含JavaScript的網(wǎng)站和框架，例如Angular，React和Vue.js.

10、可視化站點(diǎn)架構(gòu)

使用交互式爬網(wǎng)和目錄強(qiáng)制導(dǎo)向圖和樹形圖站點(diǎn)可視化評估內(nèi)部鏈接和URL結(jié)構(gòu)。

快速摘要

錯(cuò)誤 - 客戶端錯(cuò)誤，例如鏈接斷開和服務(wù)器錯(cuò)誤（無響應(yīng)，4XX，5XX）。

重定向 - 永久，臨時(shí)重定向（3XX響應(yīng)）和JS重定向。

阻止的網(wǎng)址 - robots.txt協(xié)議不允許查看和審核網(wǎng)址。

阻止的資源 - 在呈現(xiàn)模式下查看和審核被阻止的資源。

外部鏈接 - 所有外部鏈接及其狀態(tài)代碼。

協(xié)議 - URL是安全的（HTTPS）還是不安全的（HTTP）。

URI問題 - 非ASCII字符，下劃線，大寫字符，參數(shù)或長URL。

重復(fù)頁面 - 哈希值/ MD5checksums算法檢查完全重復(fù)的頁面。

頁面標(biāo)題 - 缺失，重復(fù)，超過65個(gè)字符，短，像素寬度截?cái)?，與h1相同或多個(gè)。

元描述 - 缺失，重復(fù)，超過156個(gè)字符，短，像素寬度截?cái)嗷蚨鄠€(gè)。

元關(guān)鍵字 - 主要供參考，因?yàn)樗鼈儾槐还雀瑁貞?yīng)或雅虎使用。

文件大小 - 網(wǎng)址和圖片的大小。

響應(yīng)時(shí)間。

最后修改的標(biāo)題。

頁面（抓?。┥疃?。

字?jǐn)?shù)。

H1 - 缺失，重復(fù)，超過70個(gè)字符，多個(gè)。

H2 - 缺失，重復(fù)，超過70個(gè)字符，多個(gè)。

元機(jī)器人 - 索引，無索引，跟隨，nofollow，noarchive，nosnippet，noodp，noydir等。

元刷新 - 包括目標(biāo)頁面和時(shí)間延遲。

規(guī)范鏈接元素和規(guī)范HTTP標(biāo)頭。

X-Robots-Tag中。

分頁 - rel =“next”和rel =“prev”。

關(guān)注＆Nofollow - 在頁面和鏈接級別（真/假）。

重定向鏈 - 發(fā)現(xiàn)重定向鏈和循環(huán)。

hreflang屬性 - 審核缺少的確認(rèn)鏈接，不一致和不正確的語言代碼，非規(guī)范的hreflang等。

AJAX - 選擇遵守Google現(xiàn)已棄用的AJAX抓取方案。

渲染 - 通過在JavaScript執(zhí)行后抓取渲染的HTML來抓取像AngularJS和React這樣的JavaScript框架。

Inlinks - 鏈接到URI的所有頁面。

Outlinks - URI鏈接到的所有頁面。

錨文本 - 所有鏈接文本。從帶有鏈接的圖像中替換文本。

圖像 - 具有圖像鏈接的所有URI和來自給定頁面的所有圖像。圖像超過100kb，缺少替代文字，替代文字超過100個(gè)字符。

用戶代理切換器 - 抓取Googlebot，Bingbot，Yahoo！Slurp，移動用戶代理或您自己的自定義UA。

自定義HTTP標(biāo)頭 - 在請求中提供任何標(biāo)頭值，從Accept-Language到cookie。

自定義源代碼搜索 - 在網(wǎng)站的源代碼中找到您想要的任何內(nèi)容！無論是谷歌分析代碼，特定文本還是代碼等。

自定義提取 - 使用XPath，CSS路徑選擇器或正則表達(dá)式從URL的HTML中刪除任何數(shù)據(jù)。

Google Analytics集成 - 連接到Google AnalyticsAPI并在抓取過程中直接提取用戶和轉(zhuǎn)化數(shù)據(jù)。

Google Search Console集成 - 連接到Google Search Analytics API并針對網(wǎng)址收集展示次數(shù)，點(diǎn)擊次數(shù)和平均排名數(shù)據(jù)。

外部鏈接度量標(biāo)準(zhǔn) - 將Majestic，Ahrefs和Moz API中的外部鏈接指標(biāo)拖入爬行以執(zhí)行內(nèi)容審核或配置文件鏈接。

XML站點(diǎn)地圖生成 - 使用SEO蜘蛛創(chuàng)建XML站點(diǎn)地圖和圖像站點(diǎn)地圖。

自定義robots.txt - 使用新的自定義robots.txt下載，編輯和測試網(wǎng)站的robots.txt。

渲染的屏幕截圖 - 獲取，查看和分析已爬網(wǎng)的渲染頁面。

存儲和查看HTML和呈現(xiàn)的HTML - 分析DOM的必要條件。

AMP抓取和驗(yàn)證 - 使用官方集成的AMP Validator抓取AMP網(wǎng)址并對其進(jìn)行驗(yàn)證。

XML站點(diǎn)地圖分析 - 單獨(dú)爬網(wǎng)XML站點(diǎn)地圖或爬行的一部分，以查找丟失的，不可索引的和孤立的頁面。

可視化 - 使用爬網(wǎng)和目錄樹強(qiáng)制導(dǎo)向圖和樹圖分析網(wǎng)站的內(nèi)部鏈接和URL結(jié)構(gòu)。

結(jié)構(gòu)化數(shù)據(jù)和驗(yàn)證 - 根據(jù)Schema.org規(guī)范和Google搜索功能提取和驗(yàn)證結(jié)構(gòu)化數(shù)據(jù)。

免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

軟件介紹

功能特色

推薦理由