Page 1: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

17.03.2013 – Berlin - SEO Campixx

Data Scraping with Excel – by Maik Schmidt

Page 3: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Was scrapen wir heute?

• Standard KPIs• Malware Checker• Index Checker• Google SERPs• Google Suggest

Page 4: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Warum Excel?

• Weil ich nicht programmieren kann

Nachteile:• Langsam• Begrenzte Datenmengen


Page 5: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Was benötige ich?

• Excel• Niels Bosma SEO Tools for Excel

Page 6: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Niels Bosma SEO Tools (1/4)

Onpage • LinkCount• HtmlTitle• HtmlMetaDescription• HtmlMetaKeywords• HtmlMeta• HtmlFirst• HtmlH1• HtmlH2• HtmlH3• HtmlCanonical• W3CValidate• PageCodeToTextRatio• PageSize• PageTextSize• PageCodeSize• HttpStatus• HttpHeader• ResponseTime• PageEncoding• IsFoundOnPage

Content • FindDuplicatedContent• CountWords• LCS• SpinTextBacklinks• CheckBacklink• GooglePageRank• GoogleResultCount• GoogleIndexCount• GoogleLinkCount• AlexaReach• AlexaPopularity• AlexaLinkCount• DmozEntries• WikipediaLinksSocial • FacebookLikes• GooglePlusCount• TwitterCount


Page 7: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Niels Bosma SEO Tools (2/4)

SEOlytics• Backlinks• SVR (Sichtbarkeit)• Keyword Rankings• Domain Metriken• LinkCount/URL• Link History

Page 8: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Niels Bosma SEO Tools (3/4)

MajesticSEO• Größte Backlink DB• Fresh Index• Historischer Index• Trust/Citation Flow

Page 9: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Niels Bosma SEO Tools (4/4)

Google Analytics• Ähnlich:

• =GoogleAnalytics(string id,string metrics,string startDate,string endDate,[string dimensions,string segment,string filter,string sort,integer startIndex,integer maxResults,bool excludeHeaderInResult,bool excludeDimensionsInResult]) : {string}

Page 10: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

X-Path Basics

Mit X-Path kann man bestimmte Teile innerhalb eines XML-Dokumentes adressieren

Beispiele:Document root node:/ Direct child element: XML_element_name Direct child of the root node: /XML_element_name Child of a child: XML_element_name/XML_element_nameDescendant of the root://XML_element_name Descendant of a node: XML_element_name//XML_element_name Parent of a node:../ A far cousin of a node ../../XML_element_name/XML_element_name


Holt sich in diesem Pfad den Inhalt des ersten H3 Tags


Holt sich alle Links innerhalb H3 Tags mit der Class „X“

Um Google SERPs zu scrapen

Um zu scrapen

Page 11: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

X-Path easy rausfinden

Mit dem Firefox Plugin Firebug (und FirePath) lässt sich der X-Path ziemlich schnell und leicht finden:

Page 12: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Standard KPIs



=XPathOnUrl([SI API URL];"response/answer/sichtbarkeitsindex";"value")

=XPathOnUrl([Alexa URL];"//table[@id='siteStats']/tbody/


Page 13: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Google Save Browsing API



=XPathOnUrl([Google SafeBrowsing URL]; "/html/body/center/div/div/blockquote/p[position()=1]")

Page 14: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Index Checker


=HttpStatus([USER URL])


"&("info:"&(A2))&"&pws=0";"//li[@class='g']//h3[@class='r']//a";"href");8;LÄNGE(A2));A2));"not indexed";"indexed")

=WENN(HtmlCanonical(A2)=A2;"self canonical";HtmlCanonical(A2))

Page 15: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Google Suggest Scrapen

• Quelle:

• Scraped das KW + mit/ohne Leerzeichen und einem Buchstaben

• Matrix Funktion um 10er Ergebnisse zu scrapen

• 2. Iteration der Top 10

Über 600 suggested Keywords!

Page 16: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Google SERPs scrapen








Page 17: Data Scraping with Excel - Campixx 2013 - Maik Schmidt

Google SERPs scrapen

Page 19: Data Scraping with Excel - Campixx 2013 - Maik Schmidt


Be Creative!Die live gezeigte Excel-Dateien werden auf dem Blog von als Download zur Verfügung stehen

Mit gezeigten Beispielen & Tools kann man theoretisch jede x-beliebige Webseite abscrapen und in Excel verarbeiten

Top Related