Web Crawler
netEstate hat jahrelange Erfahrung in der Programmierung von Crawlern.Bei unserer Website-Suchmaschine crawlen wir das deutschsprachige Web und ermöglichen so eine Suche Nach Domainnamen, IP-Adressen, Seitentiteln und Meta-Keywords.
Bei unserer FOAF Search Engine crawlen wir das semantische Web für eine Personensuchmaschine.
Der Crawler unserer Suchfunktion extrahiert Metadaten wie HTTP-Statuscode, Dateityp, Sprache, Änderungszeitpunkt, Titel, Meta-Tags sowie den gesamten Textinhalt in unstrukturierter Form. Sie können diese Daten neben der Suchfunktion auch zum automatischen Generieren von Sitemaps nutzen oder im XML-Format exportieren.
Für unser RSS directory haben wir Millionen von RSS-Feeds gecrawlt und deren Metadaten durchsuchbar gemacht.
Bei der Event search engine crawlen wir Events im hCalendar Mikroformat.
Für unsere Kunden haben wir Crawler programmiert, die strukturierte Daten verschiedenster Art extrahieren:
- Firmennamen
- Firmenbeschreibungen
- Adressen
- Kontaktdaten (Tel/Fax/Email)
- Pressemeldungen
- Daten aus Tabellen
- etc.
Cookies und Formulare sind für unsere Crawler kein Hindernis. Wir beachten den Robots Exclusion Standard. Um den Versand von Spam-Email nicht zu unterstützen lehnen wir Aufträge ab, die nur auf die Gewinnung von E-Mail-Adressen abzielen.
Ihr Ansprechpartner für Crawler bei netEstate:
Michael Brunnbauer
Tel: 089-32197780
E-Mail: info@netestate.de
Kontaktformular
