Webscraping über Flow möglich?

Hallo in die Runde,

ich bin noch ziemlich neu hier bei Synesty und versuche mich an meinen ersten Flows.
Gerade probiere ich, einen bestimmten Wert einer Webseite zu Scrapen und in einem Datastore für weitere Verarbeitung zu speichern.

Mein Ansatz dabei ist aktuell, zuerst per URL Download die betroffene Webseite als String zu speichern und anschließend diesen mit HTMLParser zu verarbeiten. Dort bekomme ich auch den urlcontent@UrlDownload_9 aus Step 1 (UrlDownload) eingelesen.
(Allerdings erhalte ich den Hinweis, dass diese Methode depracted ist und demnächst abgeschafft werden könnte, dies nur mal so am Rande)

An dieser Stelle würde ich gerne das Erebnis des HTMLParsers weiterverwenden und in einen Datastore schreiben, finde aber keine Möglichkei, dies zu tun. Wenn ich im DatastoreWriter einen Input auswählen möchte wird weder eine Variable oder ein Ergebnis eines vorherigen Steps als möglicher input angezeigt.

Habe ich etwas übersehen oder nicht vollständig konfiguriert? Oder stimmt etwas grundsätzliches mit meinem Flow nicht?

Vielen Dank schonmal für eure Hilfe!
arpbal

Hallo @18bits,

der DatastoreWriter erwartet als Input ein Spreadsheet. Das heißt, du musst dir das Ergebnis des HTMLParser vorher noch in ein Spreadsheet mittels HTML2Spreadsheets schreiben. Oder du verwendest gleich nach dem URLDownload den HTML2Spreadsheet Step.
Wenn du das gemacht hast, kannst du das daraus resultierende Spreadsheet im DatastoreWriter verwenden.

Viele Grüße
Lukas

1 „Gefällt mir“