• Skip to primary navigation
  • Skip to main content
  • Skip to footer

Digging the Digital

Vol Blogdrift!

  • /Now
  • Nieuw? Start hier
    • Blogroll
    • Tag Index
  • Startgids Mastodon
  • WordPress en Indieweb
    • WordPress en het indieweb
    • Hoe gebruik je IndieAuth met WordPress
    • WordPress en webmentions
    • WordPress en Micropub
    • WordPress en de Post Kind plugin
  • Notities
  • Bookmarks
  • Likes
You are here: Home / indieweb / [Article] Instrumenten voor data-schrapers

Instrumenten voor data-schrapers

27 January 2022 door Frank Meeuwsen

De afgelopen tijd heb ik in de avonduren wat verbeteringen doorgevoerd aan mijn hobbyproject Thanks for Subscribing. Het zijn kleine verbeteringen die je als gebruiker misschien niet direct ziet, maar het vooral voor mij als beheerder makkelijker maken.

De site draait op WordPress en een belangrijk onderdeel is het invoerformulier voor nieuwsbrieven. Elke entry bekijk ik en waar nodig voer ik wat aanpassingen toe. Zo kun je een Twitter adres invoeren, maar ondanks mijn tekst bij het formulier krijg ik allerlei variaties binnen. Ik vraag alleen om je Twitter-handle zonder @ en zonder domeinnaam, maar toch krijg ik adressen binnen als https://twitter.com/Twitterhandle of @Twitterhandle. Die ik handmatig moet wijzigen. Het is in een paar regels code te checken dus het is fijn om dat nu eindelijk eens te doen.

Zo heb ik nog een paar handigheidjes voor mezelf gemaakt. Ik heb me ook eens verdiept in de kracht van bookmarklets. Dit zijn kleine Javascripts die je als bookmark kunt aanroepen op een pagina. Hiermee kun je allerlei acties met of op een pagina doen. Op FreeCodeCamp kun je een paar voorbeelden vinden.
Waar ik bookmarklets voor gebruik is om op een nieuwsbrief-pagina automatisch een eigen formulier in te vullen met de belangrijkste informatie. Ik haal dat uit de broncode van de pagina en dankzij de flexibiliteit van Gravity Forms op mijn site kan ik de velden automatisch invullen.

Electric Tables is het nieuwe project van Tom Critchlow en het doet hetzelfde met bookmarklets, maar gaat nog een stap verder. Hij maakt een eigen persoonlijke database van relevante links en slaat alle belangrijke informatie lokaal op. Op specifieke pagina’s zoals recepten of artikelpagina’s haalt het ook specifieke data binnen. Zoals de ingrediënten of de prijs.

Voor nieuwsbrieven zou dit ook kunnen. Op netwerken als Substack en Revue is veel data gestandaardiseerd en dus eenvoudig te scrapen met een instrument als Electric Tables. Als je het daarna automatisch naar een API kunt sturen zoals je eigen WordPress site… dat geeft mogelijkheden!

Het lijkt allemaal erg op diensten als Pinboard en voorheen Delicious. Of nieuwere bookmarkdiensten als MyMind. Maar het idee om de data in het lokale geheugen van de browser op te slaan in plaats van een centrale database, dat vind ik interessant.

Inmiddels heeft Thanks for Subscribing meer dan 1000 nieuwsbrieven en wordt het tijd om eens te zien hoe ik deze op andere manieren kan weergeven dan een platte lijst met kaarten. Ik heb er eind vorig jaar al eens een avond over gebrainstormd en die ideeën zingen nog in mijn hoofd rond. Hoe interessant kan deze database zijn voor adverteerders of sponsors van nieuwsbrieven?

« WALLSMASH | The best game you’ve ever seen.
Next Post »

Opgeslagen onder: indieweb Tags: nieuwsbrieven, open data

Footer

Wat is dit?

Frank MeeuwsenDigging the Digital is de digital garden of commonplace book van Frank Meeuwsen. Onderwerpen variëren van indieweb tot nieuwsbrieven, bloggen, muziek en opvallende gebeurtenissen op het internet.

Meer Frank

Bloghelden - De definitieve geschiedenis van webloggend Nederland

Op deze dag

  • 2 years ago...
    • Je notities zichtbaar verbonden in Obsidian
  • 3 years ago...
    • The Breakfast Club is jarig
  • 4 years ago...
    • The Breakfast Club 1984
    • Communities op de Dutch Comic Con
  • 10 years ago...
    • Hoe bepaal je de prijs van je eigen e-book?
  • 13 years ago...
    • Social Warfare tussen Nestl en Greenpeace
  • 20 years ago...
    • The hippie period of the Web is over
  • RSS
  • LinkedIn
  • GitHub
  • Mastodon
← An IndieWeb Webring →

Archives

  • Likes (268)
  • Bookmarks (267)
  • Notes (134)
  • Replies (53)
  • Articles (722)
  • All Posts

Digging the Digital staat op de state of the art server van Servebolt.
De snelste high-performance hosting met een sterke focus op schaalbaarheid en veiligheid.