• Skip to primary navigation
  • Skip to main content
  • Skip to footer

Digging the digital

  • /Now
  • Nieuw? Start hier
    • Blogroll
    • Tag Index
  • Startgids Mastodon
  • WordPress en Indieweb
    • WordPress en het indieweb
    • Hoe gebruik je IndieAuth met WordPress
    • WordPress en webmentions
    • WordPress en Micropub
    • WordPress en de Post Kind plugin
  • Notities
  • Bookmarks
  • Likes

HTML 2 XML ofzo?

1 July 2003 door Frank Meeuwsen

Als iemand nog goede tips, sites of software weet waarmee ik redelijk gestructureerde HTML bestanden kan omtoveren naar RSS-feeds of XML bestanden die ik daarna weer in een mySQL database kan importeren, dan hou ik me aanbevolen! Ik heb al reeds HTML2XML.com geprobeerd, maar die doet het niet (server plat) en van de template scraper van myHeadlines snap ik niks. Volgens mij kan ik daar namelijk geen loop aangeven om over een pagina te gaan en uit steeds een specifieke brok code content te filteren…Misschien vergis ik me, dan hoor ik het graag. Heb ik volgende week tenminste wat te doen in mijn vekaansie 🙂 Naast natuurlijk een biertje drinken met r-win! Check trouwens zijn Avantgo-channel, die is ook weer back on track! Update: Html2txt 6.01 Pro doet het werk wel enigszins, dus misschien is daar ook iets mee te doen. Maar is nog behoorlijk wat handwerk! Als ik maar gestructureerde txt of xml bestanden krijg, daar gaat het om!

« Curry laat wederom van zich horen
Europe vs Italy »

Filed Under: punkeydotcom

Reader Interactions

Comments

  1. toon says

    2 July 2003 at 12:13 am

    Huh???
    Heb je al een Hema schrijfblok met Hema potlood geprobeerd?? Samen met Hema gummetje een perfecte tool.

  2. toon says

    2 July 2003 at 12:13 am

    Huh???
    Heb je al een Hema schrijfblok met Hema potlood geprobeerd?? Samen met Hema gummetje een perfecte tool.

  3. joustie says

    2 July 2003 at 1:00 am

    Voor mijn conversie van b2 naar moveabletype heb ik een perl filter moeten schrijven. Wat jij wilt is toch het uit die html’s is het postje, de datum en eventueel andere velden filteren en daarna iets uitpoepen (makkelijkst is komma delimited)wat je in mysql kan frotten ?(liefst met movable type import functie neem ik aan?)
    Voor dit soort shit is perl gemaakt.

  4. joustie says

    2 July 2003 at 1:00 am

    Voor mijn conversie van b2 naar moveabletype heb ik een perl filter moeten schrijven. Wat jij wilt is toch het uit die html’s is het postje, de datum en eventueel andere velden filteren en daarna iets uitpoepen (makkelijkst is komma delimited)wat je in mysql kan frotten ?(liefst met movable type import functie neem ik aan?)
    Voor dit soort shit is perl gemaakt.

  5. dennis says

    2 July 2003 at 6:54 am

    Scraping is simple 🙂
    Geef me de url eens, ga ik kijken of ik een feed voor je kan bakken met een scrape voorbeeld.
    Wat je wil kan volgens mij heel makkelijk.
    Zie alle scrape voorbeelden die ik gemaakt hebt ..
    Ik kan zelfs van 1 html page 3 verschillende feeds bakken (zie http://www.tvgids.nl)
    Mail me!

  6. dennis says

    2 July 2003 at 6:54 am

    Scraping is simple 🙂
    Geef me de url eens, ga ik kijken of ik een feed voor je kan bakken met een scrape voorbeeld.
    Wat je wil kan volgens mij heel makkelijk.
    Zie alle scrape voorbeelden die ik gemaakt hebt ..
    Ik kan zelfs van 1 html page 3 verschillende feeds bakken (zie http://www.tvgids.nl)
    Mail me!

  7. Punkey says

    2 July 2003 at 7:21 am

    @joustie: Laat Perl nou echt even niet mijn sterkste kant zijn. Als je scripts hebt die ik kan gebruiken, hou ik me aanbevolen!

  8. Punkey says

    2 July 2003 at 7:21 am

    @joustie: Laat Perl nou echt even niet mijn sterkste kant zijn. Als je scripts hebt die ik kan gebruiken, hou ik me aanbevolen!

  9. Tjarko says

    2 July 2003 at 10:13 am

    He Punkey,
    Even een cfdirectory over de html en een regular expression om de titel en content uit het stukje tabel code te halen en in je DB of xml bestand te proppen. Stuur anders eens zo’n html pagina… kijk ik ff of ik er wat mee kan.

  10. Tjarko says

    2 July 2003 at 10:13 am

    He Punkey,
    Even een cfdirectory over de html en een regular expression om de titel en content uit het stukje tabel code te halen en in je DB of xml bestand te proppen. Stuur anders eens zo’n html pagina… kijk ik ff of ik er wat mee kan.

  11. Remy says

    2 July 2003 at 10:33 am

    http://www.reflectionit.nl/Html2Xml.aspx
    Converteren van hele html pagina’s naar XML nodes. Duurt ff maar dan heb je ook wat.

  12. Remy says

    2 July 2003 at 10:33 am

    http://www.reflectionit.nl/Html2Xml.aspx
    Converteren van hele html pagina’s naar XML nodes. Duurt ff maar dan heb je ook wat.

  13. joustie says

    2 July 2003 at 11:53 am

    @punkey: Ik heb geen kant-en-klare scripts liggen , maar als ik een voorbeeldpagina van je heb, kan ik even iets knutselen met scripts die ik wel heb.

  14. joustie says

    2 July 2003 at 11:53 am

    @punkey: Ik heb geen kant-en-klare scripts liggen , maar als ik een voorbeeldpagina van je heb, kan ik even iets knutselen met scripts die ik wel heb.

  15. Thijs says

    3 July 2003 at 10:31 am

    De html converteren naar xhtml (valide xml dus) met tidy, en dan xslt gebruiken om het te converteren naar wat je maar wilt.
    Ik zal er binnenkort een stukje over op m’n weblog schrijven.

  16. Thijs says

    3 July 2003 at 10:31 am

    De html converteren naar xhtml (valide xml dus) met tidy, en dan xslt gebruiken om het te converteren naar wat je maar wilt.
    Ik zal er binnenkort een stukje over op m’n weblog schrijven.

Footer

Wat is dit?

Frank MeeuwsenDigging the Digital is de digital garden of commonplace book van Frank Meeuwsen. Onderwerpen variëren van indieweb tot nieuwsbrieven, bloggen, muziek en opvallende gebeurtenissen op het internet.

Meer Frank

Bloghelden - De definitieve geschiedenis van webloggend Nederland

On this Day

  • 2 years ago...
    • Hoe gaat het eigenlijk met me?
  • 5 years ago...
    • Blogs als dagboeken voor verslaglegging
    • Genesis + IndieWeb
  • 7 years ago...
    • De unconference rebooted?
  • 15 years ago...
    • App my ride gaat beyond cocreatie-ideetjes
  • 22 years ago...
    • Huh?
    • Einduluk
    • Vet hoor, de Tiësto videos
    • Morgenavond mag het regenen
  • 23 years ago...
    • Excuses
    • Zoek de verschillen
    • Vidento.com
  • 24 years ago...
    • Te lang geleden dat ik

Archives

Copyright © 2025 · DTD Genesis on Genesis Framework · WordPress · Log in