• Home
  • /
  • Blog
  • /
  • Entity Extraction in Bulk met de TextRazor API & Screaming Frog’s Custom JavaScript Snippets

Entity Extraction in Bulk met de TextRazor API & Screaming Frog’s Custom JavaScript Snippets

Dennis  - april 2, 2025

Sinds Screaming Frog’s SEO Spider v20 uitkwam, heeft het de mogelijkheid om custom JavaScript snippets te gebruiken voor acties of data extractie.

Deze versie komt al met wat ingebouwde snippets, maar hier is er nog één die je kan gebruiken. Specifiek, een extractie snippet die gebruik maakt van TextRazor om entiteiten in bulk te herkennen via een tool die je waarschijnlijk al gebruikt.Waarom? (Als je dat moet vragen, lees de ‘Definitive Guide on Entity SEO’. Voor degene die het niet vragen, laten we beginnen.

TextRazor’s API Key

Om te beginnen hebben we als eerste een API key van TextRazor nodig. Die is gratis, tot 500 requests per dag.Het verkrijgen van de key is simpel: gewoon naar de signup pagina gaan en je account aanmaken. Hierna zie je je API key.

Als je dit hebt gedaan, is het tijd voor het leukere werk.

Screaming Frog instellen

Custom JavaScript snippets is een nieuwe feature vanaf v20. Deze is al eventjes uit dus ga ik er vanuit dat je die al hebt. Is dat niet zo, moet je toch gaan updaten.

De snippet toevoegen

Om de snippet toe te voegen ga je in Screaming Frog naar het configuratiescherm:

Hiermee open je een nieuw scherm waar je een aantal opties hebt. Je moet klikken op ‘Add from Library’ of gewoon op ‘Add’. De library is interessant omdat hier ook de meegeleverde snippets staan. En de users library, waarin je eigen snippets komen.

Eventueel kan je ook nog snippets importeren of exporteren via JSON bestanden.

Voor nu klik je gewoon op ‘Add’. Hiermee open je een nieuw venster met een editor waarin je de snippet moet plakken. Vergeet niet je eigen API key toe te voegen aan de snippet.

Heb je dit gedaan, dan kan je gelijk naast de editor een URL ingeven om je snippet te testen.

Testen maar

Oke, om de snippet te laten werken heb je dus een API key nodig. Maar een belangrijke stap is om naar je crawl configuratie te gaan en rendering op JavaScript te zetten.

De gratis versie van TextRazor heeft een limiet van 500 requests per dag. Dus de snippet ook. En omdat de API slechts twee requests tegelijk pakt, heb ik een delay in de snippet gebouwd. Crawlen zal dus niet heel snel zijn. Maar omdat je JavaScript rendering aan hebt is dat sowieso al langzaam. En aan te raden om gewoon een lijst met URLs te gebruiken.

Als je gaat crawlen krijg je een extra kolom met data met JSON output. Dit bevat:

  • Entity naam
  • Aantal keer dat de entity voorkomt
  • Freebase link (als bekend)
  • Wikipedia link (als bekend)

Volgende stappen

Zijn aan jou. Je kan exporteren naar Google Sheets / csv, etc.

Google Ads accounts zonder vertoningen automatisch monitoren (inclusief Google Sheets backup)