Technische set-up

 

Het doel van dit project is de uitwisseling van Dublin Core datasets in machineleesbare taal. Er zijn verschillende technieken om Dublin Core aan te bieden op het Internet:

  • Zoekprotocollen, waarmee  je datasets kan doorzoeken. Voorbeelden van dit soort protocollen zijn SRU/SRW, Z39.50, OpenSearch;
  • Harvestprocotollen, waarmee je datasets kan exporteren. Voorbeelden van dit soort protocollen zijn OAI-PMH, RSS, SiteMaps.
  • Naast de bovenstaande technieken kan Dublin Core ook uitgewisseld worden via FTP dumps, annotaties van webpagina's, en dergelijke.

 

In dit project kiezen we voor OAI-PMH en SRU/SRW omdat die bij de deelnemers in gebruik zijn. Ook statische XML-files bereikbaar op een vaste URL nemen we mee als databronnen, omdat het project uitdrukkelijk drempelverlagend wil werken.

 

Dublin Core datasets beschrijven objecten aanwezig in de collecties van de instellingen. Een record kan een boek beschrijven in een bibliotheek, een LP in een archief of een schilderij in een museum. De records kunnen ook links bevatten naar een volledige textuele of binaire representatie van het object: bijv. de full-text van een boek, een gedigitaliseerde MP3 versie van de opname, de JPEG thumbnail van het schilderij.  

 

Met de bovenstaande protocollen kunnen de datasets van de instellingen worden geïntegreerd en gecombineerd. Daarvoor zijn verschillende technieken gekend:

  • Centrale indexen verzamelen alle data met behulp van de harvestprotocollen op een centrale server. Op deze data worden dan indexatieprocedures toegepast.
  • Meta-search combineert de zoekprotocollen van de instellingen in een overkoepelende zoekmachine.  De data wordt niet centraal opgeslagen en de centrale server dirigeert alleen de zoekvragen naar de instellingen, die elk apart de resultaten terugsturen naar de centrale server.
  • Diverse combinaties van beide.

 

 

Voorstel # 1 (uitwerking afspraken bijeenkomst augustus 2007)

We beginnen met een eenvoudige Simple Integrated Search, een basis zoek/browse-faciliteit die de diverse databronnen combineert tot een doorzoekbaar geheel. Kan dienen als basis platform om verdere mashups op voort te bouwen. Maar vooral ook als kennismaking met de inhoudelijke potentie van de beschikbare databronnen.

 

 

Voorstel # 2

open voor suggesties...

 

 

Links

Ontwikkelaars kunnen deze gecombineerde datasets gebruiken voor applicaties zoals:

 

  • Textuele zoekmachines, die de textuele (meta)data doorzoeken. Voorbeelden zijn:   
    • Meta-lib (Ex-Libris) [meta-search] 
    • Primo (Ex-Libris) [meta-search, centrale index]
    • PazPar2 (IndexData) laat ook “ajax” toe. [meta-search]
    • CollectionConnection (C-IT) [centrale index]
    • Memorix (Pictura) [centrale index]
  • Multimedia zoekmachines, die de gedigitaliseerde representaties doorzoekbaar maken. Voorbeelden zijn:

    • Google Image Search (met hun gezichtsherkenning software)  [centrale index]
  • Associatieve  zoekmachines, die van verbanden tussen records gebruikt maken. Voorbeelden zijn:

    • AquaBrowser (Medialab Solution) [centrale  index]
    • Autonomy [centrale index, meta-search]
    • Google Image Search, Yahoo Images, Ask Images [centrale index]
  • Tijdlijnen, kaarten: applicaties die data uit de verschillende collecties kunnen presenteren met al hun spatiotemporele relaties. Voorbeelden:

    • Simile (MIT) [centrale index]
    •   [er moeten er meer zijn ??]
  • Mashups:  virtuele combinaties van aanwezige informatie bronnen (bijv. Een virtuele tentoonstelling). Honderden websites bieden via machineleeslare talen hun data aan die deel kan worden van de interface. Voorbeelden:


Page Information

  • 7 months ago [history]
  • View page source
  • You're not logged in
  • No tags yet learn more

Wiki Information

Recent PBwiki Blog Posts