Beschikbare data - Databronnen voor mashups

 

Deze pagina brengt alle beschikbare data van de partners in dit project samen. Wat we met deze data van plan zijn vind je terug bij de uitgangspunten van dit project. Er wordt een onderscheid gemaakt tussen data van erfgoedinstellingen en data van externe partners.

De projectstructuur is open, extra data beschikbaar in DC met gestandaardiseerde API's van deelnemers is zeker welkom.

 

Pas op: er zijn gebruiksbeperkingen op deze datasets. Behalve hieronder per dataset aangegeven bepalingen geldt dat de data slechts beschikbaar is tot 31/8/2008 en slechts voor experimenten met geïntegreerde interfaces in een online omgeving.

 

Op de brainstorm van 6 juli werden de lacunes besproken in dit data-overzicht, zie verslag. Nu start de tweede fase van deze inventarisatie. Wil de data voor derden bruikbaar zijn, dan dienen de opmerkingen in het blauw in te zijn aangevuld tegen UITERLIJK 16 augustus. Tussen vierkante haakjes kan na de beoordeling desnoods commentaar van de data-verantwoordelijke worden toegevoegd.

 

Participerende erfgoedinstellingen in Nederland en Vlaanderen

 

1/ Vlaams Theater Instituut (Dries Moreels)

Beschikbaarheid DC: alle records binnen DSpace zijn meteen beschikbaar ; alle andere records moeten geconverteerd naar MODS of DC

Beschikbare API's voor DC records: Dspace biedt standaard OAI ; voor alle andere records nog te bouwen

Typering beschikbare records:

  • records DSpace zijn meteen beschikbaar: 350 foto's tussen 1950 en 1980 in meerdere formaten en resoluties ; 100-tal pdf's allerhande documentatie; video is niet toegankelijk via het vrije internet, alleen thumbnails voor 100-tal video's
  • records DSpace in voorbereiding: nog meer video, gedeeltelijk zelfs vrij over het web (oktober 2007)
  • alle records uit de collectiedatabase kunnen adhoc geconverteerd worden, maar zonder digitale representatie van het boek of het knipsel uiteraard

Beoordeling 6/7/2007: Meer gestructureerde links naar beeldmateriaal zouden welkom zijn voor mashups.

Dries: OpenURL of soortgelijke structuur vanuit DSpace wordt onderzocht (timing: oktober 2007).

 

2/ Rijksmuseum Research Library (Saskia Scheltjens)

Beschikbaarheid DC: alle records op de library server zijn in DC en in een eigen metadata-formaat beschikbaar

Beschikbare API's voor DC records:

Typering beschikbare records: bibliografische data

Typering content: Westerse kunstgeschiedenis, Nederlandse geschiedenis. Kernondewerp is de Nederlandse 17e eeuw.

Beoordeling 6/7/2007: Het explain document verder uitwerken om de aangeboden data duidelijker te maken [Link naar bestaande explain record is toegevoegd. In de tweede helft van 2007 wordt dit verder aangevuld met de beschikbare indexeervelden. Saskia - 11.07.2007]

[Marcel: Het explain record is op 30 januari 2008 bijgewerkt. Zoeken binnen context set 'rm' is iets ruimer dan binnen de context sets dc en cql met velden als title, creator, subject, begindatum, einddatum, enz. Zoeken op alle velden wordt via rm.record of cql.anywhere ondersteund. Standaard retrieval schema is Dublin Core.]

 

3/ Musea Stad Antwerpen (Henk Vanstappen)

Beschikbaarheid DC: niet beschikbaar

Beschikbare API's voor -DC- records:

  • Gedeelte van de collectie binnenkort beschikbaar via beeldbank (memorix). Mogelijk kunnen alle records via deze Memorix-db beschikbaar gesteld worden (nu: alleen objecten met afbeelding van hoge kwaliteit, ifv beeldbank). Zal echter pas weerhouden worden als AdlibSQL niet beloofde resultaat oplevert.
  • Alle records kunnen aangeleverd worden in Adlib XML. Adlib kan geen export voorzien in DC.
  • Momenteel bezig met overschakeling naar AdlibSQL. Hierdoor worden data via web beschikbaar (ook zonder Adlib Internet Server module). Datum waarop deze versie online beschikbaar zal zijn, is nog niet bekend (eind 2007, begin 2008?).

Typering beschikbare records: objectgegevens van museale collecties stad Antwerpen

Beoordeling 6/7/2007: Graag tegen midden augustus meer duidelijkheid over wat men concreet kan bieden aan data in de tweede helft van 2007. Voor overige vragen, zie verslag.

 

4/ Universiteitsbibliotheek Gent (Patrick Hochstenbach)

Beschikbaarheid DC: Al onze publiek toegankelijke databanken kunnen DC aanleveren: catalogus, bibliografie, institutional repository, beelddatabank. Op dit ogenblik zijn alleen de catalogus en institutional repository geactiveerd voor DC.

Beschikbare API's voor DC records: Op alle diensten is een OAI-PMH interface voorzien. De catalogus is eventueel via Z39.50 ondervraagbaar. De beelddatabank is via OpenURL toegankelijk om verschillende representaties van beelden op te vragen (thumbnail, small, medium, large, zoomer, ...)

Typering beschikbare records:

*

Catalogus (Aleph):

+/- 1.000.000 records (boeken, tijdschriften + metadata uit de beelddatabank)

OAI BaseURL: http://aleph.ugent.be:8080/OAI/rug01

MetadataFormats: oai_dc, marc

Voorbeeld record: info:ugent-repo/aleph/rug01-000980734

*

Bibliografie (Aleph):

+/- 82.000 records (artikels, thesissen)

OAI BaseURL: http://aleph.ugent.be:8080/OAI/epr01

MetadataFormats: oai_dc, marc

Voorbeeld record: info:ugent-repo/aleph/epr01-000000001

*

Institutional Repository (DSpace):

+/- 2.500 records (artikels, thesissen, ...)

OAI BaseURL: http://archive.ugent.be/oai/

MetadataFormats: oai_dc

Voorbeeld record: hdl:1854/176

*

Beelddatabank (aDORe):

+/- 40.000 records (images)

OAI BaseURL: http://adore.ugent.be/OAI/erez

Voorbeeld record: info:ugent-repo/erez/topobig/I-/I-00001_2004_0001_AC.tifhttp://adore.ugent.be/OpenURL/resolve

MetadataFormats: MPEG-21 DIDL

OpenURL BaseURL:

Beoordeling 6/7/2007: meer gestructureerde data voor het beeldmateriaal, duidelijkere omschrijvingen om verdubbelingen van data in datasets voor gebruikers duidelijk te maken.

 

 

5/ Vlaamse Kunstcollectie (Geert Souvereyns)

De Vlaamse Kunstcollectie (VKC) maakt gebruik van het software-pakket CollectionConnection voor de integratie en ontsluiting van de collectiegegevens van het Groeningemuseum Brugge (adlib), het Museum voor Schone Kunsten Gent (adlib) en het Koninklijk Museum voor Schone Kunsten Antwerpen (The Museum System). De collectiegegevens uit de 3 databases worden geïndexeerd en samengevoegd in 1 uniforme recordstructuur. CollectionConnection koppelt ook het beeldmateriaal aan de records.

Beschikbaarheid DC: CollectionConnection werkt conform DCMI (Dublin Core Metadata Initiative). Voorbeeld van de recordstructuur (in XML-formaat):VKC_XML.docIn de mapping zijn weliswaar iets andere veldaanduidingen gebruikt, maar dat kan gemakkelijk terug worden gevoerd naar DC. Zie mappingtabel: mappingtabel DCI-VKC_070725.xls

Beschikbare API'S: Hier is het antwoord van C-IT, de leveranciers van CollectionConnection: "CC is met beide protocollen uit te vragen. OAI/PMH staat in principe standaard “aan” en kan gebruikt worden voor het uitvragen van de data. Z39.50 wordt ook door CC ondersteunt en het gebruik daarvan is mogelijk, maar wordt niet door Cit aangeraden. Het is een wat verouderd en achterhaald protocol. De databases zijn op basis van een URL-query uit te vragen. Dat werkt op vergelijkbare wijze als SRU en voldoet vrijwel aan die standaard"

Typering records: beperkte beschrijving van de kunstwerken met een aantal basisvelden (zie recordstructuur)

Typering content: de collectie bestaat uit schilderijen, beeldhouwwerken en prenten (tekeningen, gravures, enz.). Aan de meeste records zijn ook afbeeldingen gekoppeld (indien beschikbaar). Momenteel staan er zo'n 6.000 records online.

Beoordeling 6/7/2007: URL'S naar de data ontbreken. Graag duidelijkere technische informatie alsook inzicht in de bereidheid van de diverse partners om hun data in dit project (tijdelijk) te delen  

Antwoord Geert: Ik heb hierboven naar best vermogen de technische informatie nog aangevuld. De directies van de 3 musea hebben ook toegestemd dat hun collectiegegevens mogen gebruikt worden, maar enkel voor onderzoeksdoeleinden. Voor publicatie in welke vorm dan ook, is de toestemming van de directies vereist (geldt voor alle projecten van data-uitwisseling). Probleem is dat ikzelf technisch weinig onderlegd ben. Ik neem aan dit project deel om meer te leren over de uitwisselbaarheid van onze collectiegegevens en eventuele tekortkomingen op dit vlak. Om de gegevens van onze server weg te plukken lijkt het mij het meest praktisch dat de persoon die dit zal doen, rechtstreeks contact opneemt met C-IT. Laat maar weten wanneer het zover is. Extra technische gegevens over onze server en de standaards, die worden ondersteund: ccManualV2.pdf, hoofdstuk 6 (p.79-111).

 

6/ ModeMuseum Provincie Antwerpen (Dieter Suls)

Beschikbaarheid DC: Via Adobe Photoshop wordt beeldmateriaal via embedded tags (XMP) beschreven, er zou een link met DC gelegd kunnen worden, maar dit dient verder onderzocht te worden...

Beschikbare API's voor DC records: ?

Typering beschikbare records: MoMu heeft een grote verzameling digitale beelden in een veelheid aan formaten (voornamelijk jpeg en tiff). Deze verzameling is geordend door middel van mappen en submappen en er kan gezocht worden naar beelden door middel van de bestandsnaam (vb. dvn_ss01_@ET_1 => DVN= Dries Van Noten - ss01 = Collectie Lente Zomer 2001 - @ET = Fotograaf (en copyright-houder) Etienne Tordoir - 1 = volgnummer). Deze beeldbank is een organisch gegroeid geheel dat ondertussen meer dan 35.000 records telt en met het project "dublin core is voldoende" willen we onderzoeken in hoeverre DC een standaard is waarmee we onze metadata op een andere manier kunnen structureren. Hoe dit dan exact moet gebeuren is nog niet geheel duidelijk...

Typering content: Voornamelijk digitale foto's en scans van modecollecties sinds de jaren 90. De beeldbank is niet online beschibaar en in eerste instantie voor intern gebruik.

Beoordeling 6/7/2007: Graag tegen midden augustus meer duidelijkheid over wat men concreet kan bieden aan data in de tweede helft van 2007. Voor overige vragen, zie verslag.

 

 

7/ Stadsbibliotheek Antwerpen (Peter Rogiest)

Er wordt voor de bibliotheektoepassingen gewerkt met de Brocade-software van de Universiteit Antwerpen (UA).

Beschikbaarheid DC: OAI_DC. Andere metadataformaten o.a. MODS, CATXML (Brocade XML formaat) en MARC21 XML.

Beschikbare API's voor DC records: OAI-PMH (in huidige release 3.00 van Brocade); vanaf release 3.10 volgens planning ook Z39.50 en OpenURL.

OAI_DC XML files worden door Brocade momenteel niet via een url ter beschikking gesteld. Het ANET-team (Universiteit Antwerpen), dat de Brocade-software ontwikkelt, kan wel een dataset leveren in OAI_DC XML van alle (of een deelset) records met SBA-holdingskenmerken. Voor dit project lijkt eerder een (onderwerpsmatig afgebakende) deelset interessant, wegens de relatieve zwaarte van de data (100.000 records = +/- 250 MB).

Typering beschikbare records: Aantal: +/- 583.000 records. Bibliografische metadata: boeken, tijdschriften, pamfletten en vliegende bladen, kaarten en plannen, overdrukken. Geen tijdschriftartikels.

Typering content: Zwaartepunten: Nederlandse letterkunde en taal, boekgeschiedenis, Vlaamse en Antwerpse geschiedenis, heemkunde, Antverpiensia, oude drukken.

Beoordeling 6/7/2007: Via welke url is deze data beschikbaar? De omvang van de records is onduidelijk, graag concrete cijfers [Antwoorden op deze vragen verwerkt in bovenstaande tekst - Peter 2007/08/03].

 

8/ Felixarchief Antwerpen (Matthias Vandermaesen & Joost Depuydt)

Beschikbaarheid DC: Het datamodel van onze beeldbank AVA is gebaseerd op het EVO model van haar voorloper de EVA beeldbank. Het EVO model is DC compliant. Omdat het datamodel in de overgang naar AVA een aantal wijzigingen heeft ondergaan is het vraag of DC compatibiliteit nog altijd geldt.

Beschikbare API's voor DC records: niet beschikbaar

Typering beschikbare records: metadata voor het beschrijven van beeldmateriaal (foto's, prentbriefkaarten,...)

Typering content: de AVA beeldbank bevat alle beschrijvingen en het reeds gedigitaliseerde materiaal uit onze beeldarchieven. Deze verzameling is zeer omvangrijk en heterogeen. Ze is organisch gegroeid op basis van particuliere schenkingen, overdrachten van archieven naar het Felixarchief van diensten binnen de Stad Antwerpen, etc. Het betreft voornamelijk fotomateriaal dat gerelateerd is aan de stad Antwerpen (personen, plaatsen, gebeurtenissen,...).

Beoordeling 6/7/2007: Is er in de nabije toekomst een toegang tot de data via een server te verwachten? Dan kan de kwaliteit van de DC beschrijvingen worden gecontroleerd in de praktijk.

Status 9/11/2007: Er komt een e-depot waarin AVA wordt geïntegreerd. Beleid voor ontsluiting 'iconografische' collectie met oog op mashups (georeferencing) wordt op dit moment ontwikkeld. Nieuwe website die haar gegevens haalt uit de MACZ-databank gaat vandaag live. Mogelijkheid om afzonderlijk bestand (collectie prenten Hogenberg) met geocoördinaten te ontsluiten. Is nu nog niet het geval.

 

9/ Resonant vzw, Centrum voor Vlaams Muzikaal Erfgoed (nieuwe contactpersoon nog onbekend)

Resonant beschikt over twee databanken. Voor de beschrijvingen van collecties en archieven maakt men gebruik van de webdatabank Muziekbank Vlaanderen. Dit online systeem is ontworpen met het open sourcepakket Etomite. Muziekbank Vlaanderen telt momenteel een 2000-tal beschrijvingen. Daarnaascatalogiseert partituren in de online databank van RISM, Répertoire International des Sources Musicales, een initiatief dat gedragen wordt door een 32-tal landen en opereert onder de vleugels van UNESCO. Resonant beschikt over de Vlaamse records in een access-formaat. Het is de bedoeling met deze gegevens een online databank uit te bouwen. RISM telt circa 50 velden. Er zijn ongeveer 30.000 Vlaamse records.

Beschikbaarheid DC: moet nog onderzocht worden. Wellicht kan elk veld uit Muziekbank Vlaanderen en RISM via een mappingtool gekoppeld worden aan een DC-veld.

Beschikbare API's: moet nog onderzocht worden.

Typering beschikbare records: metadata voor het beschrijven van collecties en archieven; metadata voor het beschrijven van partituren

Typering content: Muziekbank Vlaanderen bestaat uit een 26-tal ISAD(G)-velden aangevuld met de ISAAR(CPF)-velden voor de constructie van de authority records. Deze velden geven meer informatie over een collectie of archief inzake de inhoud, de grootte, de bestandsvormer, de preservatie- en consultatievoorwaarden, etc. Het RISM-record bestaat in de eerste plaats uit gedetailleerde beschrijvingen van partituren en partijen, zowel in handschrift als in druk, volledig of onvolledig, in de vorm van een eindproduct of in schetsvorm. Elke partituur krijgt een fiche met een aantal verplichte velden zoals componist, titel, genre, bezetting. Andere velden alstoonaard, delen of notenincipit worden facultatief. RISM combineert daarenboven een catalografische aanpak met aandacht voor de archivalische context van het stuk.

Beoordeling 6/7/2007: Er is meer informatie nodig over de structuur en opzet van de database waar de info in wordt aangeboden (hoe zit het met SQL?). Hoe zit het met de timing?

 

10/ Bibliotheek van de Universiteit van Amsterdam(Marco Streefkerk)

A/

 

Beschikbaarheid DC: Alle records binnen UvA-Dare.

 

Beschikbare API's voor DC records: OAI-Base URL's http://dare.uva.nl/cgi/arno/oai/uvapub,http://dare.uva.nl/cgi/arno/oai/uvadis en http://dare.uva.nl/cgi/arno/oai/uvascrip

Typering beschikbare records: Bibliografische metadata in oai_dc (ook dare_didl), bv oai:uvadis:226935

 

Typering content: Publicaties (90.000), dissertaties (4.000) en scripties (3300) van medewerkers van de universiteit; circa 10% van publicaties en dissertaties voorzien van verwijzing naar full-text.

 

 

B/

 

Beschikbaarheid DC: Beschrijvingen van scripties en website door de Hogeschool van Amsterdam

 

Beschikbare API's voor DC records: SRU http://scriptiesonline.bib.hva.nl/cgi/s/sru/sru-hvascript.pl en http://webbronnen.bib.hva.nl/cgi/s/sru/sru-hvawebbron.pl

Typering beschikbare records: Bibliografische metadata in DC V1.1.

 

Typering content: Scripties (400 inclusief full-text) vooralsnog van de opleiding Fysiotherapie en Ergotherapie van de Amsterdamse Hogeschool voor Paramedische Opleidingen (AMPO) en beschijvingen van website (2000) relevant voor de opleidingen binnen de HvA.

 

 

11/ Digitaal Erfgoed Nederland(Marco Streefkerk)

Beschikbaarheid DC: collectie-informatie van minimaal twee erfgoedinstellingen per november die het voorstel voor de Basisnormen Vindbaarheid in de praktijk gaan toetsen.

Beschikbare API's voor DC records: nog niet bekend.

Typering beschikbare records: beschrijvende metadata voor erfgoedobjecten inclusief een mechanisme om vanuit de metadata het toegang tot de (digitale) objecten te verkrijgen.

Typering content: afhankelijk van de deelnemende instelingen: archivaal, museaal, bibliografisch, ruimtelijk, etc.

 

 

11/ Instelling (contactpersoon)

Beschikbaarheid DC: ............................

Beschikbare API's voor DC records: .................

Typering beschikbare records: .......................

Typering content: ........................

 

 

Meespelen? Vul aan!

 

 

Externe data partners

 

1/ Amazon ECS

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content: Covers van boeken via ISBN

 

2/ A9 OpenSearch

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

3/ Amazon Web Services

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

4/ eBay Developers Program

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

5/ Flickr Services

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

6/ Google Web APIs

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

7/ Google Maps API

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

8/ OCLC's xISBN service

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

9/ ThingISBN, van LibraryThing

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

10/ OpenContent, van IndexData

Beschikbaarheid DC: ja

Beschikbare API's voor DC records: z39.50

Typering beschikbare records: descriptive records

Typering content: dmoz, oaister, e.d.

 

11/ Information Environment Service Registry (IESR)

Beschikbaarheid DC: ja

Beschikbare API's voor DC records: z39.50, OAI-PMH, OpenURL

Typering beschikbare records: descriptive records

Typering content: informatie over elektronische bestanden van belang voor docenten, onderzoekers en studenten inclusief technische specificaties hoe ze toegankelijk zijn

 

12/ OCLC's Linked Authority File (LAF)

Beschikbaarheid DC: 

OAI-Base URL: http://localhost:8080/oaicat/OAIHandler (assuming Tomcat's default port 8080). More info: http://alcme.oclc.org/oaicat

Typering beschikbare records: descriptive records

Typering content: authority files

 

13/ en overige ...

 

Aan te vullen:

 

Partner:

Beschikbaarheid DC:

Beschikbare API's voor DC records:

Typering beschikbare records:

Typering content:

 

Vul aan.

 

 


Page Information

  • 3 months ago [history]
  • View page source
  • You're not logged in
  • Recent comments:
    Marco Streefkerk:Een aardige discussie met beheer hier: bieden we alleen DC-toegangen (API's dan wel uitwisselingsprotocollen) aan die IN PRODUCTIE zijn? Ja, want alleen dan kunnen we de studenten die ermee aan de slag gaan voldoende betrouwbaarheid en ondersteuning bieden. Nee, want met dat criterium blijft er te weinig over. We streven naar een demonstrator en als dan zijn fouten en storingen (die niet snel opgelost worden) een gegeven.
    Saskia Scheltjens:@ Henk, Alexander: Informatie in deze twee punten blijft me onduidelijk. Welk dataformaat wordt er gebruikt in de Memorix-db? (vraag Saskia, d.d. 22.02.2007) Memorix is een open systeem en legt geen formaat op. De gebruiker kiest zelf de veldenset. De databank bevat 37 velden: de technische data van de fotografen over de foto + een subset van de Adlib-data die het object beschrijven. Elk veld kan door middel van een ingebouwde mappingtool gekoppeld worden aan een DC-veld. Alle data kunnen dan in DC XML aangeleverd worden via export of OAI-PMH. (antwoord Alexander dd 24/5/07)
    Saskia Scheltjens:Opletten dat API en beschikbare uitwisselingsprotocols niet wordt verward.
  • No tags yet learn more

Wiki Information

Recent PBwiki Blog Posts