
Beschikbare data - Databronnen voor mashups
Deze pagina brengt alle beschikbare data van de partners in dit project samen. Wat we met deze data van plan zijn vind je terug bij de uitgangspunten van dit project. Er wordt een onderscheid gemaakt tussen data van erfgoedinstellingen en data van externe partners.
De projectstructuur is open, extra data beschikbaar in DC met gestandaardiseerde API's van deelnemers is zeker welkom.
Pas op: er zijn gebruiksbeperkingen op deze datasets. Behalve hieronder per dataset aangegeven bepalingen geldt dat de data slechts beschikbaar is tot 31/8/2008 en slechts voor experimenten met geïntegreerde interfaces in een online omgeving.
Op de brainstorm van 6 juli werden de lacunes besproken in dit data-overzicht, zie verslag. Nu start de tweede fase van deze inventarisatie. Wil de data voor derden bruikbaar zijn, dan dienen de opmerkingen in het blauw in te zijn aangevuld tegen UITERLIJK 16 augustus. Tussen vierkante haakjes kan na de beoordeling desnoods commentaar van de data-verantwoordelijke worden toegevoegd.
Participerende erfgoedinstellingen in Nederland en Vlaanderen
1/ Vlaams Theater Instituut (Dries Moreels)
Beschikbaarheid DC: alle records binnen DSpace zijn meteen beschikbaar ; alle andere records moeten geconverteerd naar MODS of DC
Beschikbare API's voor DC records: Dspace biedt standaard OAI ; voor alle andere records nog te bouwen
Typering beschikbare records:
Beoordeling 6/7/2007: Meer gestructureerde links naar beeldmateriaal zouden welkom zijn voor mashups.
Dries: OpenURL of soortgelijke structuur vanuit DSpace wordt onderzocht (timing: oktober 2007).
2/ Rijksmuseum Research Library (Saskia Scheltjens)
Beschikbaarheid DC: alle records op de library server zijn in DC en in een eigen metadata-formaat beschikbaar
Beschikbare API's voor DC records:
Typering beschikbare records: bibliografische data
Typering content: Westerse kunstgeschiedenis, Nederlandse geschiedenis. Kernondewerp is de Nederlandse 17e eeuw.
Beoordeling 6/7/2007: Het explain document verder uitwerken om de aangeboden data duidelijker te maken [Link naar bestaande explain record is toegevoegd. In de tweede helft van 2007 wordt dit verder aangevuld met de beschikbare indexeervelden. Saskia - 11.07.2007]
[Marcel: Het explain record is op 30 januari 2008 bijgewerkt. Zoeken binnen context set 'rm' is iets ruimer dan binnen de context sets dc en cql met velden als title, creator, subject, begindatum, einddatum, enz. Zoeken op alle velden wordt via rm.record of cql.anywhere ondersteund. Standaard retrieval schema is Dublin Core.]
3/ Musea Stad Antwerpen (Henk Vanstappen)
Beschikbaarheid DC: niet beschikbaar
Beschikbare API's voor -DC- records:
Typering beschikbare records: objectgegevens van museale collecties stad Antwerpen
Beoordeling 6/7/2007: Graag tegen midden augustus meer duidelijkheid over wat men concreet kan bieden aan data in de tweede helft van 2007. Voor overige vragen, zie verslag.
4/ Universiteitsbibliotheek Gent (Patrick Hochstenbach)
Beschikbaarheid DC: Al onze publiek toegankelijke databanken kunnen DC aanleveren: catalogus, bibliografie, institutional repository, beelddatabank. Op dit ogenblik zijn alleen de catalogus en institutional repository geactiveerd voor DC.
Beschikbare API's voor DC records: Op alle diensten is een OAI-PMH interface voorzien. De catalogus is eventueel via Z39.50 ondervraagbaar. De beelddatabank is via OpenURL toegankelijk om verschillende representaties van beelden op te vragen (thumbnail, small, medium, large, zoomer, ...)
Typering beschikbare records:
*
Catalogus (Aleph):
+/- 1.000.000 records (boeken, tijdschriften + metadata uit de beelddatabank)
OAI BaseURL: http://aleph.ugent.be:8080/OAI/rug01
MetadataFormats: oai_dc, marc
Voorbeeld record: info:ugent-repo/aleph/rug01-000980734
*
Bibliografie (Aleph):
+/- 82.000 records (artikels, thesissen)
OAI BaseURL: http://aleph.ugent.be:8080/OAI/epr01
MetadataFormats: oai_dc, marc
Voorbeeld record: info:ugent-repo/aleph/epr01-000000001
*
Institutional Repository (DSpace):
+/- 2.500 records (artikels, thesissen, ...)
OAI BaseURL: http://archive.ugent.be/oai/
MetadataFormats: oai_dc
Voorbeeld record: hdl:1854/176
*
Beelddatabank (aDORe):
+/- 40.000 records (images)
OAI BaseURL: http://adore.ugent.be/OAI/erez
Voorbeeld record: info:ugent-repo/erez/topobig/I-/I-00001_2004_0001_AC.tifhttp://adore.ugent.be/OpenURL/resolve
MetadataFormats: MPEG-21 DIDL
OpenURL BaseURL:
Beoordeling 6/7/2007: meer gestructureerde data voor het beeldmateriaal, duidelijkere omschrijvingen om verdubbelingen van data in datasets voor gebruikers duidelijk te maken.
5/ Vlaamse Kunstcollectie (Geert Souvereyns)
De Vlaamse Kunstcollectie (VKC) maakt gebruik van het software-pakket CollectionConnection voor de integratie en ontsluiting van de collectiegegevens van het Groeningemuseum Brugge (adlib), het Museum voor Schone Kunsten Gent (adlib) en het Koninklijk Museum voor Schone Kunsten Antwerpen (The Museum System). De collectiegegevens uit de 3 databases worden geïndexeerd en samengevoegd in 1 uniforme recordstructuur. CollectionConnection koppelt ook het beeldmateriaal aan de records.
Beschikbaarheid DC: CollectionConnection werkt conform DCMI (Dublin Core Metadata Initiative). Voorbeeld van de recordstructuur (in XML-formaat):
VKC_XML.docIn de mapping zijn weliswaar iets andere veldaanduidingen gebruikt, maar dat kan gemakkelijk terug worden gevoerd naar DC. Zie mappingtabel:
mappingtabel DCI-VKC_070725.xls
Beschikbare API'S: Hier is het antwoord van C-IT, de leveranciers van CollectionConnection: "CC is met beide protocollen uit te vragen. OAI/PMH staat in principe standaard “aan” en kan gebruikt worden voor het uitvragen van de data. Z39.50 wordt ook door CC ondersteunt en het gebruik daarvan is mogelijk, maar wordt niet door Cit aangeraden. Het is een wat verouderd en achterhaald protocol. De databases zijn op basis van een URL-query uit te vragen. Dat werkt op vergelijkbare wijze als SRU en voldoet vrijwel aan die standaard"
Typering records: beperkte beschrijving van de kunstwerken met een aantal basisvelden (zie recordstructuur)
Typering content: de collectie bestaat uit schilderijen, beeldhouwwerken en prenten (tekeningen, gravures, enz.). Aan de meeste records zijn ook afbeeldingen gekoppeld (indien beschikbaar). Momenteel staan er zo'n 6.000 records online.
Beoordeling 6/7/2007: URL'S naar de data ontbreken. Graag duidelijkere technische informatie alsook inzicht in de bereidheid van de diverse partners om hun data in dit project (tijdelijk) te delen
Antwoord Geert: Ik heb hierboven naar best vermogen de technische informatie nog aangevuld. De directies van de 3 musea hebben ook toegestemd dat hun collectiegegevens mogen gebruikt worden, maar enkel voor onderzoeksdoeleinden. Voor publicatie in welke vorm dan ook, is de toestemming van de directies vereist (geldt voor alle projecten van data-uitwisseling). Probleem is dat ikzelf technisch weinig onderlegd ben. Ik neem aan dit project deel om meer te leren over de uitwisselbaarheid van onze collectiegegevens en eventuele tekortkomingen op dit vlak. Om de gegevens van onze server weg te plukken lijkt het mij het meest praktisch dat de persoon die dit zal doen, rechtstreeks contact opneemt met C-IT. Laat maar weten wanneer het zover is. Extra technische gegevens over onze server en de standaards, die worden ondersteund:
ccManualV2.pdf, hoofdstuk 6 (p.79-111).
6/ ModeMuseum Provincie Antwerpen (Dieter Suls)
Beschikbaarheid DC: Via Adobe Photoshop wordt beeldmateriaal via embedded tags (XMP) beschreven, er zou een link met DC gelegd kunnen worden, maar dit dient verder onderzocht te worden...
Beschikbare API's voor DC records: ?
Typering beschikbare records: MoMu heeft een grote verzameling digitale beelden in een veelheid aan formaten (voornamelijk jpeg en tiff). Deze verzameling is geordend door middel van mappen en submappen en er kan gezocht worden naar beelden door middel van de bestandsnaam (vb. dvn_ss01_@ET_1 => DVN= Dries Van Noten - ss01 = Collectie Lente Zomer 2001 - @ET = Fotograaf (en copyright-houder) Etienne Tordoir - 1 = volgnummer). Deze beeldbank is een organisch gegroeid geheel dat ondertussen meer dan 35.000 records telt en met het project "dublin core is voldoende" willen we onderzoeken in hoeverre DC een standaard is waarmee we onze metadata op een andere manier kunnen structureren. Hoe dit dan exact moet gebeuren is nog niet geheel duidelijk...
Typering content: Voornamelijk digitale foto's en scans van modecollecties sinds de jaren 90. De beeldbank is niet online beschibaar en in eerste instantie voor intern gebruik.
Beoordeling 6/7/2007: Graag tegen midden augustus meer duidelijkheid over wat men concreet kan bieden aan data in de tweede helft van 2007. Voor overige vragen, zie verslag.
7/ Stadsbibliotheek Antwerpen (Peter Rogiest)
Er wordt voor de bibliotheektoepassingen gewerkt met de Brocade-software van de Universiteit Antwerpen (UA).
Beschikbaarheid DC: OAI_DC. Andere metadataformaten o.a. MODS, CATXML (Brocade XML formaat) en MARC21 XML.
Beschikbare API's voor DC records: OAI-PMH (in huidige release 3.00 van Brocade); vanaf release 3.10 volgens planning ook Z39.50 en OpenURL.
OAI_DC XML files worden door Brocade momenteel niet via een url ter beschikking gesteld. Het ANET-team (Universiteit Antwerpen), dat de Brocade-software ontwikkelt, kan wel een dataset leveren in OAI_DC XML van alle (of een deelset) records met SBA-holdingskenmerken. Voor dit project lijkt eerder een (onderwerpsmatig afgebakende) deelset interessant, wegens de relatieve zwaarte van de data (100.000 records = +/- 250 MB).
Typering beschikbare records: Aantal: +/- 583.000 records. Bibliografische metadata: boeken, tijdschriften, pamfletten en vliegende bladen, kaarten en plannen, overdrukken. Geen tijdschriftartikels.
Typering content: Zwaartepunten: Nederlandse letterkunde en taal, boekgeschiedenis, Vlaamse en Antwerpse geschiedenis, heemkunde, Antverpiensia, oude drukken.
Beoordeling 6/7/2007: Via welke url is deze data beschikbaar? De omvang van de records is onduidelijk, graag concrete cijfers [Antwoorden op deze vragen verwerkt in bovenstaande tekst - Peter 2007/08/03].
8/ Felixarchief Antwerpen (Matthias Vandermaesen & Joost Depuydt)
Beschikbaarheid DC: Het datamodel van onze beeldbank AVA is gebaseerd op het EVO model van haar voorloper de EVA beeldbank. Het EVO model is DC compliant. Omdat het datamodel in de overgang naar AVA een aantal wijzigingen heeft ondergaan is het vraag of DC compatibiliteit nog altijd geldt.
Beschikbare API's voor DC records: niet beschikbaar
Typering beschikbare records: metadata voor het beschrijven van beeldmateriaal (foto's, prentbriefkaarten,...)
Typering content: de AVA beeldbank bevat alle beschrijvingen en het reeds gedigitaliseerde materiaal uit onze beeldarchieven. Deze verzameling is zeer omvangrijk en heterogeen. Ze is organisch gegroeid op basis van particuliere schenkingen, overdrachten van archieven naar het Felixarchief van diensten binnen de Stad Antwerpen, etc. Het betreft voornamelijk fotomateriaal dat gerelateerd is aan de stad Antwerpen (personen, plaatsen, gebeurtenissen,...).
Beoordeling 6/7/2007: Is er in de nabije toekomst een toegang tot de data via een server te verwachten? Dan kan de kwaliteit van de DC beschrijvingen worden gecontroleerd in de praktijk.
Status 9/11/2007: Er komt een e-depot waarin AVA wordt geïntegreerd. Beleid voor ontsluiting 'iconografische' collectie met oog op mashups (georeferencing) wordt op dit moment ontwikkeld. Nieuwe website die haar gegevens haalt uit de MACZ-databank gaat vandaag live. Mogelijkheid om afzonderlijk bestand (collectie prenten Hogenberg) met geocoördinaten te ontsluiten. Is nu nog niet het geval.
9/ Resonant vzw, Centrum voor Vlaams Muzikaal Erfgoed (nieuwe contactpersoon nog onbekend)
Resonant beschikt over twee databanken. Voor de beschrijvingen van collecties en archieven maakt men gebruik van de webdatabank Muziekbank Vlaanderen. Dit online systeem is ontworpen met het open sourcepakket Etomite. Muziekbank Vlaanderen telt momenteel een 2000-tal beschrijvingen. Daarnaascatalogiseert partituren in de online databank van RISM, Répertoire International des Sources Musicales, een initiatief dat gedragen wordt door een 32-tal landen en opereert onder de vleugels van UNESCO. Resonant beschikt over de Vlaamse records in een access-formaat. Het is de bedoeling met deze gegevens een online databank uit te bouwen. RISM telt circa 50 velden. Er zijn ongeveer 30.000 Vlaamse records.
Beschikbaarheid DC: moet nog onderzocht worden. Wellicht kan elk veld uit Muziekbank Vlaanderen en RISM via een mappingtool gekoppeld worden aan een DC-veld.
Beschikbare API's: moet nog onderzocht worden.
Typering beschikbare records: metadata voor het beschrijven van collecties en archieven; metadata voor het beschrijven van partituren
Typering content: Muziekbank Vlaanderen bestaat uit een 26-tal ISAD(G)-velden aangevuld met de ISAAR(CPF)-velden voor de constructie van de authority records. Deze velden geven meer informatie over een collectie of archief inzake de inhoud, de grootte, de bestandsvormer, de preservatie- en consultatievoorwaarden, etc. Het RISM-record bestaat in de eerste plaats uit gedetailleerde beschrijvingen van partituren en partijen, zowel in handschrift als in druk, volledig of onvolledig, in de vorm van een eindproduct of in schetsvorm. Elke partituur krijgt een fiche met een aantal verplichte velden zoals componist, titel, genre, bezetting. Andere velden alstoonaard, delen of notenincipit worden facultatief. RISM combineert daarenboven een catalografische aanpak met aandacht voor de archivalische context van het stuk.
Beoordeling 6/7/2007: Er is meer informatie nodig over de structuur en opzet van de database waar de info in wordt aangeboden (hoe zit het met SQL?). Hoe zit het met de timing?
10/ Bibliotheek van de Universiteit van Amsterdam(Marco Streefkerk)
A/
Beschikbaarheid DC: Alle records binnen UvA-Dare.
Beschikbare API's voor DC records: OAI-Base URL's http://dare.uva.nl/cgi/arno/oai/uvapub,http://dare.uva.nl/cgi/arno/oai/uvadis en http://dare.uva.nl/cgi/arno/oai/uvascrip
Typering beschikbare records: Bibliografische metadata in oai_dc (ook dare_didl), bv oai:uvadis:226935
Typering content: Publicaties (90.000), dissertaties (4.000) en scripties (3300) van medewerkers van de universiteit; circa 10% van publicaties en dissertaties voorzien van verwijzing naar full-text.
B/
Beschikbaarheid DC: Beschrijvingen van scripties en website door de Hogeschool van Amsterdam
Beschikbare API's voor DC records: SRU http://scriptiesonline.bib.hva.nl/cgi/s/sru/sru-hvascript.pl en http://webbronnen.bib.hva.nl/cgi/s/sru/sru-hvawebbron.pl
Typering beschikbare records: Bibliografische metadata in DC V1.1.
Typering content: Scripties (400 inclusief full-text) vooralsnog van de opleiding Fysiotherapie en Ergotherapie van de Amsterdamse Hogeschool voor Paramedische Opleidingen (AMPO) en beschijvingen van website (2000) relevant voor de opleidingen binnen de HvA.
11/ Digitaal Erfgoed Nederland(Marco Streefkerk)
Beschikbaarheid DC: collectie-informatie van minimaal twee erfgoedinstellingen per november die het voorstel voor de Basisnormen Vindbaarheid in de praktijk gaan toetsen.
Beschikbare API's voor DC records: nog niet bekend.
Typering beschikbare records: beschrijvende metadata voor erfgoedobjecten inclusief een mechanisme om vanuit de metadata het toegang tot de (digitale) objecten te verkrijgen.
Typering content: afhankelijk van de deelnemende instelingen: archivaal, museaal, bibliografisch, ruimtelijk, etc.
11/ Instelling (contactpersoon)
Beschikbaarheid DC: ............................
Beschikbare API's voor DC records: .................
Typering beschikbare records: .......................
Typering content: ........................
Meespelen? Vul aan!
Externe data partners
1/ Amazon ECS
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content: Covers van boeken via ISBN
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
9/ ThingISBN, van LibraryThing
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
10/ OpenContent, van IndexData
Beschikbaarheid DC: ja
Beschikbare API's voor DC records: z39.50
Typering beschikbare records: descriptive records
Typering content: dmoz, oaister, e.d.
11/ Information Environment Service Registry (IESR)
Beschikbaarheid DC: ja
Beschikbare API's voor DC records: z39.50, OAI-PMH, OpenURL
Typering beschikbare records: descriptive records
Typering content: informatie over elektronische bestanden van belang voor docenten, onderzoekers en studenten inclusief technische specificaties hoe ze toegankelijk zijn
12/ OCLC's Linked Authority File (LAF)
Beschikbaarheid DC:
OAI-Base URL: http://localhost:8080/oaicat/OAIHandler (assuming Tomcat's default port 8080). More info: http://alcme.oclc.org/oaicat
Typering beschikbare records: descriptive records
Typering content: authority files
13/ en overige ...
Aan te vullen:
Partner:
Beschikbaarheid DC:
Beschikbare API's voor DC records:
Typering beschikbare records:
Typering content:
Vul aan.
Page Information
|
Wiki Information |
Recent PBwiki Blog Posts |