Verslag brainstorm 6 juli 2007

 

Brussel, Vlaams Theaterinstituut - gastheer: Dries Moreels

 

Aanwezig: Dries Moreels / Inge Van Nieuwerburgh / Saskia Scheltjens / Seth Van Hooland / Chris Vastenhoud / Eugeen Schreurs / Patrick Hochstenbach / Marie-Charlotte Le Bailly / Matthias Vermaesen / Jef Malliet / Jan Nouwen

Verontschuldigd: Steven Leman / Alexander Stiermans / Guy Detrez / Robbe Hermans / Johan Vanhecke / Henk Vanstappen / Peter Rogiest / Debbie Esmans / Dieter Suls / Geert Souvereyns

 

1/ voorstellen nieuwe deelnemers

Iedereen stelt zich voor, de nadruk ligt op de nieuwe deelnemers (Marie-Charlotte Le Bailly, Jef Malliet, Marco Streefkerk).

 

2/ bespreken beschikbare data in DC

Saskia stelt voor om het data-overzicht van Gent als voorbeeld te gebruiken en licht doel van overzicht toe. Bij bijna alle deelnemers ontbreken nog zaken en/of zijn er vragen over de informatie. Per instelling worden de opmerkingen en vragen opgelijst, zie hieronder. Bij de lijst beschikbare data wordt concreet aangegeven wat nog moet worden aangevuld/aangepast. Alle deelnemers wordt gevraagd dit aan te vullen tegen uiterlijk midden augustus 2007.

 

VTI

Patrick heeft data en link met server nagekeken. Er is voldoende informatie beschikbaar om data te harvesten met standaard tools. Dries maakt opmerking over ‘specifieke toeters en bellen’ in records die hij verder zal toelichten in data-overzicht (@Dries: graag meer verduidelijking).

Meer gestructureerde presentatie bij mash-up beeldmateriaal zou welkom zijn. 

 

RIJKSMUSEUM RESEARCH LIBRARY

Patrick heeft data en link met server nagekeken. Er is voldoende informatie beschikbaar om data te harvesten met standaard tools.  

Het explain document zou verder uitgewerkt kunnen worden om het nog duidelijker te maken. 

 

>> Marco informeert naar beschikbaarheid collectie-informatie Rijksmuseum. Saskia stelt dat de informatie uit de voormalige ARIA database ook voor de Rijksmuseumwidget wordt gebruikt en dus in principe als XML stream zou aangeroepen kunnen worden. Mits deelname andere musea aan project wil ze contact opnemen met verantwoordelijken binnen musea om naar interesse tot deelname te peilen.

 

>> Marco maakt opmerking over de gewijzigde opvattingen in verband met integratie van data waarbij hij verwijst naar de huidige discussie hierover in Nederland. Vroeger werd er gepleit om decentraal (Z39.50 en SRU) te werken en nu keert men daarvan terug en wordt er gepleit om decentraal te werken (OAI). Wat is binnen dit project de bedoeling? Dries en Saskia lichten de uitgangspunten van OKBV-DC toe. Het transportprotocol is niet de centrale vraag, maar eerder een technologische kwestie. Het draait hier om light-weight toepassingen waarbij heterogene data van diverse instellingen wordt gecombineerd.

 

MUSEA STAD ANTWERPEN

Verantwoordelijke is niet aanwezig.

Jef Malliet verduidelijkt de opmerking in het dataoverzicht dat Adlib geen export voorziet in DC. Bij Adlib Bibliotheek kan dit wel, bij Adlib Museum niet. CIMI heeft in het verleden onderzoek gedaan naar mapping SPECTRUM x DC, maar bij zijn weten is dit nog niet concreet geïmplementeerd bij Adlib. 

De rechtstreekse koppeling met data is enkel mogelijk via de Adlib Internet module. Er wordt verondersteld dat deze partner daar niet over beschikt (@Henk: klopt dit?). Marie-Charlotte vertelt dat de implementatie van de SQL database in de herfst wordt gepland (@Henk: klopt dit?). Mogelijk is de data dan eenvoudiger te benaderen. 

Mogelijk kan er voor dit project gewerkt worden met een eenmalige export van data uit Adlib in XML, desnoods een specifieke subset. 

Graag tegen midden augustus meer duidelijkheid over wat deze deelnemer concreet kan bieden aan data in de tweede helft van 2007.

Henk: zie aanvullingen bij Beschikbare data

 

UNIVERSITEIT GENT

Er is voldoende informatie beschikbaar om data te harvesten met standaard tools.De metadata voor de beelddatabank is MPEG21 formaat (is ook keuze KBNederland).

Idem probleem als VTi wat betreft nood aan meer gestructureerde data voor het beeldmateriaal (@Patrick: klopt dit?). Inge: vooral probleem dat je op een tussenpagina terecht komt en niet bij het werk zelf.

Sommige bestanden bevatten dezelfde data. Dit zal duidelijker worden vermeld in de omschrijvingen om verdubbelingen duidelijk te maken.

OpenURL wordt gebruikt om te beschrijven welke binaire data er wordt aangeboden (bij beeldmateriaal verwijst het naar de representatie).

 

VLAAMSE KUNSTCOLLECTIE

Verantwoordelijke is niet aanwezig.

De URL’s naar de data ontbreken. Uit de geleverde informatie blijkt verwarring over de beschikbare API’s. OKBV_DC zoekt deze om data naar buiten te halen, C-IT gebruikt DC om data binnen te halen en die vervolgens te tonen via de website van het project. 

Graag duidelijkere technische informatie alsook inzicht in de bereidheid van de diverse partners om hun data in dit project (tijdelijk) te delen.

 

MOMU

Verantwoordelijke is niet aanwezig.

De data is momenteel niet online beschikbaar. Matthias vertelt dat Dieter contact heeft gezocht met Archief Antwerpen over praktische opzet digitaliseringproject (stadium: aanvraag projectsubsidie). Archief heeft voorgesteld om de aanwezige metadata (XMP) in te kapselen in XML. Het voordeel van een dergelijke container is dat de data in ieder geval al bereikbaar is. Andere suggestie is om met TIFF-tags te werken om in de testspecificatie data in te kapselen. De bibliotheek heeft nog niet laten weten welke keuzes er gemaakt zullen worden.

Patrick vraagt zich af of bij dit beeldmateriaal copyright een probleem zou kunnen vormen (@Dieter: graag meer info).

 

Dieter :  Na enig onderzoek gaan we wellicht opteren voor IPTC als metadataframework (zie http://nl.wikipedia.org/wiki/iptc) IPTC is een standaard voor het beschrijven van beelden die ontwikkeld werd door de International Press en Telecomunications Council en laat toe aan de hand van een aantal tags inhoudelijke informatie toe te voegen aan het beeld. Deze metadata wordt ingekapseld en kan (voorzover mij bekend) gemapt worden naar de dublin core-metadataframework en de IPTC-informatie kan perfect geëxporteerd worden in XML.

 

De beeldbank die MoMu ter beschikking stelt voor het project is in de eerste plaats bedoeld voor intern gebruik. Als dublin core voldoende is om gesofistikeerde uitwisseling van gegevens te ondersteunen, dan is het misschien ook nuttig om te bekijken in hoeverre een interne beeldbank ermee kan worden gestructureerd en hoe een dergelijk intern gebruik kan verzoend worden met veeleer externe gerichte toepassingen.

 

De aard van deze data is wellicht grondig verschillend van de meeste andere deelnemers. Het gaat om een verzameling foto's en niet om een databank. Wat mij enorm interesseert (en wat de reden is voor mijn deelname aan dit project) zijn de volgende 3 vragen:

1. Hoe krijg ik deze foto's op een goede manier beschreven? Deze "indexeer"-vraag is, meen ik, hierboven beantwoord (=> via ingekapselde informatie aan de beelden beschreven volgens IPTC-standaard)?

2. Hoe haal ik deze informatie er weer uit? Dit gaat dan veeleer over het retrieval-aspect waar ik bijna uit ben, maar ik ben nog een bepaald software-pakket aan het testen dat op basis van getagde beelden automatisch een databank genereert)

3. Hoe kan ik deze informatie delen met anderen? Deze laatste vraag is nog een taaie dobber, en zal nog enige inspanningen vergen. Maar, als IPTC-content naar DC gemapt kan worden, lijkt me de uitwisseling van gegevens makkelijk haalbaar en lijkt me "de manier waarop" een mooie onderzoeksvraag om binnen het kader van dit project aan te vatten. Copyright is een kwestie die in deze laatste fase eveneens aan bod kan komen en het is inderdaad zo dat niet alle beelden zomaar vrij ter beschikking kunnen worden gesteld. Anderzijds zijn er voldoende beelden in deze beeldbank aanwezig waarvan MoMu de copyright-houder is en kan op basis van deze beelden een mooi testbed ontwikkeld worden.

 

Het werken met een eenmalige export van onze metadata in XML(in dump-vorm), waarvan hieronder sprake, is dus zeker mogelijk op relatief korte termijn voor een deel van onze beeldbank.

 

Mogelijk kan er voor dit project gewerkt worden met een eenmalige export van (meta)data uit Photoshop in XML, desnoods een specifieke subset. Graag tegen midden augustus meer duidelijkheid over wat deze deelnemer concreet kan bieden aan data in de tweede helft van 2007.

 

STADSBIBLIOTHEEK

Verantwoordelijke is niet aanwezig.

Op welke url is deze data beschikbaar?

De omvang van de records is onduidelijk, graag concrete cijfers.

 

>> Patrick maakt als algemene opmerking dat meer concrete cijfers over het preciese aantal records/omvang data handig zou zijn. Dit is belangrijk voor ontwikkelaars.

 

FELIXARCHIEF ANTWERPEN

De meest flexibele data is het beeldmateriaal binnen het oude EVA/EVO project. De metadata daar staat in oude DC en is mogelijk bruikbaar voor dit project. De archiefbeschrijvingen zitten nu in SQL. Er zijn niet direct plannen om de data van het beeldmateriaal verder te integreren in de archiefbeschrijvingen, wel is er een evolutie naar ISAD-G. De aanpassing/update van de DC is niet echt gepland.

De technische infrastructuur gebeurt door een andere dienst van de Stad Antwerpen en ligt dus buiten de verantwoordelijkheid van het archief.

Het is niet helemaal duidelijk of deze deelnemer de intentie heeft om als data-leverancier aan OKBV_DC te participeren. Is er in de nabije toekomst een toegang tot de data via een server te verwachten?

 

RESONANT

Eugeen en Jan Nouwen lichten hun gegevens verder toe. Er zijn twee databanken: eentje conform de regels van de Archiefbank, eentje gebaseerd op de RISM-standaard (nog voor DC, nu wordt er internationaal gewerkt aan conversie van data naar MARC). De data uit deze tweede databank is binnenkort in access opnieuw beschikbaar. 

Er is meer informatie nodig over de structuur en opzet van de database waar de info in wordt aangeboden (hoe zit het met SQL?).

 

 

- Ontbrekende info van deelnemers:  

ERFGOED LIMBURG

De informatie over deze data ontbreekt nog op het overzicht.

Volgens Jef betreft het een project met heterogene data, dus zowel bibliografische en archivalische data, alsook beeldmateriaal. Er is voorlopig gestart met museumgegevens. Er wordt een RDF repository gemaakt waar alles aan elkaar kan worden gelinkt. De software om RDF te presenteren is Siderean Seamark. Daar kunnen ook webservices aan worden gelinkt. De eerste versie van de database is klaar, maar het is nu nog te vroeg om de link openbaar te plaatsen.

Graag timing aangeven wanneer data dan wel bereikbaar is, welke data precies en in welke formaten.

 

MUSEUM TERVUREN

Seth kijkt of er mogelijkheden zijn.

 

MUHKA, SMAK, ARGOS via PACKED

Volgens Chris hebben de eerste twee musea geen geschikte metadata die in aanmerking komt voor dit project. (@Chris: kan er nog eens worden geïnformeerd of er geen mogelijkheid is om de data van de respectievelijke websites te gebruiken?)

Bij Argos is er het probleem van copyright, zeker bij werken die ze enkel distribueren. Dries vraagt of dit zowel voor het videomateriaal zelf als ook voor de metadata van dit materiaal geldt (@Chris: graag meer info).

 

UNIVERSITEIT VAN AMSTERDAM

Marco levert informatie beschikbare bestanden UvA. Zou mooi aansluiten bij de collectie van de Universiteit Gent.

 

- Globale evaluatie aanbod dataleveranciers tot op heden + mogelijk nieuwe dataleveranciers:

 

De eerste inspanningen zijn geleverd. Nu moet er gezorgd worden dat de data wordt aangevuld zodat ze bruikbaar wordt voor ontwikkelaars.

Iedereen is het er over eens dat er data ontbreekt van musea. Ook architectuur en monumentenzorg zijn thema's die duidelijk afwezig zijn. Er worden diverse instellingen gesuggereerd en er worden afspraken gemaakt wie welke contactpersoon gaat polsen naar interesse om aan OKBV-DC als dataleverancier mee te werken.

 

>> KIK/IRPA (Seth neemt contact op met Eric Beulings)

>> Beeldbank Zeeuwse Bibliotheek (Saskia neemt contact op met Erwin Mijnsbergen)

>> Beeldbanken Vlaanderen (Seth informeert naar interesse bij Brugge, Sint-Niklaas en Mechelen)

>> Audiobanken zoals bij het Meertens-instituut, Brussel behoort ons toe-project, ... (Eugeen stuurt informatie van Meertens-instituut door naar Saskia, Dries informeert bij tweede project)

>> Jef licht stand van zaken Monumentenzorg toe waarbij duidelijk wordt dat er slechts een beperkt data-aanbod bestaat.

 

3/ rechten/copyright 

Na een korte discussie is iedereen het er over eens dat er een beknopte melding moet komen over rechten in het algemeen. Dries verwijst naar het principe van vrijwaring ('elkaar de duvel niet aandoen'). Het is door de tijdelijke opzet van dit project niet de bedoeling dat de mashup zelf gemashuped wordt, dwz het project heeft niet de bedoeling om zelf nieuwe databron te worden. Saskia stelt voor om de rechten vermelding ook te plaatsen op de pagina met beschikbare data op de projectwiki.

>> Wie stelt zich kandidaat om een eerste opzet over copyright te schrijven? << 

Elementen nav discussie:

- de vermelding dat de gebruikte data tijdelijk beschikbaar is voor de ontwikkeling van interfaces voor de duur van het OKBV_DC project.

- de data is niet bestemd voor commercieel gebruik 

 

4/ technische set-up metaproject

Patrick vult op de pagina over de set-up van het metaproject het voorstel van de Universiteit Gent verder aan.

Dries vermeldt als 4e alternatief het alternatief van MIT (@ Dries: kan je dit op de set-up pagina zelf toelichten?)

Deze informatie moet beschikbaar zijn willen we partners concreet kunnen uitleggen wat de bedoeling is van het metaproject.

 

5/ demonstratie van een mogelijke (library) mashup

Ter demonstratie worden twee stukken uit de TED presentatie van Hans Rosling samen bekeken. Luister vooral naar het einde van het filmpje (15') naar zijn pleidooi om datastreams te hergebruiken.  

 

 

Andere voorbeelden zijn te vinden in Del.icio.us met de tags OBKV_DC en mashups.

 

6/ stand van zaken partners die interfaces gaan maken

Enkel Guy Detrez (via Inge) is gecontacteerd én heeft interesse om concreet aan de slag te gaan met de data.

De meeste andere partners moeten nog altijd gecontacteerd worden. Dit moet d.r.i.n.g.e.n.d. gebeuren. Stand van zaken wordt bijgehouden op de pagina over de partners van het meta- project. Doel blijft nog steeds om in de tweede helft van 2007 projecten op te laten starten. Wel wordt de mogelijkheid voorzien om de data in de tweede helft van 2008 ook beschikbaar te houden zodat ook in de tweede helft van het academische jaar projecten kunnen worden opgezet.

 

7/ taakverdeling metaproject 

 

Zie Planning

 

 


Page Information

  • 12 months ago [history]
  • View page source
  • You're not logged in
  • No tags yet learn more

Wiki Information

Recent PBwiki Blog Posts