Gegevensopslag

Uit Wiki Memorix Maior

In tegenstelling tot eerdere versies van Memorix, kunnen in Memorix Maior verschillende soorten collecties worden beheerd binnen één beheeromgeving. Uw beeldcollecties, genealogiecollecties, bibliotheekcollecties en andere soorten collecties vindt u in Memorix Maior overzichtelijk bij elkaar in één scherm. Een gevolg van deze flexibiliteit is dat de gegevensopslag er wat complexer door wordt. In plaats van met ‘beelden’ of ‘registers’ werkt Memorix Maior op de achtergrond met ‘entiteiten’. In verschillende situaties kan het daarom voor u belangrijk zijn om te begrijpen wat er in Memorix Maior bedoeld wordt met begrippen als entiteit, record, veld en relatie.

Data, digitale bestanden en metadata

Metadata zijn gegevens die de karakteristieken van bepaalde gegevens beschrijven. Het zijn dus eigenlijk data over data. Voorbeelden van metadata van een foto zijn: de fotograaf, de datum waarop de foto is gemaakt en de plaats waar hij is genomen. Het opslaan van metadata bij de data waar het betrekking op heeft, heeft als voordeel dat de data makkelijker gevonden kan worden. Er kan bijvoorbeeld gericht worden gezocht op fotograaf, datum of plaats, wat zonder metadata niet mogelijk zou zijn. In Memorix Maior worden de beschrijvingen van uw collectie beschouwd als metadata. Uw digitale bestanden, zoals foto’s of scans van documenten, vormen dan de data. In plaats van digitale bestanden wordt ook wel gesproken van assets.

Records en velden

Gegevens die bij elkaar horen worden opgeslagen in een record. Een record is te vergelijken met een rij in een tabel. Welke gegevens er precies van elke record worden vastgelegd, wordt bepaald door de velden. Een veld is te vergelijken met een kolomkop in een tabel. In Memorix Maior worden uw metadata opgeslagen in records. De velden bepalen welke gegevens er van elk record worden opgeslagen.


Entiteiten

Wanneer gegevens over fotografen, foto’s, plaatsnamen en dergelijke worden bewaard in één grote tabel, zou dit al snel tot problemen leiden. Niet alleen wordt een dergelijke tabel enorm groot en onoverzichtelijk, hij bevat bovendien heel veel dubbele waarden. Fotografen nemen meerdere foto’s, en wanneer fotografen en foto’s samen in één tabel worden opgeslagen, moet bij elke foto telkens weer de naam van diezelfde fotograaf worden opgenomen. Het bewaren van dubbele waarden is onpraktisch en risicovol. Wanneer bijvoorbeeld de naam van een fotograaf verkeerd is gespeld dan dient u dit op vele plaatsen te herstellen (onpraktisch), met een grote kans dat u het ergens vergeet waardoor de gegevens in uw collectie niet langer consistent zijn (risicovol). Daarom worden in Memorix Maior gegevens die bij elkaar horen gebundeld opgeslagen in entiteiten. Op deze manier wordt elke fotograaf maar eenmaal opgeslagen, evenals elke foto en plaatsnaam.



In Memorix Maior heeft elke entiteit een eigen set met velden. In bovenstaand voorbeeld heeft de entiteit Fotograaf de velden Voornaam en Achternaam, en de entiteit Foto de velden Datum en Omschrijving. Een entiteit wordt dan ook gekenmerkt door de velden waaruit hij is opgebouwd: elk record binnen een entiteit is opgebouwd uit dezelfde velden. Daarom kan ook wel worden gezegd dat een entiteit een ‘type record’ is.

Relaties

Wanneer entiteiten helemaal los van elkaar zouden worden bewaard, zou niet meer zijn te achterhalen hoe ze samenhangen. Welke fotograaf heeft een bepaalde foto gemaakt? In welke plaats is de foto gemaakt? Dergelijke informatie wilt u natuurlijk ook graag vastleggen in uw collectie. Daarom worden er in Memorix Maior relaties gelegd tussen entiteiten. In het voorbeeld hieronder is er een relatie tussen Fotograaf en Foto (een fotograaf maakt foto’s) en ook een relatie tussen Foto en Plaats (een foto is gemaakt in een bepaalde plaats).



Intern worden deze relaties vastgelegd met behulp van een unieke code (in de praktijk is zo’n code een UUID). In de tabel hieronder is te zien dat iedere fotograaf een unieke code heeft; Mieke Bruintjes heeft de code 7, Jan Blauwbaard de code 8. In de entiteit Foto worden deze codes vervolgens ook vastgelegd zodat per foto kan worden teruggevonden wie de fotograaf was. Voor Plaats geldt hetzelfde; door middel van de plaatscode wordt duidelijk dat de foto over de intocht van Sinterklaas in Heerlen is genomen. Een systeem waarin de relaties tussen entiteiten op deze wijze worden opgeslagen, heet ook wel een relationele database.

Veel collecties bestaan uit een enkele entiteit, bijvoorbeeld een entiteit gevuld met beschrijvingen van films. Maar sommige collecties worden in meerdere entiteiten opgeslagen, bijvoorbeeld een bibliotheekverzameling met de entiteiten Boek, Auteur en Uitgever. Met behulp van relaties is het mogelijk om in Memorix Maior de gegevens uit die entiteiten met elkaar te verbinden. Zo kan met behulp van relaties worden vastgelegd door welke auteur een boek is geschreven, en door welke uitgever het is uitgegeven.

Meervoudige relaties

Met relaties is nog iets bijzonders aan de hand: soms kan de ene entiteit meerdere keren voorkomen in relatie tot de andere, en soms maximaal één keer. Zo kan een fotograaf meerdere foto’s nemen, maar is een foto altijd maar genomen door maximaal één fotograaf. Wanneer een entiteit meerdere keren voorkomt in relatie tot een andere noemen we dit een meervoudige relatie.

Hiërarchieën en ouder-kindrelaties

In sommige collecties is sprake van een hiërarchische structuur. Dit wil zeggen dat entiteiten telkens een meervoudige relatie hebben met een volgende entiteit. In zulke gevallen wordt ook wel gesproken van een ouder-kindrelatie: de ene entiteit is het ‘kind’ van de andere entiteit (de ‘ouder’) die zich hiërarchisch een niveau hoger bevindt. Denk aan een auteur (ouderentiteit) die meerdere boeken (kindentiteit, ouderentiteit) schrijft, terwijl van elke boek ook weer meerdere exemplaren beschikbaar zijn (kindentiteit). Genealogieverzamelingen zijn vrijwel altijd hiërarchisch geordend: een DTB-register bevat meerdere akten, en die akten bevatten op hun beurt weer meerdere personen. Bekijk het voorbeeld van een notarieel register hieronder.



In bovenstaand voorbeeld kan een bepaald notarieel register meerdere akten bevatten. En een bepaalde notariële akte kan op zijn beurt betrekking hebben op meerdere partijen. Ter illustratie zijn deze ouder-kindrelaties hieronder weergegeven als een hiërarchie.



Ouder-kindrelaties kunt u in Memorix Maior op diverse plaatsen tegenkomen:

  • Als hiërarchische boomstructuur in het hoofdscherm van collectiebeheer
    In het hoofdscherm van collectiebeheer vindt u diverse uitklapbare boomstructuren. Door een item (de ouder) uit te klappen, verschijnt het onderliggende niveau (de kinderen).


  • Als invoerveld in het formulier van een kindentiteit
    In dit invoerveld ziet u onder welke ouder de huidige record valt. Voor het voorbeeld van het notariële register hierboven, geldt dat dit invoerveld bij Notariële akte 2 de waarde Notarieel register zal bevatten. Als u Notariële akte 2 in een ander register wilt onderbrengen, klikt u op de knop Kies waarde naast het invoerveld om vervolgens een nieuwe ouderrecord te kiezen.


  • Als resultaatweergave naast een formulier
    De invoervelden in het formulier bevatten de gegevens van de ouderentiteit, in de resultaatweergave worden de records uit de kindentiteit getoond.


  • Als subformulieren onder een formulier
    De invoervelden in het formulier bevatten de gegevens van de ouderentiteit, in de subformulieren eronder worden de records van de kinderentiteit getoond. Deze weergave wordt door Memorix Maior automatisch gekozen wanneer er slechts een klein aantal kindrecords is.


Zie voor meer informatie Bladeren door verzamelingen en entiteiten.

Koepel-deelrecords

In lang niet alle collecties wordt gebruik gemaakt van koepel-deelrecords. Als u geen gebruik maakt van koepel-deelrecords, kunt u dit onderwerp overslaan.

Naast ouder-kindrelaties is er nog een andere manier om hiërarchische collecties vast te leggen: koepel-deelrecords. Het belangrijkste verschil is dat bij koepel-deelrecords alle niveaus in de hiërarchie tot dezelfde entiteit behoren. Met andere woorden: elk niveau in de hiërarchie heeft exact dezelfde velden.

Het voordeel van deze indeling is dat de gegevens van de koepelrecord maar eenmaal hoeven te worden ingevuld. Alle deelrecords nemen deze gegevens vervolgens automatisch over. Dit kan bijvoorbeeld van pas komen bij een filmcollectie. De film zelf is de koepelrecord met de complete film eraan gekoppeld als digitaal bestand. Vervolgens kunnen naar keuze deelrecords worden aangemaakt, één voor elke scène van de film. Hieronder een voorbeeld van een dergelijke filmcollectie.

Aangezien de scènes exact dezelfde eigenschappen en velden hebben als de film als geheel, kan gebruik worden gemaakt van een koepel-deelrecord indeling. Films en scènes worden dan vastgelegd in dezelfde entiteit, terwijl ook de relatie tussen de film en haar scènes bewaard blijft. In Memorix Maior kunt u per record kiezen of u het wilt gebruiken als koepel- of als deelrecord. Als het een deelrecord betreft, kunt u bovendien aangeven bij welke koepelrecord deze hoort. Deze mogelijkheid is alleen beschikbaar als door Picturae de koepel-deelrecord invoervelden voor u zijn klaargezet.



Koepel-deelrecords kunnen ook worden gebruikt voor het invoeren van grote hoeveelheden identieke gegevens. De werking hiervan is te vergelijken met de functie bulkinvoer. Ga als volgt te werk om dit effect te bereiken:

  1. Maak een nieuwe record aan die zal functioneren als koepelrecord. Vul deze record met de gegevens die u in bulk wilt invoeren.
  2. Maak een nieuwe record aan die zal functioneren als deelrecord. Om dit te bereiken kiest u bij het invoerveld Koepelrecord de bij stap 1 aangemaakte record. Het resultaat is dat alle gegevens uit de koepelrecord automatisch worden ingevuld in de zojuist aangemaakt deelrecord.
  3. Herhaal stap 2 totdat u het gewenste aantal deelrecords heeft aangemaakt.

Complexe collecties

Als u geen complexe relaties in uw collecties heeft, is dit onderwerp niet van toepassing op uw situatie. U kunt dit onderdeel dan overslaan.

Hoewel de meeste collecties uit een enkele entiteit bestaan of hiërarchisch van aard zijn, is het in Memorix Maior ook mogelijk om collecties te beheren die een heel andere structuur hebben. Zo kan het voorkomen dat u van een relatie tussen twee entiteiten extra gegevens wilt vastleggen. In het voorbeeld hieronder worden gegevens bijgehouden van Vervaardigers en de Kaarten die zij hebben gemaakt. Maar er werken vaak meerdere personen aan een kaart, bijvoorbeeld een cartograaf, tekenaar, lithograaf en een drukker. Om dit vast te leggen, wordt in Memorix Maior gebruik gemaakt van een extra entiteit die de relatie beschrijft.

In de tabellen hieronder is zichtbaar hoe de gegevens van vervaardigers en kaarten en de relatie tussen beiden worden vastgelegd, inclusief de rol die de vervaardiger speelde bij het tot stand komen van een kaart.

Het maken en beschrijven van een dergelijke relatie kan in Memorix Maior met behulp van een herhaalbar invoerveld voor gerelateerde entiteit. Het veld is herhaalbaar omdat aan een kaart kan worden gewerkt door meerdere vervaardigers.

Bekijk nu het onderstaande voorbeeld van een molencollectie. Van een molen worden foto’s en beschrijvingen van belangrijke gebeurtenissen bijgehouden. Bovendien wordt in dit voorbeeld bijgehouden welke foto betrekking heeft op welke gebeurtenis.

Ook deze collectie is niet hiërarchisch. De relaties lopen niet simpelweg van een grote categorie (molens) naar steeds gedetailleerder categorieën (foto’s of gebeurtenissen). Er is sprake van een circulaire relatie: foto’s zijn op hun beurt weer verbonden met gebeurtenissen. En om de zaken nog ingewikkelder te maken, kan een bepaalde gebeurtenis ook nog betrekking hebben op meerdere molens. Dit soort collecties kan niet worden weergegeven in een hiërarchische boomstructuur. In plaats daarvan worden ze doorgaans eenvoudigweg onder elkaar weergegeven. Zie Bladeren door verzamelingen en entiteiten voor verdere uitleg over het navigeren binnen complexe collecties.

Authority files

Het komt regelmatig voor dat een item in een collectie bekend is onder verschillende namen. Denk aan een auteur met de naam Jan M.C. Blauwbaard die soms ook publiceert onder de naam Mauritius Blauwbaardus. Voor uw collectie is het van belang dat beide varianten toch worden gezien als één en dezelfde auteur. Alleen op die manier kunnen de publicaties van de heer Blauwbaard aan de juiste persoon worden toegekend. Andersom kan het ook vóórkomen dat twee verschillende personen werk hebben gepubliceerd onder dezelfde naam. In dat geval is het juist van belang dat er onderscheid kan worden gemaakt tussen beide auteurs, ondanks dat ze dezelfde naam hebben. Om dergelijke situaties op een goede manier op te lossen, kan in Memorix Maior gebruik worden gemaakt van authority files. Met een authority file legt u op één centrale plek vast welke naam voor een bepaald item de voorkeur heeft in uw collectie. Een authority file is een entiteit gevuld met records waarvan telkens de voorkeursnaam, eventuele alternatieve namen en enkele uniek makende eigenschappen worden vastgelegd. Vervolgens is het de voorkeursnaam die overal in uw collectie wordt getoond, terwijl ook de alternatieve namen beschikbaar blijven in de authority file.

In de entiteit Boek zal bijvoorbeeld de voorkeursnaam van de auteur worden weergegeven, terwijl in de authority file Auteur kan worden teruggevonden onder welke alternatieve namen de auteur bekend is. Bovendien worden in de authority file kenmerken van de auteur vastgelegd die hem onderscheiden van auteurs met dezelfde naam, zoals geboortedatum, overlijdensdatum of een korte omschrijving. Een authority file voor auteurs kan er bijvoorbeeld als volgt uitzien:

In Memorix Maior worden authority files op dezelfde manier getoond als andere entiteiten. Vaak wordt ervoor gekozen een aparte verzameling of verzamelinggroep aan te maken waarin alle authority files worden ondergebracht. Op die manier zijn ze makkelijk te vinden.

Sleutelvelden en Universally Unique Identifiers (UUID’s)

Memorix Maior heeft intern een manier nodig om de ene record te kunnen onderscheiden van de andere. Stel dat u twee auteurs met de naam Mieke Bruintjes in uw collectie heeft, al dan niet opgenomen in een authority file. Memorix Maior moet op eenvoudige en snelle wijze kunnen achterhalen wie nu wie is, zonder daarbij telkens geboortedatums, overlijdensdatums en allerlei omschrijvingen te moeten raadplegen. Hiertoe wordt door Memorix Maior aan elke record automatisch een (doorgaans onzichtbaar) veld toegevoegd met een unieke code. Een dergelijk veld dat garandeert dat een record uniek is, wordt ook wel een sleutelveld genoemd. Sleutelvelden worden ook gebruikt om relaties tussen entiteiten vast te leggen. In Memorix Maior worden de unieke codes in de sleutelvelden automatisch voor u gegenereerd. Deze gegenereerde codes worden ook wel Universally Unique Identifiers (UUID’s) genoemd. Een UUID bestaat uit 36 karakters en kan er bijvoorbeeld als volgt uit zien:

550e8400-e29b-41d4-a716-44665544000

De enige situatie waarin u als gebruiker met UUID’s te maken hebt, is wanneer er voor een bepaald item in uw database geen naam, titel of omschrijving beschikbaar is. In dat geval wordt de unieke UUID op het scherm getoond.