Digitales Sammlungsmanagement

(Grundlagen, Kriterien, Show- und Usecases)

Peter Bubestinger-Steindl
(peter @ ArkThis.com)

Juli 2023

“Digitale Assets” verwalten

Sammlungsverwaltungssysteme? Digital?

Let’s map all of this digitally!

Puh. Wo fangen wir an…?

Es ist eine Datenbank mit einer UI und wahrscheinlich Referenzen auf Files. Gedacht um Dinge suchen und organisieren zu können.

Eine Verbindlichkeit.

Sehr ernsthaft langfristig. Drum prüfe, entscheide und konfiguriere weise… 🧙️🌟️

laaange Liste von (70+) Systemen… 😮️

https://bits.ashleyblewer.com/blog/2017/08/09/collection-management-system-collection/

Gekürztes Update (50+)

kb.kulturerbe-digital.at/books/empfehlungen-software/page/vergleich-sammlungsverwaltungssysteme

A kurze Liste

von beliebt-bekannten Open Source Systemen:

Verschiedene DAMs sind verschieden.

  • Für welche Anwendungsfälle war es gedacht?
  • Ordnentliches Medien-Typ-Handling? (image, docs, AV?)
  • Verschiedene Datenschemata parallel?
  • Lokale App vs Browser-basiert?
  • Lizenzmodelle?
  • Setup/maintenance Komplexität?

DAM Kriterien - Beispiele

Basic Features?

  • Mehrsprachigkeit
  • Zugriffsrechte
  • Physische Lagerverwaltung
  • Reporting
  • (Urheberinnen-)Rechte
  • Web-Access

Advanced Handling?

  • Stapel-Bearbeitungen
  • Datenmodell & Metadaten-Schema
  • Archiv-Langzeitspeicher
  • Workflow/Task Management
  • Leihgaben-Verwaltung

Zukunftssicher & Interoperabel?

  • Open Source
  • Import / Export
  • APIs
  • IIIF

Who you gonna call?

  • Bezahlter Support
  • “Community”

Sprache ist wichtig.

For tech: English, please? 😇️

  • Alle Feldbezeichnungen (title / Titel)
  • Alle Tech-Begriffe
  • Dokumentation
  • aber: UI und Feld-Labels übersetzbar

Datum/Uhrzeit Formate

Ein Klassiker. 😜️

Datum/Uhrzeit Formate

Dates Times
January 3rd, 1981 13:37
3. Jänner 1981 13:37:00
1/3/1981 0h13m37s
3.1.1981 123.4
1977-11-23-02

Zeitzonen? Andere Kalendersysteme…?

ISO 8601. 🤩️

  • Datum:
    1981-01-03
  • Datum & Zeit (+TZ):
    1981-01-03T00:12:34+02:00
  • Woche (+Wochentag):
    2022-W46-5
  • Dauer:
    PnYnMnDTnHnMnS

Siehe: (Wikipedia) ISO 8601

Dauer / Periode

  • Unterstützung für “von/bis” in Datumsfeldern?
  • Mit verschiedener, möglicherweise gemischter “Genauigkeit”?
    • “1920-1923”
    • “1920-01 - 1923”

Was ist mit “Fuzzy Dates” …?

  • 1910-01?
  • circa 1800?
  • Bronce age
  • WWII
  • etc.

Oh, eine gemeinsame Syntax wäre gut.

Teilweise Ungefähr Unsicher?

  • ?”: Unsicher
  • ~”: Ungefähr (circa)
  • %”: Beides: Unsicher & ungefähr
  • X”: Unspecified

1981-01?, 20XX, 197X-11?-XX (https://www.loc.gov/standards/datetime/iso-tc154-wg5_n0039_iso_wd_8601-2_2016-02-16.pdf)

Der “Identifier” (ID)

Unbedingt notwendig. Auch bekannt als:

Alle haben einen! 😉️

Beispiele

  • V-00815
  • W/S #00034
  • 38AF2EC1A13494B9DF6FD6E75960307
  • FBW002984
  • 8-717774-330128
  • adBDwKf_aSE
  • Q83697636

PIDs - Persistent Identifiers

Beispiel: NHMW-ZOO-FS50750

“[PIDs] provide [means for offering] a long-lasting click-able link to a digital object.”

(Source: https://tanc-ahrc.github.io/HeritagePIDs/

PIDs - Infos

ID: Anforderungen

  • Eindeutig? Persistent?
  • Stabile Syntax?
  • Wiedererkennbar?
  • Scope?
  • Dateinamen-safe?
  • Druckbar? (QR- oder Barcode-Label)

Kann’s “DAM-IT” umgehen?

  • Auto-generate?
  • Hochzählen?
  • Validieren?
  • Mehr als 1 Syntax?

Übliche Begriffe?

“Des hamma immer scho so g’nannt, also isses klar. Uns.”

  • Person, Firma, Schauspielerin oder: Agent?
  • Aufnahme, Film, Video oder: MovingImage?
  • Aktion, Shooting oder: Event?
  • Author oder: Creator?
  • etc.

Können Begriffe in der UI umbenannt werden?

Kontrolliertes Vokabular

“Controlled vocabulary schemes mandate the use of predefined, authorised terms that have been preselected by the designers of the schemes, in contrast to natural language vocabularies, which have no such restriction.”

Quelle: “Controlled Vocabulary” (Wikipedia)”

Wozu Listen / Taxonomien?

Same-same 😇, but different… 😭

  • 35mm = 35 mm = 35 millimètre
  • dup pos = duplicate positive
  • de = deu = german = German = alemán
  • yuv422p10le = YUV, 4:2:2, 10 bpc
  • Director = Directed by = Regisseur = Regie

Taxonomien handhaben

  • Klare Auswahl/Definition von Begriffen?
  • Standardbegriffe? (e.g. ISO Listen für Sprachen, Länder, Regionen, Fachbegriffe, etc.)
  • (Tastatur)kürzel um Begriffe auszuwählen?
  • Verschachtelte Hierarchien möglich?
  • Begriffe verwalten / ändern / hinzufügen?
  • ID vs Label?

ID *und* Label 💕️

Kann ihr DAM folgendes ordentlich speichern und handhaben?

Identifier(für Maschinen) Label(Für Menschen>) Übersetzungen?
sq, sqi, alb, … Albanian Albanisch(de), Albanais(fr)
de, deu, ger, … German Deutsch(de), Allemand(fr)
und Undetermined …?

Beispiele: ISO 639 (Sprachen), ISO 3166 (Länder),…

Gemeinsame Taxonomien

  • Gleiche Begriffe/Listen können in verschiedenen Systemen/Domänen verwendet werden.
  • Falls möglich, gemeinsame (shared) Listen verwenden.
  • Eigene Listen teilen/veröffentlichen.
  • Im Austausch/Kontakt mit Anderen sein.
  • Bereit sein Kompromisse einzugehen.

Dynamische Taxonomien

Wie geht ihr DAM damit um:

  • Neue Begriffe (spontan) einfügen?
  • Begriffe ändern, die bereits zugewiesen wurden? 😱️
  • Import / Export von Listen?

Gemeinsame Identifier

Falls Sie nicht die einzige sind, die auf … verweist:

Wäre es dann nicht sinnvoll einen gemeinsamen, öffentlich zugänglichen Identifier zu haben?

Mehrfache IDs handhaben?

zB: Als Attribut zu deklarieren um “welche” ID es sich handelt:

<id schema="dnb"> ... </id>
<id schema="efg"> ... </id>
<id schema="wikidata"> Q84199 </id>

Wikidata

WikiData Logo

“[…] is a free and open knowledge base that can be read and edited by both humans and machines.”

Beispiele: Earth (Q2) vs Earth (Q83697636)

Datenstruktur ist relevant.

“klassischer” Katalog = flach, Tabellen/Zellen-Denken.

Beispiel: elgrito.witness.org

Relationships

  • Forward: Agent1 ist Elternteil von Agent2
  • Reverse: Agent2 ist Kind von Agent1

Relationships beschreiben

  • Für welche Zeitperiode war die Relation gültig? (Agent “ist verheiratet” mit Agent)

  • Noch etwas, dass Sie gerne anmerken würden?

Relationships: Abfragen?

(Wie gut) kann ihr System Relationship-Details handhaben/suchen?

  • In welche Werken war Agent unter dem Alias … mitwirkend als …?
  • Liste alle … die in Beziehung zu … stehen, sortiert nach …?

Mehr als nur 1 Standard/Schema?

Super! Was machen wir jetzt mit “film-related” Material? 🤨️ (Poster, Dokumente, etc)

Import / Export

Import / Export: Überlegungen

  • (Nested) Listen & Vokabulare?
  • Link zwischen Katalogdaten (DB) & Files? (Storage)
  • Programmier(sprachenkenntnisse) benötigt?
  • Value/Term/Schema Mapping Optionen?
  • Metadata-Layout (Schema) valide?

Referenz zwischen Katalog und Files

  • Wie wird die Verknüpfung zwischen Katalogeinträgen und Dateien hergestellt (+vice versa)?
  • Wie (un)abhängig vom Katalog können Dateien benutzt/geändert werden?

Dateinamen & Ordnerstruktur

  • Viele DAMs vergeben diese automatisch.
  • Auf nicht-menschlich lesbare Art (UUIDs).
  • Welches Level an Kontrolle benötigen Sie hier?
  • Gibt es externe Workflows die auf die Dateien zugreifen?

Files intakt, aber DAM kaputt?

If your files have PIDs, you’re lucky!

Zugriff & Kontrolle

APIs: Wozu?

Zugriff & Austausch Ihrer Daten…

  • … mit anderen Institutionen.
  • … mit externen Tools.
  • … für Backup/Migration.
  • … um was völlig Anderes damit zu machen.
  • etc.

APIs: Wozu noch?

Fernsteuern!

  • Gemeinsames Backend + verschiedene UIs.
  • Workflows/Aktionen extern automatisieren.
  • etc.
  • Und: Einfach (mehr) zukunftssicher. 😎️ 🤓️

“Does it scale?”

Bitte mit erfahrenen Tech-Leuten besprechen.

  • Geschwindigkeit? (search, retrieve, data, files, etc)
  • Cache & Tuning Optionen?
  • Mehrere Instanzen synchronisieren?
  • Laufender Import/Export? (in-house, extern)
  • Lizenzbedingungen und Auswirkungen?
  • Mehrere Datenschemata parallel?
  • Mehrsprachigkeit?
  • Migration auf ein “besser skalierendes” System (falls notwendig)?

Ham’s Plugins?

  • Erfahrungsgemäßg ist ein “All-in-One” monolithisches System starr und aufwendig zu erhalten.
  • Bevorzugt: Schlanker Kern + zusätzliche Features als Plugins/Module.
  • Notwendig: Plugin-Interfaces offen & dokumentiert.

Ham’s Support?

  • Wen kann man (an)rufen im Falle von …?
  • Möglichkeit(en) “Ihren Mechaniker” zu wechseln?
  • Zu welchen Bedingungen?
  • Supportverträge?
  • Welche Lizenzmodelle?
  • Ihr Personal schulen?
  • Ordentliche Dokumentation?

Hat sich gut bewährt:

  • Zugriff auf eine Demoinstallation (lokal oder online).
  • Versuchen Sie Listen/Vocs zu importieren / exportieren.
  • Testen Sie Import/Export/UI-Feel mit Ihren Daten (Layout). (Bevor Sie bindende Entscheidungen treffen)
  • Katalog- & Technikleute zusammenbringen.
  • Hilfe von Expertinnen (des Systems/Anwendungsfälle Ihrer Wahl) einholen.
  • So einfach wie möglich, so kompliziert wie notwendig.

Und ja: Bitte Folgendes einplanen…

  • Backups?
  • Failover System?
  • Supportverträge?
  • Migrationsanforderungen-und-Hürden bekannt?

- Ende -

Fragen?

Kommentare?

info@kulturerbe-digital.at

Peter Bubestinger-Steindl
peter @ ArkThis.com

Oh, btw: “Says who?”

  • Declare information sources?
  • At which level? (record? field?)
  • Who edited which field when and why?
  • Could a source be “linked”? (as relationship)
  • What if you have ≥ 1 sources?

Oh, there’s a typo…

  • Should we correct it?
  • Is it even a typo, or was it proper “back then”?
  • Can we keep multiple “versions”?
  • (Where) can we document that? (commit msg)