Born-Digital Handling
(MAA 2019)

Peter Bubestinger
(p.bubestinger@av-rd.com)

November 2019

Worum geht’s?

Unendlich +1
Unendlich +1

Datenfehler?

Format nicht lesbar?

Qualität…?

btw: Das war damals die High quality Version
btw: Das war damals die “High quality” Version

Korrekte Darstellung?

Formatmigration

Welche A/V-Formate kommen in’s Haus?

Was macht A/V speziell?

aka The Digital Video Trinity
aka “The Digital Video Trinity”

Einige Formate

Container Video Audio
AVI H.264 PCM
MKV FFV1 MP3
MXF MPEG-4 SP AAC
MOV ProRes FLAC
FLV JPEG2000 Vorbis
WAV/RIFF Dirac Opus

Stolpersteine

…im Produktionszyklus die die Archivierbarkeit beeinflussen?

  • Focus/importance for production/editing is: Filesize, speed and “ease of use”
  • Generation loss through editing and transcoding
  • “Secret sauce” (=proprietary formats, dialects)
  • Loss of (tech)-metadata

Ingest: Datenerfassung

Filesystem Metadaten

  • Dateinamen
  • Filesize
  • Timestamp

Einfach in ein Textfile schreiben.
Maschinenlesbarkeit von Vorteil.

Bit-Proof Kopie?

Hashcodes!

CRC =
4294967295

MD5 =
d41d8cd98f00b204e9800998ecf8427e

SHA256 =
e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855

Hashcode Ebenen A/V

  • Dateiebene
  • Content
    • Stream
    • Frame (“framemd5”)
    • Subframe

A/V Metadaten

  • Formate / Codecs
  • Auflösung / Bittiefe
  • Framerate
  • Subsampling / Farbraum
  • Seitenverhältnis
  • Bitrate
  • Audio Layout

A/V Metadaten: Wozu?

  • Für Erfassung und Dokumentation
  • Entscheidungshilfe weiterer Schritte
  • Spannend: “Auffälligkeiten” früh erkennen
  • Die Significant Properties erhalten

FADGI: Significant Properties for Digital Video

MediaInfo

Default: Easy View
Default: Easy View

MediaInfo

A bisserl mehr: HTML Text View
A bisserl mehr: HTML Text View

MediaInfo

  • Verschiedene Ausgabeformate
    (TXT, XML, JSON, uvm)
  • Einzeln oder automatisiert/integriert
  • GUI oder CLI
  • Cross-Platform

Spreu und Weizen…

MediaConch
MediaConch

MediaConch

MediaConch
MediaConch

MediaConch

  • Übersehen stiller Formatänderungen vermeiden
  • Profile und Erfahrungen mit Anderen austauschen
  • Check: Alles was MediaInfo kennt
  • Einzeln oder automatisiert/integriert
  • GUI oder CLI
  • Cross-Platform

Formateigenschaften für DLZA

  • “Einfachere” (=stabilere) Tech-Eigenschaften:
    • GOP = 1
    • FPS = konstant
    • Übliche Sampleraten
    • Lineare Zahlenwerte (Farbe, Audio, etc)
  • FOSS Implementierung vorhanden
    (= Virtual immortality)

The Eternal Replayer

All-in-One?

Spork
Spork

All-in-One!

Wenger Giant
Wenger Giant

Minimalistic Preserves Well

“As simple as possible &
as complicated as necessary”

Formatnormalisierung

  • Container umpacken
  • A/V Codec konvertieren
  • Spurenreihenfolge ändern
  • Audio nach PCM
  • Originalfile aufbewahren

Container umwandeln

Was bringt’s?
Was kostet’s?

Container umwandeln

Bringt Kostet
* Stabileres Verhalten * Einmal umkopieren
* Frühes Feststellen von Quirks * Möglicher Metadatenverlust
* Weniger Formate
* DLZA Chancen verbessert

Codec umwandeln

Was bringt’s?
Was kostet’s?

Codec umwandeln

Bringt Kostet
* Stabileres Verhalten * Rechenzeit!
* Frühes Feststellen von Quirks * evtl. Generationsverlust
* Weniger Formate * evtl. Speicherplatz
* DLZA Chancen verbessert

Whitelist Konzept

  • Preservable Codec = Whitelist
  • Aufgelistet = 1:1 behalten.
  • Nicht gelistet = konvertieren.
  • Container umpacken: Immer.

Originalfile behalten

…trotz Normalisieren.
Gute Sache. Aber warum?

- Vielen Dank! -

Kommentare? Fragen?

p.bubestinger@av-rd.com

Tools for normalizing/fixing?

FFmpeg or LibAV. You’ll never look back!

Magic spell collection: https://amiaopensource.github.io/ffmprovisr/