David Kriesel beschreibt im unterhaltsamen Vortrag “Traue keinem Scan, den du nicht selbst gefälscht hast!”, den er auf dem 31. Chaos Communication Congress (31C3) gehalten hat, wie er vertauschte Zahlen bei Xerox-Scans entdeckt hat, und wie die Geschichte dann weltweit Aufsehen erregt hat. Der durch Komprimierung verursachte Fehler bestand bereits seit 8 Jahren und betrifft v.a. Zahlen. Ab 41.10 h wird klar, weshalb wichtige Originale immer aufbewahrt werden sollten.
Mehr dazu auf D. Krisels Weblog (via Netbib Weblog).
Für Archiv-Scans gilt (via Archivalia):
“In PDF/A-Dateien dürfen verlustbehaftete Komprimierungen wie zum Beispiel JBIG2 eingesetzt werden. Bei einer Konvertierung von PDF zu PDF/A wird die JBIG2-Komprimierung und ggf. der Substitution-Fehler übernommen. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten und die verschiedenen Quellen, insbesondere die Informatikdienstleister der abliefernden Stellen, zu sensibilisieren.”
Pingback: Explorierbare Corona-Daten | digithek blog