Forschung

Stasiakten werden automatisch rekonstruiert

von Computer Zeitung

10. Mai 2007


Berlin – 17 Jahre nach der Wiedervereinigung hat die elektronische Rekonstruktion von zerrissenen Stasiakten begonnen. Das Fraunhofer-Institut für Produktionsanlagen und Konstruktionstechnik (IPK) will mit einem eigens entwickelten Puzzlesystem in einer zweijährigen Pilotphase Schnipsel aus 400 repräsentativ ausgewählten Papiersäcken zusammensetzen.


 

Nachdem der Haushaltsausschuss des Bundestages für die Entwicklung der auf Algorithmen basierenden Lösung 6,3 Millionen Euro bewilligt hatte, erteilte die Bundesbehörde für die Unterlagen des Staatssicherheitsdienstes der ehemaligen DDR nun den Auftrag für das Pilotprojekt. Insgesamt müssen 600 Millionen Schnipsel aus über 16 000 Säcken zusammengesetzt werden.

Methodisch hat sich das Berliner Fraunhofer-Institut an Bildverarbeitungssystemen orientiert. Proprietäre Software erwies sich jedoch für das Mammutprojekt als nicht brauchbar. In einem ersten Verfahrensschritt werden die Papierfetzen beidseitig digitalisiert. Dazu steckt man sie in Folien, damit sie auf Transportbändern befördert werden können. Diesen Scanprozess mit einem Hochleistungsscanner übernimmt die zu Bertelsmann gehörende Arvato Direct Services. Das Gerät hat einen Durchsatz von mehreren tausend Schnipseln pro Stunde.

Eine spezielle Puzzlesoftware kombiniert zerrissene Stasi-Dokumente: Das System berechnet Merkmale wie Textur und Form – das reduziert den Suchraum. Dann beginnt in der verkleinerten Menge der virtuelle Puzzleprozess. Foto: Fraunhofer/Cao/Kandke

„Das virtuelle Puzzeln folgt der Logik des manuellen Puzzelns“, sagt Bertram Nickolay, Abteilungsleiter am IPK für Sicherheitstechnik. Mensch wie Maschine entscheiden in einer Vorauswahl anhand von Merkmalen wie Form, Farbe und Schrift, ob zwei Teile zueinander passen. „Das System berechnet verschiedene beschreibende Merkmale wie Form oder Textur, um den Suchraum zu reduzieren. Innerhalb dieser kleineren Menge erfolgt die eigentliche Rekonstruktion“, erklärt er. Dafür werden Schnipsel entlang ihrer Konturen auf Übereinstimmungen hin verglichen. Für jedes Merkmal gibt es einen eigenen Algorithmus. Selbst Stempel werden mittels einer solchen Berechnungsvorschrift erkannt. Eine exakte Erkennung von Schrifttypen, wie sie die Kriminalpolizei zur Identifizierung einzelner Schreibmaschinen einsetzt, ist jedoch nicht möglich. „Das würde unsere Rechenkapazität überfordern und zu lange dauern. Die Schnipsel sollen in wenigen Sekunden zugeordnet werden können“ , sagt IPK-Projektleiter Jan Schneider. Sind passende Teile gefunden, werden sie zu einem größeren Dokument zusammengefasst. Etwa 80 bis 90 Prozent der Bruchstücke lassen sich auf diese Weise maschinell zusammenfügen, der Rest muss manuell am Bildschirm nachbearbeitet werden.



Artikel merken bei Bookmark bei: Google Bookmark bei: Twitter Bookmark bei: Mr. Wong Bookmark bei: Del.icio.us Bookmark bei: Digg Bookmark bei: Technorati Bookmark bei: Webnews
 

Seite [1] 2 »

Suche

Direkt zu


Aktuell

January 28, 2012



Mehr Nachrichten
Messeführer zu IT & BUSINESS als ePaper

e-paper


Datenbanken



Zum Artikel

Serie Exzellenz-Cluster




Forschung an deutschen Spitzen-Unis soll noch stärker gefördert werden. Die Computer Zeitung stellt Ihnen IT-relevante Cluster vor.


CZ News



  • IT-Gezwitscher
    Folgen Sie dem Twitter-Feed der CZ und bleiben Sie auf dem Laufenden – wo immer Sie auch sind.

Zum Twitter-Feed

Software Guide



  • Softguide
    Hier finden Sie die richtige betriebliche Standard- und Systemsoftware, Branchensoftware, technische und wiisenschaftliche Software – mit Informationen und Bezugsquellen
Zum Software Guide