![]() |
| ![]() |
Datenreise: PKZ der DDREin guter Freund empfahl mir kürzlich, mich doch einmal mit der PKZ (Personenkennzahl) der verblichenen DDR auseinanderzusetzen. Nun, da gäbe es im Netz... Schaun wir mal. von: Henri C. Bis dato hatte ich mich mit solcher Thematik eher am Rande befasst. Mir seien darob einige einleitenden Überlegungen gestattet, bevor ich mich den Eigentümlichkeiten der DDR-PKZ widme. Kennziffern wie Telefonnummern, Kontonummern, Artikelnummern etc. sind Zeichenfolgen. Sie sollen einen Telefonanschluss, ein Konto, einen Artikel etc., also ein Objekt oder eine Person eineindeutig kennzeichnen, bezeichnen. Eineindeutig meint, daß die Zuordnung in beiden Richtungen eindeutig ist. Zu einem Objekt gibt es genau eine Kennziffer und eine Kennziffer betrifft genau ein Objekt. Aufbau und Struktur von kennzeichnenden Zeichenfolgen folgen nun nicht nur der Prämisse der Eindeutigkeit. Diverse Kriterien werden je nach Aufgabenstelfung berücksichtigt. Darunter: 1.) Darstellungsökonomie und DatenraumZiffern können mit einem Zeichen 10 verschiedene Zustände darstellen (von 0 bis 9) Buchstaben können mit einem Zeichen 26 verschiedene Zustände darstellen (von A bis Z) ASCII-Zeichen können 256 Zustände darstellen (je nach Norm) Je grösser der Datenraum eines Zeichens, desto kürzer kann die Zeichenfolge sein. 2.) VerarbeitungsökonomieWährend des Cyberpaläolithikums (ante DOS) beherrschte Knappheit alle Überlegungen. Speicherplatz war knapp, Rechenkapazität war knapp. Besonders in EDV-befreiten Regionen. Grossen Aufwand (für damalige Verhältnisse) erforderte das Umformatieren von Buchstaben in Zahlen. Das lässt sich vermeiden, wenn von vornherein nur Zahlen verwendet werden. 3.) MerkbarkeitZeichenfolgen werden nicht nur mit dem Computer verarbeitet; Mensch muss sie eingeben, auf Plausibilität prüfen und sie sich gelegentlich merken. Gerne benutzt man deshalb "sprechende" Abbildungsverfahren wie geläufige Abkürzungen etc. Generell kann unter "sprechend" jedes Abbildungsverfahren verstanden werden, dessen Verschlüsselung einfach und allgemein zugänglich ist. Dem gegenüber stehen die anonymen Verfahren, deren Codierung geheim oder rein zufällig sind. 4.) SkalierbarkeitAufbau und Einrichtung eines Kennzeichnungssystems erfordert großen Aufwand und dauert. Das lohnt nur, wenn das System hinreichend lange in Gebrauch bleibt. Die Konstrukteure werden also zukünftigen Dateninput einkalkulieren. HistorischesBeschlossen 1969, eingeführt am 01.01.1970 sollte die PKZ zur flächendeckenden Erfassung und Kontrolle der DDR-Bürger dienen. Aber erst 1984 erreichte die damit beauftragte Behoerde, die Zentrale Personen-Datenbank in Berlin-Biesdorf die volle Funktionsfähigkeit. Aufbau und StrukturDie im Netz von mir gefundenen Informationen und Hinweise zur DDR-PKZ sind in Details nicht einheitlich, insbesondere was die 11. Ziffer und den Prüfalgorithmus betrifft. Ich habe mich jeweils für die plausibelste und mir glaubhafteste Version entschieden. Eine Garantie für historische Wahrheit gibt das aber nicht. Die Personenkennzahl der DDR besteht aus 12 Ziffern. Die ersten 6 Ziffern bezeichnen den Geburtstag formatiert wie folgt: TT MM JJ (Tag, Monat und Jahr jeweils zweistellig; Jahresangabe unter Wegfall des Jahrhunderts). Die 7. Ziffer bezeichnet das Geschlecht und das Jahrhundert der Geburt: 2 bedeutet männlich/19. Jahrhundert 3 bedeutet weiblich/19. Jahrhundert 4 bedeutet männlich/20. Jahrhundert 5 bedeutet weiblich/20. Jahrhundert Die 8. bis 10. Ziffer bezeichnet die Meldestelle bzw. das Melderegister. Dort waren die zugehörigen hardcopies gesammelt; diese Dienststelle vergab auch die PKZ. Angeblich kamen zur Bezeichnung der Meldestelle nur Zahlen von 001 bis 320 zum Einsatz. Die 11. Ziffer war eine laufende Nummer. Sie diente zur Unterscheidung derer, die in den ersten 10 Ziffern übereinstimmen. Auch diese laufende Nummer wurde von der Meldestelle vergeben. Dabei gibt es eine Besonderheit; siehe weiter unten. Die 12. Ziffer ist eine Prüfziffer zur Plausibilitätskontrolle. Mit der DDR-PKZ haben wir also ein bis zur 10. Ziffer sprechendes Kennzeichen. Nur die 11. und 12. Ziffer sind anonym. PrüfzifferPrüfziffern sollen der Datensicherheit dienen. Hoert sich toll an, aber was heilßt das konkret? Unter Datensicherheit wird hierbei hauptsächlich Übermittlungssicherheit verstanden. Das betrifft vor allem Eingabefehler, wobei eine oder mehrere Ziffern falsch gelesen oder eingegeben werden. Auch systematische Ubertragungsfehler, bei deren Auftreten alle übertragenen Ziffern mit einem konstanten Faktor variiert werden, gehoeren dazu. Bei nicht korrekter Prüfziffer muss die Eingabe/ die Ubermittlung wiederholt werden. Eine Prüfziffer übernimmt damit die Funktion einer Protokollnotiz, wie sie ähnlich heute im Datenverkehr üblich ist. Mehr an "Datensicherheit" ist nicht drin, deshalb spricht man auch besser von Plausibilitätskontrolle. Schuld daran hat der geringe Umfang des Datenraumes, den eine Prüfziffer einnehmen kann. In etwa entspricht das einem pin mit einer Stelle, einer Art Kindersicherung also. Die Berechnung der Prüfziffer m der PKZ erfolgt nach folgendem Algorithmus: PKZ:a b c d e f g h i k / m 1.) 4a + 2b + c + 6d + 3e + 7f + 9g + 10h + 5I + 8k + 4l = x 2.) x:11 = n; Rest=y 3.) 5y + 5 = z 4.) z:11 = p; Rest = m ist die Prüfziffer Nachdem die Prüfziffer so ermittelt worden ist, wird sie mit dem Faktor 2 multipliziert (mit dem Gewicht 2 beschwert wie es auch heißt) und damit die Formel 1.) ergänzt. Dann wird ähnlich wie zuvor verfahren: 1.) 4a + 2b + c + 6d + 3e + 7f + 9g + 10h + 5i + 8k + 4l + 2m = x 2.) x:11 = n; Rest=10 bei richtiger Prüfziffer Nun kommt die Überraschung: Ergab die Prüfung einen anderen Rest als 10 (etwa 0), hatte die vergebende Meldestelle eine andere laufende Nummer in der 11. Stelle (entspricht Buchstabe I in den Formeln) zu wählen. OK, ich weiss sehr trockener Stoff, fast Essig. - Mut machen: Der zur Anwendung gelangte mathematische Apparat liegt ja nun durchaus im fussläufigen Bereich. Nix Wurzel, nicht mal Quadrate, geschweige den Kommata, keine negativen, nur natürliche Zahlen! Na, das kriegen wir doch hin. Also wozu soll das nun dienen? Beschränken wir uns erstmal auf den Prüfalgorithmus: Der erste Schritt ergibt eine relativ große Zahl, die mit dem zweiten Schritt wieder auf eine relativ kleine Zahl zurückgeführt wird. Das ist auch zwingend, denn im Ergebnis wollen wir wieder eine einstellige Zahl, eine Ziffer erhalten. Während des "Aufblähens" werden eine Reihe von Faktoren gebraucht (die "Gewichte"). Beim Reduzieren findet ein Teiler, hier die 11 Verwendung. Dem geneigten Betrachter fällt zweierlei auf. Nach Faktorenzerlegung liegt das kleinste gemeinsame Vielfache der Gewichte und des Teilers mit 27720 weit über dem für x zu erwartenden Wert, der unter 400 liegen dürfte. Das heißt für den Datenraum von x gibt es keinen gemeinsamen Teiler für das Aufbläh- und Reduzierverfahren. Genau das ist der Sinn der Übung, denn nur so lässt sich ein triviaies Rückrechnen des Algorithmus vermeiden. Zum zweiten: Das Restwertverfahren bei Gebrauch des Teilers 11 hinterlässt uns erstmal etwas ratlos, generiert es doch 11 verschiedene Werte (von 0 bis 10). Eine Abbildung dieses Datenraumes auf eine Ziffer wäre nun nicht mehr trivial. Die Konstrukteure des Algorithmus wählten nun einen sehr osteuropäisch anmutenden Weg: Was nicht passt wird passend gemacht! Knirscht zwar, aber funktioniert. Eine durchaus robuste Methode und äusserst praxisnah. Und garantiert nicht rückrechenbar! EigenschaftenNach Aufbau und Struktur kennzeichnet die DDR-PKZ tatsächlich eindeutig Personen und nicht etwa nur Ausweise o.A.. Diese Kennzeichnung bedient sich zwar weitgehend "sprechender" Anteile, verzichtet aber vollständig auf die Verwendung des Namens oder Vornamens der zu kennzeichnenden Person. Mag das auch überwiegend der Verarbeitungsoekonomie geschuldet sein, kam es der Sozialismustypischen Geheimniskrämerei/ Paranoia sehr entgegen. Die Kopplung der PKZ mit dem Namen der Person erfolgte offenbar nur einmal, an einer Stelle, nämlich in der Pappkartei der vergebenden Meldestelle. Das war das Original, die ZPDB (Zentrale Personen- Datenbank Berlin-Biesdorf) nahm in ihren files im Sinne einer Kopie nur Bezug darauf. Die DDR-PKZ wurde vermutlich - nach Etablierung des Systems - schon kurz nach der Geburt zugeteilt. Bisher (das wird dank Schily sicher so nicht bleiben) begann die Datenkarriere eines unbescholtenen (was immer das auch meint) Bundesbürgers erst mit der Ausstellung des Personalausweises (16. Lebensjahr) oder anlässlich der ersten sozialversicherungspflichtigen Beschäftigung. Damit liegen ausreichend Informationen über die Struktur und den Aufbau der PKZ vor, dass ich mich an die Beantwortung einiger Fragen wage. Reichte der Datenraum der 11. Ziffer überhaupt aus?Die 11. Ziffer dient zur Unterscheidung zwischen denjenigen, die in den vorangehenden Stellen übereinstimmende PKZs haben. Auf Grund des gewählten Prüfverfahrens stehen worst case nur 9 2iffern zur Verfügung. Die in's Auge gefasste Geburtenrate dürfte 30 Geburten pro 1000 Einwohnern und Jahr wohl kaum überstiegen haben (die tatsächliche Rate blieb meist darunter). Angenommen, die Geburten verteilen sich gleichmässig über's Jahr und die Meldestellen verwalten jeweils annähernd gleich viele Bürger, so rechne ich mal blauäugig hoch. Bei 17 Millionen Bürgern würde danach pro Meldestelle und Tag rund 4,4 Neuzugänge zu erwarten sein. Grob passt das. Vorsicht! Einige Parameter dieser Betrachtung streuten vermutlich stark. Das wird dann zum Problem, wenn Maximalwerte kumulieren. Aber genau das dürfte eingetreten sein. Plattenbausiedlungen hatten in der Aufbauphase oft nur junge Familien als Bewohner. Hier wurde es vielleicht schon eng. (Gar nicht auszudenken wenn in einem derartigen Wohngebiet dann auch noch Vollmond, Lohntütenball, Foehn und Parteitagsberichterstattung im DFF zusammenfielen). Fazit: In der Regel wird der Datenraum der 11. Ziffer sicher augereicht haben. Für nicht ausschließbare Spitzenwerte jedoch wäre mir das zu knapp. Ich wage nun noch eine Annahme: Bei den Konstrukteuren des Verfahrens haben wir es mit deutsch-gründlichen pedantischen Beamtenseelen zu tun. Dieser Wert dürfte nicht gestreut haben. Von solchen Charakteren Geschaffenes ist in der Regel schußfest, vandalensicher, überschwemmungsresistent und für die nächsten 500 Jahre angelegt (mindestens). Also bleibt ein dickes Fragezeichen! Wäre die PKZ-Struktur Y2K-compatibel?In ihrer oben beschriebenen Struktur endet der Datenraum der PKZ am 31.12.1999. Die 7. Ziffer hat jedoch noch Luft. Denkbar wäre eine 6 für männlich und eine 7 für weibliche Geborene des 21. Jahrhunderts. Konnte die PKZ manipuliert (gefälscht) werden?Als die DDR dem Politbüro noch nicht abhandengekommen war, gab es ein Sicherungsinstrument, an dem fast alle denkbaren Manipulationsversuche scheitern mussten: Die Zentrale Personen-Datenbank. Angenommen, man hätte eine in sich schlüssige PKZ erfunden. Im Falle einer Kontrolle hätte die ZPDB entweder rückgemeldet, daß diese PKZ gar nicht vergeben wurde oder den Namen der Person, der sie rechtmässig zugeordnet war. Der letztere Fall wäre der wahrscheinlichere gewesen. (s.o. betr. 11. Ziffer) Seitdem die ZPDB nicht mehr existiert oder im Zugriff ist, stellt sich die Situation anders da. Manches liegt nahe und vieles lässt sich denken. An dieser Stelle moechte ich aber nur einen Teilaspekt beleuchten, nämlich: Koennen zur Verschleierung der Identität einzelne Bestandteile der PKZ variiert werden, ohne daß die anderen Teile der PKZ einschliesslich der Prüfziffer verändert werden? Ich nehme mir die Gleichung 1.) in ihrer zweiten Ausfertigung (mit Prüfziffer) vor. Eine erste Idee geht dahin, zwei oder mehrere Variablen auf der linken Seite derart zu variieren, daß die Zwischensumme x unverändert bleibt. Das führt zu einem System linearer Gleichungen, bei dem sich sicherlich einzelne Loesungen isolieren lassen. Mein Instinkt sagt mir dennoch, daß da noch mehr moeglich ist. Im späteren Verlauf des Algorithmus wird die Zwischensumme x durch 11 geteilt; und nur mit dem ganzzahligen Rest wird weiter verfahren. Dieser Rest bleibt nun auch dann unverändert, wenn zu x beliebige ganzzahlige Vielfache von 11 (also 11, 22, 33, etc.) addiert werden. Was für x gilt, gilt auch für die andere Seite der Gleichung und dort natürlich auch für Teilsummen oder einzelne Variablen. Analog bietet sich an, in einer Art Umkehrschluß das Augenmerk direkt auf den Teilerrest zu richten. Ich behaupte mal frech, solange der ganzzahlige Rest nach Teilung durch 11 von einer Gruppe von Variablen erhalten bleibt, obwohl diese selbst variiert werden, bleibt es auch bei der setben Prüfziffer. Wer unbedingt moechte, sei hiermit eingeladen dieses explizit zu beweisen. Ich habe mich darauf beschränkt das an Hand einer kleinen Tabellenkalkulation zu überprüfen. Die eingangs gestellte Frage kann ich uneingeschränkt bejahen. Umwege erhöhen die Ortskenntnis: etwas zur Historie: streng geheim!: let's calculate: "Volkes Stimme": die hier und nicht in Wall Street?: "Zahlungsverkehr "Prüfzifferberechnung (hier gibt's ne hübsche pdf-Datei; siehe Methode 52) Keine Haftung für externe links! |
![]() |
| ![]() |