Im Auge der Polizei
Polizeiliche Gesichtserkennung im öffentlichen Raum
1. Videoüberwachung und Gesichtserkennung
Videoüberwachung im öffentlichen Raum ist mit einem Sicherheitsversprechen verbunden: Sie soll einen Beitrag zur Verhinderung und Verfolgung von Straftaten leisten und das Sicherheitsgefühl der Bevölkerung stärken. Ob diese Ziele erreicht werden, ist umstritten. Während einige Stimmen in der Videoüberwachung ein sinnvolles Instrument zur Bekämpfung von Straftaten erblicken, wird sie von anderen als Mittel zur Inszenierung von Sicherheit sowie als Meilenstein auf dem Weg in den Überwachungsstaat verstanden. Ihrer weiten Verbreitung hat dies bisher jedenfalls keinen Abbruch getan.
Aufgrund des technischen Fortschritts ist es inzwischen möglich, Videoüberwachung mit biometrischer Gesichtserkennung zu verbinden, um Menschen anhand ihres Gesichts automatisiert zu erkennen. Dafür werden in den Videoaufnahmen Gesichter detektiert und mit vorab hinterlegten Referenzaufnahmen verglichen, woraufhin das Maß an Übereinstimmung errechnet wird. Je nach Einsatzsituation können dabei erhebliche Fehlerraten auftreten.
Diese Weiterentwicklung ist ebenfalls Gegenstand zahlreicher Kontroversen. Etwa wird von der Zivilgesellschaftlichen Initiative für ein Verbot biometrischer Massenüberwachung ein Verbot bestimmter biometrischer Überwachungsmaßnahmen gefordert. Andererseits hat sich bei einer Umfrage des Meinungsforschungsinstituts YouGov im Jahr 2019 die Hälfte der Befragten dafür ausgesprochen, den behördlichen Einsatz von Videoüberwachung mit Gesichtserkennung unter strengen Auflagen zu gestatten. Lediglich 22 % der Befragten lehnten dies ab.
Aus rechtlicher Sicht ist von zentraler Bedeutung, dass der polizeiliche Einsatz von Gesichtserkennung in Verbindung mit Videoüberwachung in Grundrechte eingreift. Dies bedeutet nicht, dass er von vornherein unzulässig ist; es bedarf aber eines wichtigen Grundes, ihn zu rechtfertigen. Ein solch wichtiger Grund kann die Verhinderung und Verfolgung von Straftaten sein. Andererseits ist das Gewicht des Grundrechtseingriffs zu berücksichtigen, das je nach Einsatzszenario – dazu sogleich – sehr unterschiedlich ausfallen kann. Folglich sind einige Formen polizeilicher Gesichtserkennung deutlich schwerer zu rechtfertigen als andere. Hier einen angemessenen Ausgleich zu schaffen, ist Aufgabe des demokratisch legitimierten Gesetzgebers.
2. Einsatzszenarien
Das technisch und rechtlich anspruchsvollste Szenario1) für den Einsatz polizeilicher Gesichtserkennung in Verbindung mit Videoüberwachung ist die Personenfahndung im öffentlichen Raum. In dem überwachten Bereich (z.B. einem Bahnhof oder Marktplatz) werden die Gesichter aller Person von dort installierten Videokameras erfasst und „live“ mit einem hinterlegten Fahndungsbestand abgeglichen. An einen Treffer (d.h. eine errechnete Übereinstimmung) können sich weitere Folgemaßnahmen (z.B. Festnahme der gesuchten Person) anschließen. Ein solches Vorgehen wurde in Deutschland bereits am Hauptbahnhof Mainz (2006 bis 2007) und am Bahnhof Berlin Südkreuz (2017 bis 2018) getestet. Die Bundespolizei kam nach Abschluss des Tests in Berlin zu der Einschätzung, dass Gesichtserkennung als „Unterstützungsinstrument für die polizeiliche Fahndung“ einen „wertvollen Beitrag“ zur Steigerung von Sicherheit leisten kann. Der Chaos Computer Club sprach hingegen von einem „Debakel“. Ein Regelbetrieb findet in Deutschland derzeit (noch) nicht statt. Bereits zum Einsatz kommt indes automatisierte Kfz-Kennzeichenerkennung (z.B. § 14a HSOG, § 163g StPO), die im öffentlichen Verkehrsraum eine vergleichbare Funktion übernehmen kann (nur dass eben nicht nach Gesichtern, sondern nach Kennzeichen gesucht wird). Die Kennzeichenerkennung wurde bereits mehrmals zum Gegenstand von Entscheidungen des Bundesverfassungsgerichts.
Das zweite Szenario kann als die anlassbezogene Suche in Lichtbilddatenbanken beschrieben werden. Hierzu wird im Rahmen eines Ermittlungsverfahrens oder zur Gefahrenabwehr ein Lichtbild (z.B. ein aus einer Videoaufzeichnung extrahiertes Lichtbild einer tatverdächtigen Person) mit den in einer erkennungsdienstlichen Datenbank befindlichen Aufnahmen abgeglichen, um die Identität der betroffenen Person zu ermitteln. Dies wird beim Bundeskriminalamt (und den Landeskriminalämtern) bereits praktiziert und entspricht funktional der Suche nach einem Fingerabdruck im polizeilichen AFIS. Im Unterschied zum ersten Szenario findet kein „live“ durchgeführter Massenabgleich statt, sondern es werden im Nachhinein einzelne Aufnahmen bestimmter Personen aus konkretem Anlass für die Erkennung herangezogen.
Als drittes Szenario ist der Einsatz von Gesichtserkennung als Hilfsmittel zur Unterstützung von Polizeibeamten bei der Sichtung von Videomassendaten zu nennen. Ein einfach scheinender, aus Zeitersparnisgründen aber durchaus relevanter Fall, ist die bloße Personendetektion durch das Auffinden von Gesichtern in umfangreichen Videoaufzeichnungen. Zudem können von den auswertenden Polizeibeamten einzelne Personen markiert werden, um festzustellen, ob diese Personen noch an anderen Stellen in den Videoaufzeichnungen auftreten. Schließlich ist es möglich, in den Videoaufzeichnungen nach bestimmten Person zu suchen, von denen ein Lichtbild verfügbar ist. Gesichtserkennung als Hilfsmittel zur Auswertung umfangreicher Videoaufzeichnungen kam in Deutschland (soweit ersichtlich) erstmals im Nachgang der Ausschreitungen während des G20-Gipfels in Hamburg zum Einsatz. Eine dagegen gerichtet Anordnung des Hamburgischen Beauftragten für Datenschutz wurde erstinstanzlich vom Verwaltungsgericht Hamburg aufgehoben.
3. Rechtsfragen beim polizeilichen Einsatz
Fraglich ist, wie diese verschiedenen Szenarien rechtlich zu behandeln sind. Im Folgenden wird zuvorderst auf einige verfassungsrechtliche Fragen eingegangen.
Grundrechtseingriff
Das vom Bundesverfassungsgericht aus Art. 2 Abs. 1 i.V.m. Art. 1 Abs. 1 GG abgeleitete Grundrecht auf informationelle Selbstbestimmung schützt – auch im öffentlichen Raum – die Befugnis des Einzelnen, grundsätzlich selbst über die Preisgabe und Verwendung seiner personenbezogenen Daten zu entscheiden (ebenfalls Art. 7 und 8 GRCh sowie Art. 8 EMRK).2) Ein Eingriff in dieses Grundrecht liegt vor, wenn Personen durch Videoüberwachung identifizierbar aufgenommen werden. Werden die Aufnahmen mittels Gesichtserkennung zur Gewinnung zusätzlicher Informationen mit anderen Aufnahmen abgeglichen, geht damit ein weiterer Grundrechtseingriff einher. Mithin wird bei allen drei Szenarien in Grundrechte eingegriffen.
Bedeutung des Eingriffsgewichts
Staatliche Grundrechtseingriffe bedürfen einer gesetzlichen Grundlage (Vorbehalt des Gesetzes). Das Rechtsstaats- und das Demokratieprinzip sowie die Grundrechte selbst verlangen dabei, dass entsprechende Regelungen so bestimmt formuliert sind, dass der Exekutive Grenzen gezogen werden und die Bürger erkennen können, „bei welchen Anlässen und unter welchen Voraussetzungen ein Verhalten mit dem Risiko der Überwachung verbunden ist“. Zudem müssen sie dem Grundsatz der Verhältnismäßigkeit entsprechen; es darf also nicht mit Kanonen auf Spatzen geschossen werden. Je schwerer der Grundrechtseingriff, desto höher sind die Anforderungen an die Bestimmtheit und Verhältnismäßigkeit einer gesetzlichen Eingriffsgrundlage. Gerade bei schwerwiegenden Grundrechtseingriffen bedarf es sehr spezifisch gefasster Vorschriften, die dem Schutz hochrangiger Rechtsgüter dienen.
Zur Beurteilung des Eingriffsgewichts hat das Bundesverfassungsgericht in einer Reihe von Entscheidungen zu technikgestützten Überwachungsmaßnahmen ein festes Set von Kriterien entwickelt. Das Eingriffsgewicht wird demnach „insbesondere von der Art der erfassten Informationen, dem Anlass und den Umständen ihrer Erhebung, dem betroffenen Personenkreis und der Art der möglichen Verwertung der Daten beeinflusst“. Bedeutsam ist, wie viele Grundrechtsträger betroffen sind („Streubreite“) und ob sie hierfür einen Anlass gegeben haben. Die Aussagekraft und die Persönlichkeitsrelevanz der Daten sind ebenfalls von Belang. Ein heimliches Vorgehen erhöht das Eingriffsgewicht zusätzlich, während es gesenkt wird, wenn die Betroffenen nicht identifiziert werden.
Unterschiede zwischen den Einsatzszenarien
Bereits die konventionelle Videoüberwachung des öffentlichen Raums ruft erhebliche Grundrechtseingriffe hervor, da regelmäßig zahlreiche Personen erfasst werden, die hierfür keinen Anlass (z.B. durch Begehung einer Straftat) gegeben haben. Außerdem sind Videoaufzeichnungen vielfältig auswertbar. Der Einsatz von Gesichtserkennung zur Personenfahndung im öffentlichen Raum (Szenario 1) vertieft das Gewicht zusätzlich, da mit dem Gesicht ein Merkmal von großer Persönlichkeitsrelevanz gezielt erfasst und ausgewertet wird. Im Trefferfall kann die Festnahme der erkannten Person veranlasst werden. Treffermeldungen können aber auch über einen längeren Zeitraum zusammengetragen und zu Bewegungsprofilen verdichtet werden, was Rückschlüsse auf das Verhalten einer Person erlaubt (z.B. Besuch politischer, sportlicher oder kultureller Veranstaltungen). Dies kann automatisiert und heimlich geschehen, ohne dass der Betroffene das Ausmaß der Datenverarbeitung zu überblicken und sich dagegen gerichtlich zu wehren vermag. Dies steigert das Eingriffsgewicht zusätzlich. Auch ist das Risiko von Fehlerkennungen zu berücksichtigen, was Maßnahmen gegen unbeteiligte oder unschuldige Personen nach sich ziehen kann. Insgesamt geht der Einsatz von Gesichtserkennung im ersten Szenario mit überaus erheblichen Grundrechtseingriffen einher.
Hingegen ist das Eingriffsgewicht in den beiden anderen Szenarien regelmäßig (deutlich) geringer, da hier nur einzelne Personen aus konkretem Anlass in den Abgleich einbezogen (Szenario 2) oder große Mengen an Videodaten nur aus konkretem Anlass gesichtet werden (Szenario 3; z.B. nach gewalttätigen Ausschreitungen). Zudem ist eine menschliche Kontrolle der Ergebnisse zur Korrektur von Fehlerkennungen in der Regel unproblematisch möglich, was im ersten Szenario, insbesondere bei Eilbedürftigkeit, weil die gesuchte Person andernfalls zu entkommen droht, nicht immer der Fall sein wird.
Anforderungen an die Rechtmäßigkeit
Die sich hieran anschließenden Rechtsfragen lassen sich beispielhaft an § 100h Abs. 1 Nr. 1 StPO sowie Art. 33 Abs. 2 und 3 BayPAG verdeutlichen. Nach den genannten Vorschriften dürfen ohne Wissen der Betroffenen außerhalb von Wohnungen „Bildaufnahmen hergestellt“ (§ 100h Abs. 1 Nr. 1 StPO) beziehungsweise an bestimmten (öffentlichen) Orten „offen Bild- und Tonaufnahmen oder ‑aufzeichnungen von Personen“ angefertigt (Art. 33 Abs. 2 und 3 BayPAG) werden. Obwohl es die Vorschriften nicht ausdrücklich erwähnen, besteht doch kein Zweifel daran, dass hierdurch auch die menschliche Sichtung der angefertigten Aufnahmen an einem Monitor erlaubt wird. Aufgrund des vergleichsweise geringe Eingriffsgewichts spricht dann aber viel dafür, dass dabei zur Unterstützung (Szenario 3) auch Gesichtserkennung genutzt werden darf.
Schon der Abgleich mit erkennungsdienstlichen Datenbanken (Szenario 2) kann jedoch nicht mehr auf die genannten Normen gestützt werden, da ein „Herstellen“ oder „Anfertigen“ etwas anderes ist, als der Abgleich mit großen Datensammlungen. Zu diesem Zweck existieren aber mit § 98c StPO und Art. 61 BayPAG allgemeine Vorschriften, die den (maschinellen bzw. automatisierten) Abgleich mit anderen gespeicherten Daten zulassen. Diese Normen werfen ihrerseits Probleme auf (z.B. das Fehlen echter Eingriffsschwellen), können aber zumindest im Grundsatz für derartige Abgleiche herangezogen werden.3) Gänzlich außerhalb der Reichweite von § 100h Abs. 1 Nr. 1 StPO sowie Art. 33 Abs. 2 und 3 BayPAG liegt der Einsatz der Gesichtserkennung zur Personenfahndung im öffentlichen Raum (Szenario 1). Dessen Eingriffsgewicht ist so schwerwiegend, dass spezifische Rechtsgrundlagen mit Eingriffsschwellen und verfahrensrechtlichen Absicherungen erforderlich sind, die weit über die genannten Vorschriften hinausgehen und die es in Deutschland derzeit schlicht nicht gibt.
Sollte der Gesetzgeber in Zukunft eine Rechtsgrundlage für die biometrische Gesichtserkennung zur Personenfahndung im öffentlichen Raum anstreben, müsste diese sehr hohen Bestimmtheits- und Verhältnismäßigkeitsanforderungen genügen. Dabei wären die Eingriffsschwellen und die Vorkehrungen zur Einhegung des Eingriffs deutlich strikter als bei der automatisierten Kfz-Kennzeichenerkennung zu fassen (z.B. § 14a HSOG, § 163g StPO), da das Eingriffsgewicht der Gesichtserkennung unter anderem wegen der großen Persönlichkeitsrelevanz des Gesichts deutlich höher ist. Ein flächendeckender Einsatz der Gesichtserkennung wäre auf jeden Fall auszuschließen. Auch wären Schutzvorkehrungen wie etwa ein Richtervorbehalt vorzusehen. Um die Verhältnismäßigkeit sicherzustellen, dürfte der Einsatz nur erlaubt werden, um Rechtsgüter von erheblichem Gewicht (z.B. Leib und Leben) zu schützen beziehungsweise schwere Straftaten zu verfolgen. Dann aber wäre es nicht von vornherein ausgeschlossen, eine verfassungsgemäße Rechtsgrundlage für den Einsatz von Gesichtserkennung zur Personenfahndung im öffentlichen Raum zu schaffen, denn es kommt nicht nur den Grundrechten, sondern auch der „Verhinderung und Aufklärung von Straftaten […] nach dem Grundgesetz eine hohe Bedeutung zu“.
Dass der Einsatz automatisierter Verfahren in Verbindung mit Videoüberwachung im öffentlichen Raum spezifischer Vorschriften bedarf, haben inzwischen auch die Landesgesetzgeber erkannt. Allerdings beschränken sich deren gesetzgeberischen Aktivitäten bisher auf die auto