This article belongs to the debate » 9/11 und die Überwachung im öffentlichen Raum
20 December 2021

Im Auge der Polizei

Polizeiliche Gesichtserkennung im öffentlichen Raum

1. Videoüberwachung und Gesichtserkennung

Videoüberwachung im öffentlichen Raum ist mit einem Sicherheitsversprechen verbunden: Sie soll einen Beitrag zur Verhinderung und Verfolgung von Straftaten leisten und das Sicherheitsgefühl der Bevölkerung stärken. Ob diese Ziele erreicht werden, ist umstritten. Während einige Stimmen in der Videoüberwachung ein sinnvolles Instrument zur Bekämpfung von Straftaten erblicken, wird sie von anderen als Mittel zur Inszenierung von Sicherheit sowie als Meilenstein auf dem Weg in den Überwachungsstaat verstanden. Ihrer weiten Verbreitung hat dies bisher jedenfalls keinen Abbruch getan.

Aufgrund des technischen Fortschritts ist es inzwischen möglich, Videoüberwachung mit biometrischer Gesichtserkennung zu verbinden, um Menschen anhand ihres Gesichts automatisiert zu erkennen. Dafür werden in den Videoaufnahmen Gesichter detektiert und mit vorab hinterlegten Referenzaufnahmen verglichen, woraufhin das Maß an Übereinstimmung errechnet wird. Je nach Einsatzsituation können dabei erhebliche Fehlerraten auftreten.

Diese Weiterentwicklung ist ebenfalls Gegenstand zahlreicher Kontroversen. Etwa wird von der Zivilgesellschaftlichen Initiative für ein Verbot biometrischer Massenüberwachung ein Verbot bestimmter biometrischer Überwachungsmaßnahmen gefordert. Andererseits hat sich bei einer Umfrage des Meinungsforschungsinstituts YouGov im Jahr 2019 die Hälfte der Befragten dafür ausgesprochen, den behördlichen Einsatz von Videoüberwachung mit Gesichtserkennung unter strengen Auflagen zu gestatten. Lediglich 22 % der Befragten lehnten dies ab.

Aus rechtlicher Sicht ist von zentraler Bedeutung, dass der polizeiliche Einsatz von Gesichtserkennung in Verbindung mit Videoüberwachung in Grundrechte eingreift. Dies bedeutet nicht, dass er von vornherein unzulässig ist; es bedarf aber eines wichtigen Grundes, ihn zu rechtfertigen. Ein solch wichtiger Grund kann die Verhinderung und Verfolgung von Straftaten sein. Andererseits ist das Gewicht des Grundrechtseingriffs zu berücksichtigen, das je nach Einsatzszenario – dazu sogleich – sehr unterschiedlich ausfallen kann. Folglich sind einige Formen polizeilicher Gesichtserkennung deutlich schwerer zu rechtfertigen als andere. Hier einen angemessenen Ausgleich zu schaffen, ist Aufgabe des demokratisch legitimierten Gesetzgebers.

2. Einsatzszenarien

Das technisch und rechtlich anspruchsvollste Szenario1) für den Einsatz polizeilicher Gesichtserkennung in Verbindung mit Videoüberwachung ist die Personenfahndung im öffentlichen Raum. In dem überwachten Bereich (z.B. einem Bahnhof oder Marktplatz) werden die Gesichter aller Person von dort installierten Videokameras erfasst und „live“ mit einem hinterlegten Fahndungsbestand abgeglichen. An einen Treffer (d.h. eine errechnete Übereinstimmung) können sich weitere Folgemaßnahmen (z.B. Festnahme der gesuchten Person) anschließen. Ein solches Vorgehen wurde in Deutschland bereits am Hauptbahnhof Mainz (2006 bis 2007) und am Bahnhof Berlin Südkreuz (2017 bis 2018) getestet. Die Bundespolizei kam nach Abschluss des Tests in Berlin zu der Einschätzung, dass Gesichtserkennung als „Unterstützungsinstrument für die polizeiliche Fahndung“ einen „wertvollen Beitrag“ zur Steigerung von Sicherheit leisten kann. Der Chaos Computer Club sprach hingegen von einem „Debakel“. Ein Regelbetrieb findet in Deutschland derzeit (noch) nicht statt. Bereits zum Einsatz kommt indes automatisierte Kfz-Kennzeichenerkennung (z.B. § 14a HSOG, § 163g StPO), die im öffentlichen Verkehrsraum eine vergleichbare Funktion übernehmen kann (nur dass eben nicht nach Gesichtern, sondern nach Kennzeichen gesucht wird). Die Kennzeichenerkennung wurde bereits mehrmals zum Gegenstand von Entscheidungen des Bundesverfassungsgerichts.

Das zweite Szenario kann als die anlassbezogene Suche in Lichtbilddatenbanken beschrieben werden. Hierzu wird im Rahmen eines Ermittlungsverfahrens oder zur Gefahrenabwehr ein Lichtbild (z.B. ein aus einer Videoaufzeichnung extrahiertes Lichtbild einer tatverdächtigen Person) mit den in einer erkennungsdienstlichen Datenbank befindlichen Aufnahmen abgeglichen, um die Identität der betroffenen Person zu ermitteln. Dies wird beim Bundeskriminalamt (und den Landeskriminalämtern) bereits praktiziert und entspricht funktional der Suche nach einem Fingerabdruck im polizeilichen AFIS. Im Unterschied zum ersten Szenario findet kein „live“ durchgeführter Massenabgleich statt, sondern es werden im Nachhinein einzelne Aufnahmen bestimmter Personen aus konkretem Anlass für die Erkennung herangezogen.

Als drittes Szenario ist der Einsatz von Gesichtserkennung als Hilfsmittel zur Unterstützung von Polizeibeamten bei der Sichtung von Videomassendaten zu nennen. Ein einfach scheinender, aus Zeitersparnisgründen aber durchaus relevanter Fall, ist die bloße Personendetektion durch das Auffinden von Gesichtern in umfangreichen Videoaufzeichnungen. Zudem können von den auswertenden Polizeibeamten einzelne Personen markiert werden, um festzustellen, ob diese Personen noch an anderen Stellen in den Videoaufzeichnungen auftreten. Schließlich ist es möglich, in den Videoaufzeichnungen nach bestimmten Person zu suchen, von denen ein Lichtbild verfügbar ist. Gesichtserkennung als Hilfsmittel zur Auswertung umfangreicher Videoaufzeichnungen kam in Deutschland (soweit ersichtlich) erstmals im Nachgang der Ausschreitungen während des G20-Gipfels in Hamburg zum Einsatz. Eine dagegen gerichtet Anordnung des Hamburgischen Beauftragten für Datenschutz wurde erstinstanzlich vom Verwaltungsgericht Hamburg aufgehoben.

3. Rechtsfragen beim polizeilichen Einsatz

Fraglich ist, wie diese verschiedenen Szenarien rechtlich zu behandeln sind. Im Folgenden wird zuvorderst auf einige verfassungsrechtliche Fragen eingegangen.

Grundrechtseingriff

Das vom Bundesverfassungsgericht aus Art. 2 Abs. 1 i.V.m. Art. 1 Abs. 1 GG abgeleitete Grundrecht auf informationelle Selbstbestimmung schützt – auch im öffentlichen Raum – die Befugnis des Einzelnen, grundsätzlich selbst über die Preisgabe und Verwendung seiner personenbezogenen Daten zu entscheiden (ebenfalls Art. 7 und 8 GRCh sowie Art. 8 EMRK).2) Ein Eingriff in dieses Grundrecht liegt vor, wenn Personen durch Videoüberwachung identifizierbar aufgenommen werden. Werden die Aufnahmen mittels Gesichtserkennung zur Gewinnung zusätzlicher Informationen mit anderen Aufnahmen abgeglichen, geht damit ein weiterer Grundrechtseingriff einher. Mithin wird bei allen drei Szenarien in Grundrechte eingegriffen.

Bedeutung des Eingriffsgewichts

Staatliche Grundrechtseingriffe bedürfen einer gesetzlichen Grundlage (Vorbehalt des Gesetzes). Das Rechtsstaats- und das Demokratieprinzip sowie die Grundrechte selbst verlangen dabei, dass entsprechende Regelungen so bestimmt formuliert sind, dass der Exekutive Grenzen gezogen werden und die Bürger erkennen können, „bei welchen Anlässen und unter welchen Voraussetzungen ein Verhalten mit dem Risiko der Überwachung verbunden ist“. Zudem müssen sie dem Grundsatz der Verhältnismäßigkeit entsprechen; es darf also nicht mit Kanonen auf Spatzen geschossen werden. Je schwerer der Grundrechtseingriff, desto höher sind die Anforderungen an die Bestimmtheit und Verhältnismäßigkeit einer gesetzlichen Eingriffsgrundlage. Gerade bei schwerwiegenden Grundrechtseingriffen bedarf es sehr spezifisch gefasster Vorschriften, die dem Schutz hochrangiger Rechtsgüter dienen.

Zur Beurteilung des Eingriffsgewichts hat das Bundesverfassungsgericht in einer Reihe von Entscheidungen zu technikgestützten Überwachungsmaßnahmen ein festes Set von Kriterien entwickelt. Das Eingriffsgewicht wird demnach „insbesondere von der Art der erfassten Informationen, dem Anlass und den Umständen ihrer Erhebung, dem betroffenen Personenkreis und der Art der möglichen Verwertung der Daten beeinflusst“. Bedeutsam ist, wie viele Grundrechtsträger betroffen sind („Streubreite“) und ob sie hierfür einen Anlass gegeben haben. Die Aussagekraft und die Persönlichkeitsrelevanz der Daten sind ebenfalls von Belang. Ein heimliches Vorgehen erhöht das Eingriffsgewicht zusätzlich, während es gesenkt wird, wenn die Betroffenen nicht identifiziert werden.

Unterschiede zwischen den Einsatzszenarien

Bereits die konventionelle Videoüberwachung des öffentlichen Raums ruft erhebliche Grundrechtseingriffe hervor, da regelmäßig zahlreiche Personen erfasst werden, die hierfür keinen Anlass (z.B. durch Begehung einer Straftat) gegeben haben. Außerdem sind Videoaufzeichnungen vielfältig auswertbar. Der Einsatz von Gesichtserkennung zur Personenfahndung im öffentlichen Raum (Szenario 1) vertieft das Gewicht zusätzlich, da mit dem Gesicht ein Merkmal von großer Persönlichkeitsrelevanz gezielt erfasst und ausgewertet wird. Im Trefferfall kann die Festnahme der erkannten Person veranlasst werden. Treffermeldungen können aber auch über einen längeren Zeitraum zusammengetragen und zu Bewegungsprofilen verdichtet werden, was Rückschlüsse auf das Verhalten einer Person erlaubt (z.B. Besuch politischer, sportlicher oder kultureller Veranstaltungen). Dies kann automatisiert und heimlich geschehen, ohne dass der Betroffene das Ausmaß der Datenverarbeitung zu überblicken und sich dagegen gerichtlich zu wehren vermag. Dies steigert das Eingriffsgewicht zusätzlich. Auch ist das Risiko von Fehlerkennungen zu berücksichtigen, was Maßnahmen gegen unbeteiligte oder unschuldige Personen nach sich ziehen kann. Insgesamt geht der Einsatz von Gesichtserkennung im ersten Szenario mit überaus erheblichen Grundrechtseingriffen einher.

Hingegen ist das Eingriffsgewicht in den beiden anderen Szenarien regelmäßig (deutlich) geringer, da hier nur einzelne Personen aus konkretem Anlass in den Abgleich einbezogen (Szenario 2) oder große Mengen an Videodaten nur aus konkretem Anlass gesichtet werden (Szenario 3; z.B. nach gewalttätigen Ausschreitungen). Zudem ist eine menschliche Kontrolle der Ergebnisse zur Korrektur von Fehlerkennungen in der Regel unproblematisch möglich, was im ersten Szenario, insbesondere bei Eilbedürftigkeit, weil die gesuchte Person andernfalls zu entkommen droht, nicht immer der Fall sein wird.

Anforderungen an die Rechtmäßigkeit

Die sich hieran anschließenden Rechtsfragen lassen sich beispielhaft an § 100h Abs. 1 Nr. 1 StPO sowie Art. 33 Abs. 2 und 3 BayPAG verdeutlichen. Nach den genannten Vorschriften dürfen ohne Wissen der Betroffenen außerhalb von Wohnungen „Bildaufnahmen hergestellt“ (§ 100h Abs. 1 Nr. 1 StPO) beziehungsweise an bestimmten (öffentlichen) Orten „offen Bild- und Tonaufnahmen oder ‑aufzeichnungen von Personen“ angefertigt (Art. 33 Abs. 2 und 3 BayPAG) werden. Obwohl es die Vorschriften nicht ausdrücklich erwähnen, besteht doch kein Zweifel daran, dass hierdurch auch die menschliche Sichtung der angefertigten Aufnahmen an einem Monitor erlaubt wird. Aufgrund des vergleichsweise geringe Eingriffsgewichts spricht dann aber viel dafür, dass dabei zur Unterstützung (Szenario 3) auch Gesichtserkennung genutzt werden darf.

Schon der Abgleich mit erkennungsdienstlichen Datenbanken (Szenario 2) kann jedoch nicht mehr auf die genannten Normen gestützt werden, da ein „Herstellen“ oder „Anfertigen“ etwas anderes ist, als der Abgleich mit großen Datensammlungen. Zu diesem Zweck existieren aber mit § 98c StPO und Art. 61 BayPAG allgemeine Vorschriften, die den (maschinellen bzw. automatisierten) Abgleich mit anderen gespeicherten Daten zulassen. Diese Normen werfen ihrerseits Probleme auf (z.B. das Fehlen echter Eingriffsschwellen), können aber zumindest im Grundsatz für derartige Abgleiche herangezogen werden.3) Gänzlich außerhalb der Reichweite von § 100h Abs. 1 Nr. 1 StPO sowie Art. 33 Abs. 2 und 3 BayPAG liegt der Einsatz der Gesichtserkennung zur Personenfahndung im öffentlichen Raum (Szenario 1). Dessen Eingriffsgewicht ist so schwerwiegend, dass spezifische Rechtsgrundlagen mit Eingriffsschwellen und verfahrensrechtlichen Absicherungen erforderlich sind, die weit über die genannten Vorschriften hinausgehen und die es in Deutschland derzeit schlicht nicht gibt.

Sollte der Gesetzgeber in Zukunft eine Rechtsgrundlage für die biometrische Gesichtserkennung zur Personenfahndung im öffentlichen Raum anstreben, müsste diese sehr hohen Bestimmtheits- und Verhältnismäßigkeitsanforderungen genügen. Dabei wären die Eingriffsschwellen und die Vorkehrungen zur Einhegung des Eingriffs deutlich strikter als bei der automatisierten Kfz-Kennzeichenerkennung zu fassen (z.B. § 14a HSOG, § 163g StPO), da das Eingriffsgewicht der Gesichtserkennung unter anderem wegen der großen Persönlichkeitsrelevanz des Gesichts deutlich höher ist. Ein flächendeckender Einsatz der Gesichtserkennung wäre auf jeden Fall auszuschließen. Auch wären Schutzvorkehrungen wie etwa ein Richtervorbehalt vorzusehen. Um die Verhältnismäßigkeit sicherzustellen, dürfte der Einsatz nur erlaubt werden, um Rechtsgüter von erheblichem Gewicht (z.B. Leib und Leben) zu schützen beziehungsweise schwere Straftaten zu verfolgen. Dann aber wäre es nicht von vornherein ausgeschlossen, eine verfassungsgemäße Rechtsgrundlage für den Einsatz von Gesichtserkennung zur Personenfahndung im öffentlichen Raum zu schaffen, denn es kommt nicht nur den Grundrechten, sondern auch der „Verhinderung und Aufklärung von Straftaten […] nach dem Grundgesetz eine hohe Bedeutung zu“.

Dass der Einsatz automatisierter Verfahren in Verbindung mit Videoüberwachung im öffentlichen Raum spezifischer Vorschriften bedarf, haben inzwischen auch die Landesgesetzgeber erkannt. Allerdings beschränken sich deren gesetzgeberischen Aktivitäten bisher auf die automatisierte Erkennung und Auswertung von Mustern „bezogen auf Gegenstände“ (Art. 33 Abs. 5 BayPAG) sowie das Erkennen „solcher Verhaltensmuster […], die auf die Begehung einer Straftat hindeuten“ (§ 44 Abs. 4 PolG BW). Der Einsatz von Gesichtserkennung wird von diesen Vorschriften nicht adressiert.

Darüber hinaus ist beim polizeilichen Einsatz von Gesichtserkennung darauf zu achten, dass dieser auch im Einzelfall verhältnismäßig erfolgt. Zudem darf es nicht zu unzulässigen Ungleichbehandlungen kommen (Art. 3 GG). Dies kann unter anderem der Fall sein, wenn die Gesichtserkennungsalgorithmen bei verschiedenen Personengruppen (z.B. bzgl. Geschlecht oder Hautfarbe) unterschiedlich gut funktionieren, so dass Mitglieder bestimmter Personengruppen öfters Fehlerkennungen und den damit einhergehenden Folgemaßnahmen (z.B. Identitätsfeststellungen) ausgesetzt sind als Mitglieder anderer Personengruppen.

Schließlich muss das allgemeine Datenschutzrecht berücksichtigt werden. Der polizeiliche Einsatz von Gesichtserkennung in Verbindung mit Videoüberwachung zur Verhinderung und Verfolgung von Straftaten fällt in den Anwendungsbereich der europäischen JI-Richtlinie, die von den Mitgliedstaaten (also auch der Bundesrepublik Deutschland) gemäß Art. 288 Abs. 3 AEUV in nationales Recht umzusetzen ist. Dies ist im BDSG (vgl. §§ 45 ff. BDSG), den Landesdatenschutzgesetzen sowie dem spezifischen Fachrecht (StPO etc.) geschehen. Hieraus ergibt sich unter anderem, dass vor dem Einsatz biometrischer Gesichtserkennung im öffentlichen Raum eine Datenschutz-Folgenabschätzung durchzuführen ist (z.B. § 67 BDSG), dass Informationspflichten und -rechte (z.B. §§ 55 bis 57 BDSG) sowie Anforderungen an die Datensicherheit (z.B. § 64 BDSG) einzuhalten sind (wobei solche auch vom deutschen Verfassungsrecht gefordert werden) und dass unabhängigen Aufsichtsbehörden Untersuchungs- und Abhilfebefugnisse zustehen (z.B. §§ 8 ff. BDSG).

Insgesamt ist es nach der derzeitigen Rechtslage durchaus möglich, den polizeilichen Einsatz von Gesichtserkennung in Verbindung mit Videoüberwachung rechtskonform zu regeln und auszugestalten, wobei es aber insbesondere für die Personenfahndung im öffentlichen Raum (Szenario 1) einer spezifischen Rechtsgrundlage bedarf, die derzeit nicht vorhanden ist. Ob eine solche geschaffen wird, obliegt dem demokratisch legitimierten Gesetzgeber, der dies – bisher – noch nicht getan hat.

4. Ausblick: Verbot durch die Europäische Union?

Derweil sind in der Europäischen Union Bestrebungen erkennbar, den Einsatz biometrischer Erkennung in bestimmten Situationen zu verbieten. Hierzu enthält der Entwurf einer Verordnung zur Regulierung Künstlicher Intelligenz (VO-E) konkrete Vorschläge. Da europäische Verordnungen in den EU-Mitgliedstaaten unmittelbar gelten (Art. 288 Abs. 2 AEUV) und im Rang über dem nationalen Recht stehen (Anwendungsvorrang des Unionsrechts), würde die Verordnung zur Regulierung Künstlicher Intelligenz, so sie denn tatsächlich erlassen wird, entgegenstehendes deutsches Recht verdrängen.

Konkret sieht Art. 5 Abs. 1 lit. d VO-E ein Verbot der Verwendung biometrischer Echtzeit-Fernidentifizierungssysteme in öffentlich zugänglichen Räumen zu Strafverfolgungszwecken vor. Biometrische Fernidentifizierungssysteme sind Systeme, die natürliche Personen aus der Ferne durch Abgleich biometrischer Daten identifizieren (Art. 3 Nr. 36 VO-E). Für ein Echtzeit-Fernidentifizierungssystem ist erforderlich, dass die Erfassung de