f4x Verfahrenskonzept

So sorgen wir für sicheren Ablauf

Im Folgenden beschreiben wir ausführlich, wie wir den Ablauf der Spracherkennung technisch so gestaltet haben, dass er sicher und transparent ist.

Das Verfahrenskonzept wurde am 05.03.2019 zur Prüfung beim Hessischen Datenschutzbeauftragten eingereicht. Seit dem haben wir weitere Sicherheitsmaßnahmen hinzugefügt, z.B. einen sog. AppAmor der auf unseren Servern ausschließlich Prozesse zulässt, die für die Spracherkennung benötigt werden.

Datenschutzrechtliche Ausgestaltung der automatischen Transkription von Audiodateien

I. Ausgangslage / Kurzdarstellung des Unternehmens

Die dr. dresing & pehl GmbH, Deutschhausstraße 22A, 35037 Marburg, (nachfolgend auch: „wir“) vertreibt unter der Marke „audiotranskription“ seit 2005 eine Software sowie (als optionale Ergänzung hierzu) sog. „Fußschalter“ zur manuellen Transkription von Interviews. Die Software zur Transkription ist hauptsächlich im Hochschulkontext im Einsatz und ist dort zentraler Bestandteil der qualitativen Methodenausbildung.

In Zusammenarbeit mit dem Fraunhofer Institut IAIS entwickelte die dr. dresing & pehl GmbH eine technische Lösung zur automatischen Erstellung von Transkripten aus Audiodateien. Mit dieser Lösung soll der Zeitaufwand für die Erstellung wissenschaftlicher Transkription minimiert werden.

Als Erweiterung des eigenen Leistungsportfolios soll zukünftig die automatisierte Transkription von Audiodateien in Textdateien angeboten werden. Die gesamte Vertragsdurchführung erfolgt allein durch die dr. dresing & pehl GmbH. Das Fraunhofer Institut IAIS erhält daher auch keine Kundendaten. Der vorgenannte automatisierte Transkriptionsdienst ist Gegenstand dieser datenschutzrechtlichen Darstellung.

Im Folgenden beschreiben wir daher unsere vertraglichen und technischen Maßnahmen, um die automatische Spracherkennung datenschutzkonform zu gestalten. Auf dieser Basis soll der Transkriptionsservice den Kunden zukünftig offeriert werden.

II. Begriffsklärung

Im Folgenden wird zunächst unterschieden zwischen:

„Vertragsdaten“, also Daten der nutzenden Person (nachfolgend „Sie“) (d.h. Name, Anschrift usw.) und „Auftragsdaten“, also Audiodateien und die entsprechenden Textdateien, die die nutzenden Personen zur Beauftragung unserer Services hochladen sowie die jeweils transkribierten Daten. Diese Dateien können sowohl personenbezogene Sprachdaten der nutzenden Person, als auch Sprachdaten Dritter (der aufgenommenen Personen) enthalten.

III. Informationen der Kunden gemäß Art. 13 DSGVO

Sie werden vor bzw. beim Anlegen eines Kundenkontos ausführlich gemäß Art. 13 DSGVO über die Datenverarbeitung informiert.

Konkret erfolgt die Information auf der Webseite über die Datenschutzerklärung, in der u.a. Informationen nach Maßgabe dieses Dokuments bereitgestellt werden. Auch beim Anlegen eines Benutzerkontos wird prominent auf die Datenschutzerklärung hingewiesen.

IV. Überblick des Arbeitsablaufs

Sie werden über einen Software-Client (f4transkript oder einen Web-Client) Interviews oder andere Sprachdateien zu einem Server der dr. dresing & pehl GmbH hochladen. Dort werden die Sprachdateien automatisiert in einen Text überführt. Der erzeugte Text wird Ihnen im Software-Client angezeigt und kann dort lokal weiterverarbeitet werden. Alle auf den Server hochgeladenen Daten werden nach der Transkription und der Übermittlung auf den Software-Client gelöscht. Die Einzelschritte dieses Prozesses werden im Folgenden genauer erläutert:

1. Softwareinstallation/Registrierung

Voraussetzung zur Nutzung des Services ist die Installation der Software f4transkript oder eines entsprechenden Web-Clients. Hier müssen Sie sich vor Nutzung des Spracherkennungsdienstes persönlich registrieren. Ein entsprechender Dialog wird von der lokal zu installierenden Software angezeigt. Ihre Registrierung erfolgt in den folgenden Schritten:

Schritt 1: Vergabe von Nutzername und Passwort

In einem ersten Schritt werden die E-Mail-Adresse, ein von Ihnen frei wählbares Passwort und die Bestätigung der Kenntnisnahme von der (per Link einsehbaren) Datenschutzerklärung abgefragt. Das zu wählende Passwort muss hierbei bestimmten Mindestvoraussetzungen entsprechen (eine Kombination aus Groß-/Kleinschreibung, Sonderzeichen, Zahlen, mind. 10 Zeichen).

Das Passwort kann nach der Authentifizierung per E-Mail geändert werden. Bei Eingabe der E-Mail-Adresse im entsprechenden Feld des Clients wird ein Code an die hinterlegte E-Mail-Adresse gesendet. Erst mit Eingabe dieses Codes kann das Passwort geändert werden.

Schritt 2: Bestätigung der Anmeldung

Zur Verifizierung der angegebenen E-Mail-Adresse wird an das hinterlegte Konto ein Code gesendet. Erst wenn der Kunde diesen Code über den Anmeldedialog im Client eingegeben hat, wird das Konto aktiviert. Nicht bestätigte Daten werden nach 6 Stunden gelöscht.

Schritt 3: Abschluss eines Vertrags über die Auftragsverarbeitung (ADV)

Nach Bestätigung der Anmeldung erhalten Sie einen Dialog zum Abschluss einer ADV. Hier werden Vertragstext samt Auflistung der technischen und organisatorischen Maßnahmen und Unterauftragsverarbeiter (Server-Hoster) aufgeführt. Sie haben die Möglichkeit, den Zweck der Verarbeitung und die Art der zu verarbeitenden personenbezogenen Daten gesondert einzugeben. Der Vertragstext wird nach Bestätigung durch Sie per E-Mail versendet (Vertragsschluss gemäß Art. 28 Abs. 9 DSGVO).

Schritt 3a (optional): Verpflichtung auf die Geheimhaltung nach Maßgabe von § 203 StGB

Einige Personengruppen (z.B. in juristischen oder medizinischen Tätigkeiten) unterliegen besonderen Bestimmungen zur Geheimhaltung nach § 203 StGB. Um die Verarbeitung von Daten zu ermöglichen, ist es in diesen Fällen notwendig, dass wir uns und Unterauftragnehmer explizit (über die Bestimmungen der ADV hinaus) auf die Geheimhaltung nach Maßgabe von § 203 StGB verpflichten. Sie erhalten auf Wunsch optional eine entsprechende Verpflichtung in elektronischer Form.

2. Freischaltung für den Upload von Auftragsdaten

Erst nach Abschluss der Registrierung wird der Account für den Upload von Auftragsdaten auf unseren Server freigeschaltet. Die Registrierungsinformationen werden auf dem Spracherkennungsserver gespeichert und sind physikalisch und logisch getrennt von Abrechnungsdaten (siehe unter Ziff. VII. Infrastruktur zur Datenverarbeitung).

3. Kauf von Zeitkontingenten über den Onlineshop

Die Nutzung der automatisierten Spracherkennung wird auf Basis von Zeitkontingenten ermöglicht. Die Zeitkontingente können vorab in Form von Guthabencodes über unseren Onlineshop gekauft werden. Diese Codes werden von unserem Aktivierungsserver (logisch und physisch getrennt vom Spracherkennungsserver) erzeugt und per E-Mail versendet. Die Codes sind nicht personengebunden und können von einer beliebigen (aber registrierten) Person zur Aufladung des eigenen Zeitkontingents genutzt werden.

Bestelldaten wie Name, Adresse, E-Mail-Adresse, Telefonnummer, Datum der Bestellung und Anzahl der bestellten Artikel werden für Abrechnungs- und Buchhaltungszwecke auf dem Server des Webshops und auf unserem Inhouse-Server in Marburg geladen und entsprechend der gesetzlichen Aufbewahrungsfristen gespeichert. Zahlungsinformationen (Kreditkartendaten) werden von uns nicht erfasst, sondern direkt über sog. Iframes oder über Zahlungsseiten der jeweiligen Zahlungsabwickler an die zahlungsabwickelnden Unternehmen übermittelt (PayOne, PayPal). Die Datenschutzerklärung des Webshops wurde von Trusted Shops geprüft. Die Abrechnungsdaten sind logisch und physikalisch von den Auftragsdaten getrennt.

V. Abwicklung der Einzelaufträge

Als „Abwicklung der Einzelaufträge“ beschreiben wir hier das Hochladen einer Audiodatei auf unseren Server, die Bearbeitung dort und den Download der fertigen Ergebnisse bis zur Löschung der einzelnen Auftragsdaten. Die Auftragsdaten werden nur so lange auf dem Server gespeichert, wie dies für die Zwecke der Verarbeitung nötig ist. Danach werden die Auftragsdaten auf Ihren Rechner zurückgespielt und dort von Ihnen lokal gespeichert.

1. Hochladen von Audiodateien

Audiodateien können auf unseren Server hochgeladen werden, wenn Sie registriert und an einem Client angemeldet sind. Der Client erzeugt für jede Audiodatei beim Upload ein asymetrisches Schlüsselpasswort. Der öffentliche Schlüssel wird beim Upload gemeinsam mit der Audiodatei an den Server gesendet (Jobschlüssel). Der private Schlüssel wird bei Nutzung von f4transkript auf dem Client-Rechner mit Ihrem geheimen Passwort verschlüsselt und abgelegt. So ist sichergestellt, dass die Auftragsdaten nur vom registrierten Client aus entschlüsselt werden können. Bei Nutzung von f4x über den Browser wird dieses Passwort auf einem separaten (von der Spracherkennung getrennten) Server verschlüsselt abgelegt.

Der Upload auf unseren Server erfolgt über eine gesicherte Verbindung. Dateinamen werden vor der Verarbeitung durch zufällige aber eindeutige Namen pseudonymisiert. Bei Nutzung von f4transkript bereits während des Uploads.

2. Bearbeitung

Zur Bearbeitung wird die Audiodatei durch den Spracherkennungsalgorithmus entschlüsselt und in eine Textdatei umgesetzt. Die Audiodatei wird direkt nach der erfolgreichen Umsetzung in eine Textdatei gelöscht. Die fertige Textdatei wird mit dem öffentlichen Schlüssel des Jobs verschlüsselt auf dem Server zur Abholung zwischengespeichert.

Der Server meldet zu jedem Job einen Status an den Client. Erfolgreich umgesetzte Jobs melden den Status an den Client und aktivieren dort den „Download“-Button.

3. Download

Die fertigen Textdateien können vom Client heruntergeladen werden. Nach erfolgreichem Download wird die Textdatei durch den privaten Key auf dem Client entschlüsselt. Bei Nutzung von f4transkript stellt die Kombination aus öffentlichem und privatem Schlüssel stellt sicher, dass die Ergebnisse nur auf dem Rechner entschlüsselt werden können, von dem der Auftrag hochgeladen wurde. Bei Nutzung von f4x über den Browser kann das Ergenis nur mit korrekten Anmeldedaten entschlüsselt werden.

4. Löschung

Sobald der Server die Meldung über den erfolgreichen Download erhält, wird die Datei vom Server endgültig gelöscht.

Sollte beim Upload ein Fehler aufgetreten sein, z.B. wegen eines nicht erkannten Dateiformats oder des Abbruchs der Verbindung, wird die unvollständige Audiodatei sofort vom Server gelöscht. Der Client erhält sodann einen entsprechenden Hinweis

Sollte ein Ergebnis nach 14 Tagen nicht abgeholt werden, erhalten Sie einen Hinweis per E-Mail. Bleibt dieser Hinweis unbeantwortet, erhalten Sie nach 7 Tagen eine weitere Erinnerung. Sollte die darin genannte Frist zur Abholung von 7 Tagen verstreichen, werden die Auftragsdaten gelöscht und der Kunde hierüber per E-Mail informiert.

VI. Dauer der Datenspeicherung und Datenlöschung

Im Hinblick auf die Dauer der Datenspeicherung und die Datenlöschung ist wie folgt zu differenzieren:

Vertragsdaten werden zur Legitimierung und Auftragskontrolle zunächst dauerhaft auf dem Spracherkennungsserver gespeichert. Die Löschung der Vertragsdaten erfolgt bei der Löschung des Accounts, sofern der Löschung keine vertraglichen und/oder gesetzlichen Aufbewahrungsfristen entgegenstehen. Auftragsdaten, also die Audiodateien und die entsprechenden Textdateien, werden für die Dauer der Bearbeitung bis zum Download durch Sie oder bis zum Verstreichen der vereinbarten Löschfrist gespeichert und sodann automatisch gelöscht. Ergänzende Informationen zu den Auftragsdaten, wie Dateigröße und Datum des Uploads, werden gespeichert, um die Abwicklung und Abrechnung der Einzelaufträge zu ermöglichen und diese zu dokumentieren. Diese Daten werden für die Nachvollziehbarkeit durch Sie und die Dokumentation möglicher Ansprüche so lange gespeichert, wie der Account aktiv ist. Mit der Löschung des Accounts werden die Daten gelöscht. Bestelldaten beim Kauf von Zeitkontingenten (z.B. der Name, die Adresse, die E-Mail-Adresse, die Telefonnummer (optional), das Datum der Bestellung und die Anzahl der bestellten Artikel) werden für Abrechnungs- und Buchhaltungszwecke auf den Server des Webshops und auf unseren Inhouse-Server in Marburg geladen und entsprechend gesetzlicher Aufbewahrungsfristen gespeichert.

Über die genauen Daten, Verarbeitungszwecke und Speicherfristen wird ausführlich in der Datenschutzerklärung informiert.

VII. Infrastruktur zur Datenverarbeitung

Die genutzte Infrastruktur zur Datenverarbeitung ist in vier voneinander physisch unabhängige Bereiche aufgeteilt. Sie werden im Anhang der ADV durch die TOMs über die genutzte Infrastruktur informiert. Hierzu im Einzelnen:

1. Spracherkennungsserver

Der „Spracherkennungsserver“ enthält den Spracherkennungsalgorithmus und verwaltet die Auftragsabwicklung und Nutzerverwaltung. Hier werden die Auftragsdaten während der Bearbeitung zwischengespeichert. Diese Daten werden auf einem Dedicated Root Server der Hetzner Online GmbH in Nürnberg oder Falkenstein verarbeitet.

Das Rechenzentrum ist DIN-ISO/IEC-27001-zertifiziert (dt. Akkreditierungsstelle D-ZM-18855-01-00, Zertifikatsnummer ZN-2016-04). Ein Vertrag zur Auftragsverarbeitung wurde am 29.10.2018 abgeschlossen.

2. Webshop

Der Webshop zum Kauf von Zeitkontingenten und E-Mail-Dienste laufen über einen Server der ALL-INKL.COM Neue Medien Münnich mit Serverstandorten in Dresden und Friedersdorf. Gespeichert werden hier die von Ihnen angegebenen Adressdaten, die gekauften Artikel und die Korrespondenz per E-Mail. Ein Vertrag zur Auftragsverarbeitung wurde am 25.05.2018 geschlossen.

3. Interne Auftragsabwicklung

Für die Abrechnung und Buchhaltung werden Kundendaten auf eigenen Servern in den Geschäftsräumen der dr. dresing & pehl GmbH in Marburg gespeichert und entsprechend gesetzlicher Aufbewahrungsfristen archiviert. Der Zugriff auf die Daten ist insbesondere durch ein Zugriffskonzept (Passwort, restriktive Rechtevergabe etc.) geregelt.

4. Zahlungsabwicklung

Daten für Kreditkartenzahlungen oder für Lastschriftaufträge werden von uns nicht gespeichert. Die Abwicklung dieser Zahlweisen wird über sog. Iframes direkt an den Zahlungsdienstleister BS PAYONE GmbH in Frankfurt am Main weitergeleitet.

Zahlungen per PayPal werden von Ihnen direkt auf der Bezahlseite von PayPal (für Europäische Kunden PayPal (Europe) S.à r.l. et Cie, S.C.A., in Luxemburg) durchgeführt.

Stand: 15.10.2019