datenleben

Was ist Data Science? Was bedeuten die Daten für unser Leben? Woher kommen sie und wozu werden sie benutzt? Das sind alles Fragen, mit denen wir uns auseinander setzen werden. Wer schon immer mehr über Daten und deren Effekt auf unser Leben wissen wollte, ist hier genau richtig.

https://www.datenleben.de

subscribe
share





episode 10: #remoteChaos3xperience


Intro (00:00:00) Thema des Podcasts (00:00:18)

Willkommen zur zehnten Folge beim datenleben-Podcast, dem Podcast über Data Science.
Wir sind Helena und Janine und nehmen euch mit in die bunte Welt der Daten.
Wenn es um Data Science geht, geht es auch immer um die Digitalisierung und wie wir sie sinnvoll einsetzen können.
Wie sollen wir mit Daten umgehen, was können wir mit ihnen erfahren?
Wir werfen einen Blick auf diese Daten!

Thema der Folge (00:00:43)
  • In dieser Folge erzählen wir von der remote Chaos Experience, die vom 27.-30.12. stattfand
  • die #rC3 war die digitalen Version des Chaos Communication Congress
  • Es geht ein bisschen um das Drumherum, wie wir es so erlebt haben
  • Und wir erzählen etwas über die Vorträge, die wir uns angesehen haben, vor allem über fünf:
  • Es geht um Wikidata für Journalist*innen,
  • wie man mit dem Datenguide zugängliche Statistiken visualisieren kann,
  • Deepfakes
  • eine Untersuchung zu Körperverletzung durch Polizeibeamt*innen
  • und wie man mit Daten über Bodyfeedback im Theater arbeiten kann
Warum wir über die rC3 reden (00:02:03)
  • Wir haben noch mehr Vorträge gesehen, denn auf dem Congress gibt es immer einige 100
  • In den letzten Jahren waren wir auch immer vor Ort gewesen, Helena seit 2012
  • Es gab dort schon immer Data Science Vorträge, auch solche, die nicht nur rein auf die Daten gucken, sondern was diese mit der Gesellschaft machen
  • Und vielleicht möchtet ihr ja in Talks reinhören, wenn ihr spannend findet, was wir erzählen
Genderneutrale Sprache (00:03:13)
  • Redaktioneller Einschub, ehe wir ins Thema einsteigen, zu gendergerechter Sprache
  • Nach unserer letzten Folge hat Helena mich darauf angesprochen, dass ich beim Thema Präsidentschaftswahl immer von Wahlmännern gesprochen habe
  • Obwohl wir darüber gesprochen haben, die neutrale Formulierung Wahlmenschen zu benutzen
  • Das fanden wir einen guten Anlass nochmal zu sagen, wie wir mit Sprache umgehen möchten
  • Im Deutschen gibt es zwei Geschlechter, die man sprachlich unterscheiden kann
  • Es war üblich Gruppen oft mit der männlichen Form zu beschreiben, zum Beispiel: Ärzte
  • Studien mit Kindern haben gezeigt, dass diese dann vor allem an Männer denken
  • Dadurch fühlen sich vor allem Jungs eher von dem Beruf Arzt angesprochen, als Mädchen
  • Um dieses Problem zu lösen und die mögliche Vielfalt abzubilden, kann man neutraler Sprechen
  • Entweder beide Formen nennen: Ärzte und Ärztinnen, oder das Sternchen zu benutzen: Ärzt*innen
  • Verschlusslaute sind auch im Deutschen bekannt, Beispiel: Spiegelei
  • Aber: Sich dazu zu entschließen das zu machen, heißt noch nicht, dass man es sofort macht
  • Gewohnheit: die Sozialisation mit dem generischen Maskulinum verschwindet nicht einfach
  • Hitzige Diskussionen, Aufregung vor dem Mikro
  • Es ist auch im wissenschaftlichen Kontext scheinbar angekommen und akzeptiert
  • Twitter-Umfrage: "Benutzt ihr im Beruf/Studium und/oder privat genderneutrale/-gerechte Formulierungen? Wer es nicht immer tut, aber überwiegend, kann gerne für diese Umfrage mt Ja antworten."
  • Ergebnis: Nein: 18.6%, Ja, beruflich: 6,8%, Ja, privat: 13,6%, Ja, beruflich und privat: 61%
  • Genderneutrale Sprache findet auch im öffentlichen Diskurs immer mehr statt, Beispiel:
  • heute Nachrichten des ZDF, mehrere Formate des Deutschlandfunk,
Einspieler: Chaos erleben (00:12:10)
  • Wer vor dem freien Verkauf kein Ticket über einen Voucher erhaschen konnte, muss sich anstellen
  • 3 Sekunden nach Start ist die Ticketseite überlastet, Tausende möchten gerne dabei sein
  • 17.000 waren es 2019 auf dem #36C3 in Leipzig
  • Wenn man vor Ort ankommt, steht man als allererstes vor einer großen Rakete, der Fairydust.
  • Die Fairydust ist das Tor in die Welt des Congresses - man begibt sich auf eine Reise
  • 4 Tage eine andere Welt, Menschen, kaum Tageslicht, LED-Lichter, Laptops, spannende Talks
  • Das Zeitgefühl setzt aus, das Hirn ist auf Empfang und überall prangt: Be Excellent to Each Other.
  • Seit 1984 trifft sich der Chaos Computer Club (CCC) jährlich zum Chaos Communication Congress
  • Alle Vorträge der Hauptbühnen werden live ins gestreamt und anschließend veröffentlicht
  • Es geht um IT, Hardware, Software, Sicherheit, Wissenschaft, Gesellschaft und auch Kunst.
  • Um die Auseinandersetzung mit der Technik, der Digitalisierung und der Frage, wie das alles in unserer Gesellschaft stattfindet
  • 2020 hätte der 37. Congress, also der #37C3, stattfinden sollen
  • Pandemiebedingt wurde daraus eine Onlineveranstaltung, die remote Chaos 3xperience, auch: #rC3
Was bedeutet der Congress für uns (00:15:18) Helenas Congress
  • Schon seit vielen Jahren in der Hackercommunity aktiv, seit 2012 in Hamburg beim Congress vor Ort
  • Es geht vor allem um Kommunikation, viel Kontakt zu Menschen, die man jährlich dort trifft
  • Spannende Vorträge dann lieber hinter her im Video geguckt
  • 2020 gab es dieses "vor Ort" nicht, aber leider war nicht sehr klar wofür man Tickets braucht
Janines Congress
  • Gesellschaftlicher Aspekt daran am wichtigsten, dass mann so konzentriert auf einem Fleck so viel vom Weltgeschehen mitbekommt
  • Neben Vorträgen gibt es viel zu sehen, vor allem wie engagiert und kreativ Menschen dinge tun
  • Das was den Congress an sich oft ausmacht, wurde richtig gut rübergebracht mit der 2D-Welt
  • Hat sich entschieden den Congress 24/7 zu erleben und alles mitzunehmen, nicht raus zu müssen
  • In der 2D-Welt konnte man mit einem Avatar rumlaufen und mit anderen Menschen sprechen
  • In der Welt gingen automatisch Jitsikonferenzen auf, Menschen haben wild alles erkundet
  • Vieles wurde aufgebaut, was man sonst auch auf dem Congress entdeckt hätte, inklusive Partys
Was für Talks gab es noch so (00:20:27)
  • Über 350 Talks und Performances, in 25 Studios produziert, 19 Channels haben live übertragen
  • Viele verschiedene Themen abgedeckt zum Beispiel:
  • Erdbeben von Izmir: Wie Menschen per Open Street Map Schadenskarten und Hilfe organisieren
  • Oder Lesungen und Gespräche wie das mit Undine de Rivière über ihr Buch Das Hurenmanifest
  • Ein Vortrag über Objekte, die man als Flöten benutzen kann und wie man sie 3D-druckt
  • Auch so etwas wie Elektronenstrahl-Lithographie
  • und schließlich auch so etwas wie Repräsentation von Autist*innen in den Medien
  • Grundsätzlich auch spannend: Konzepte von Vorträgen, die die Möglichkeiten von Vorabaufzeichnungen
Körperverletzung im Amt durch Polizeibeamt*innen (00:26:43)
  • Vortrag zum Projekt KVIAPOL: https://kviapol.rub.de/
  • Onlinebefragung durchgeführt, mit dem Ziel ein grobes Bild vom Dunkelfeld zu bekommen
  • Problematik: Dunkelfeld ist der Bereich von nicht zur Anzeige gebrachten Taten
  • Nur 3% dieser angezeigten Körperverletzung landen hierbei in einem Gerichtsverfahren
  • Oft wenig Anzeigen, weil man Angst hat, dass Polizeibeamt*innen ein Gegenverfahren anstoßen
  • Wobei befürchtet wird, dass Polizist*innen als glaubwürdigere Zeug*innen gelten
  • Es haben 3373 Personen die von Polizeigewalt betroffen waren an der Onlinebefragung teilgenommen
  • 305 weitere Personen haben den Fragebogen ausgefüllt aber wurden herausgenommen
  • 1999 Personen haben den Fragebogen als Zeugen ausgefüllt
  • 17 Experten aus Polizei und Zivilgesellschaft wurden dazu interviewt
  • 3 Gruppen von Ereignissen unterschieden, an denen die Polizeigewalt erlebt wurde:
  • nämlich Demonstrationen (55%), Großveranstaltungen(25%) wie Fußball und Andere Einsätze (20%)
  • People of Color stärker von Anderen Einsätzen wie Personenkontrollen betroffen, als Weiße
  • Fragebogen hat 'Gender non-conforming' mit erfasst, und machte 3.2% der Gesamtstichprobe aus
  • Es gab insgesamt zwei Zwischenberichte die über die Projektseite abgerufen werden können
  • Beachtenswert: Dunkelfeldstudien sind schwierig durchzuführen, deswegen kann man nicht sagen, wie groß das Dunkelfeld wirklich ist, aber solche Befragungen geben dennoch einen Eindruck
  • Talk auf media.ccc.de: Körperverletzung im Amt durch Polizeibeamt*innen
WIKIDATA FOR (DATA) JOURNALISTS (00:34:39)
  • Wikidata gehört zu Wikimedia und wurde 2012 ins Leben gerufen
  • Wikidata sammelt Daten unter Public Domain, die von jedem benutzt werden können
  • Abfragen der Daten können zum Beispiel über den Query Service gemacht werden
  • Dieser wirft Listen oder Visualisierungen der Daten aus, auch auf Karten
  • Beispiel: Welche Airports sind nach männlichen und welche nach weiblichen Personen benannt?
  • Ein bisschen mehr konnte man schonmal in dem Einführungstalk Introduction to Wikidata hören
  • In ihrem Vortrag Wikidata for (Data) Journalists, hat Elisabeth Giesemann dann etwas genauer vorgestellt, wie man diese Plattform zum Beispiel für Journalismus nutzen kann
  • Mit den Daten zu arbeiten kann helfen, Verbindungen, Korrelationen und Kausalitäten aufzudecken
  • Man kann Sachen anders hinterfragen, und mit diesen Daten Geschichten erzählen
  • Sodass das eigentliche Faktenwissen besser verständlich und zugänglich gemacht werden kann
  • Man muss dazu weder Python noch R können, aber SPARQL wird ein wenig benötigt
  • Es gab auch einen Talk zu SPARQL und es gibt eine Tour, die man auf Wikidata machen kann
  • Man kann sich im Query Service auch Beispielanfragen ausgeben lassen, um sich das mal anzusehen
  • Man kann mit diesen Beispielen auch herumspielen und die Abfragen selbst verändern
  • Visualisieren der Daten entweder in Wikidata oder auch mit anderen Tools möglich
  • Vergisst nicht zu erwähnen, dass es auch negative Seiten gibt, derer man sich bewusst sein muss
  • Zum beispiel, dass es eine Auswahl von Daten, die Daten vorab klassifiziert sind, etc.
  • Oder, dass die Daten vorwiegend über die sogenannte westlichen Welt vorliegen
  • Das heißt es gibt große blinde Flecken an Daten, wenn man das global betrachtet
  • Insgesamt aber ein guter Zugang zu Daten und mit der Arbeit mit Daten anzufangen
  • Fazit: Daten sind nicht alles, es braucht auch Menschen, die Geschichten zu Daten erzählen
  • Talk auf media.ccc.de: Wikidata for (Data) Journalists
Datenguide: Statistiken für alle (00:42:27)
  • Datenguide ist ein Onlinetool, um auf staatliche Datenportale mit GENESIS online zuzugreifen
  • destatis, 14 statistische Landesämter, Regionaldatenbank Deutschland, regionalstatistik.de (oft nicht so aktuell wie Datenportale der Landesämter)
  • Wir hatten über GENSIS bereits in der Folge zu Unfallstatistik gesprochen
  • Datenguide bietet zwei Schnittstellen, zum einen als Programmierschnittstelle oder per Webseite
  • Ist alles noch im beta Stadium, aber schon gut benutzbar
  • Anwendungsmöglichkeiten: Datenjournalismus, Fact-Checking, Wissenschaft (gerade auch Sozialwissenschaft), Zivilgesellschaftliche Initiativen
  • Vermutlich zugänglicher und einfacher zu nutzen als Wikidate, etwas userfreundlicher
  • Niederschwelliger Einstieg in Arbeit mit Datensetzen
  • Daten sind maschinenlesbar, ob barrierearm oder barrierefrei können wir hier nicht beurteilen
  • Aber oft werden Daten einfach nur in PDFs oder Tabellen gepackt, hier hilf Datenguide durchaus
  • Ziel von Datenguide: amtliche Statistiken nutzbar und nützlich zu machen, Webanwendungen einfacher und stabiler machen
  • Talk auf media.ccc.de: Datenguide: Statistiken für alle
"But this politician said «xyz»!" (00:48:05)
  • Einführungstalk von Lisa Greenspecs, die Deepfakes und Neuronale Netze dahinter erklärt
  • Verweis auf this person does not exist und unsere Jahresrückblicksfolge
  • Was können sie noch, als realistische Porträts erzeugen und warum man mit dieser Technik vorsichtig umgehen sollte, wo und wie sie eingesetzt werden
  • Zur Basis nur kurz so viel: Deepfakes werden mittels GANs erzeugt
  • Generative Adversarial Networks, die aus Algorithmen für unüberwachtes Lernen bestehen
  • Hier arbeiten zwei Netzwerke gegeneinander
  • Ein Netzwerk erstellt Kandidaten erstellt (Generator), das andere bewertet diese (Diskriminator)
  • Diskriminator gleicht Kandidaten mit einer vorgegebenen Menge von "echten" Einheiten ab
  • Generator versucht dem Diskriminator etwas vorzulegen, das er als echt anerkennt
  • Wofür wendet man das also an? Beispiele, die im Talk genannt wurden:
  • Anwendung im medizinischen Bereich: Bilderkennung und Verbesserung von Tumorerkennung
  • Auch: Kunst, Filme, Videospiele -- potentiell jetzt schon besser als CGI (und günstiger)
  • Negative Aspekte: (racial) bias, z.B. Upsample von barack obama, wo er "white" rausgepixelt wird
  • Facebook hat Trumpsupporter wegen Fake entfernt, wofür GANs eingesetzt wurden
  • Identitätsklau und Einbindung von Gesichtern in Video oder Bildmaterial (insbesondere Pornos)
  • Fakenews erzeugen, indem etwa Politikern Worte in den Mund gelegt werden, die sie nie so gesagt haben
  • Potential für missbräuchlichen Einsatz ist vorhanden, das muss bewusst gemacht werden
  • Besser ausbalancierte datasets und algorithm (racial profiling folge schon drüber gesprochen)
  • skeptisch bleiben, selbst GANs nicht schädlich einsetzen
  • ein wesentliches fazit ist: with great power comes great responsibility
  • Talk auf media.ccc.de: "But this politician said «xyz»!"
Boiling Mind (00:54:58)
  • Daten und wie man sie in einem Theaterstück (hier Tanztheater) einsetzen kann
  • Publikum wurde mit Sensoren ausgestattet, Armband maß den Widerstand der Haut (Aufregung), Klemme am Finger maß den Herzschlag
  • Diese Messdaten wurden visualisiert und auf der Bühne an den Wänden live dargestellt
  • Verwendet wurden LF/HF Pulsfrequenz und relative Änderung der EDA
  • Nachträglich fanden sie, dass R-R intervalls der PNN (Heart rate variability) besser gewesen wäre, sowie 'Peak detection per Minute for EDA'
  • Kleinere Werte in PNN50 sind aufregender und höhere Werte sind mehr entspannt
  • Das Publikum wurde ins Stück mit einbezogen, beispielsweise wurden anfangs Visitenkarten mit Aktionen verteilt
  • Wenn ein Mensch aus dem Publikum aktiv werden muss, hat das Auswirkungen auf seine Werte
  • Höhe Werte für EDA zeigen bestimmte Szenen die eine starke Wirkung haben
  • Hier findet eine "Augmented Feedback Loop" statt: Publikum reagiert auf Tänzer*innen, Werte des Publikums beeinflussen Musik und Licht, darauf reagieren Tänzer*innen wieder
  • Datenschutz: Publikum wurde aufgeklärt, konnte entweder "streamen" oder Daten anonym spenden
  • Die Daten können auch angefragt und benutzt werden für eigene Auswertungen
  • Fazit: Sicher ein spannendes Erlebnis!
  • Talk auf media.ccc.de: Boiling Mind
Fazit (01:02:29)
  • Helenas rC3-Fazit: Leider nicht so abtauchen können wie auf einem Congress vor Ort
  • zu Hause hat zu viel Alltag gestört, leider auch hakende Streams
  • Leider war im Vorfeld nicht klar wofür die Tickets nötig sind und ob alles klappt
  • Aber es war ein Experiment und dafür ist es ok gewesen
  • Janines rC3-Fazit: Viele waren sehr traurig, als die 2D-Welt abgeschaltet wurde
  • Es war alles aufwendig und toll gestaltet und man konnte überall rumlaufen und Dinge tun
  • Janine ist jetzt ausgebildete Maschinentherapeutin
  • Informationen und Interaktionen waren gut eingebettet und konnten ebenso entdeckt werden wie sonst auf dem Congress
  • Schöne 4 Tage mit der rC3 verbracht
  • Online Veranstaltungen werden uns jetzt vermutlich auch noch eine Weile begleiten
  • Es ist gut, dass wir Optionen haben auch jetzt noch weiter Menschen zu treffen
  • Auch wenn das nicht die realen Treffen und Eindrücke ersetzen kann, es fehlt einfach etwas
  • Und hoffentlich gibt es dann bald genug geimpfte Menschen, das alles besser wird
Nächste Folge: Künstliche Intelligenz (01:07:33)
  • Wir werden ab jetzt unsere Folgen alle 4 Wochen rausbringen, die nächste Folge am 27.02.2021
  • Unser nächstes Thema ist Künstliche Intelligenz, in der Jahresrückblicksfolge hatten wir ja schon einen kleinen Turing Test gemacht
  • Wir wollen gucken, was da weier hinter steckt und nicht über Maschinelles Lernen reden, sondern über die Frage: Können Maschinen denken?
Call to Action (01:08:57)
  • Wenn ihr uns weiter hören möchtet, folgt uns auf Twitter unter @datenleben
  • Oder besucht unsere Webseite: www.datenleben.de
  • Hinterlasst uns gerne Feedback, wir würden uns darüber sehr freuen
  • Freuen uns auch schon sehr über unsere erste 5-Sterne-Bewertung auf iTunes
  • Habt ihr Fragen oder Themen, die euch interessieren? Dann schreibt uns!
Outro (01:09:39) Schlagworte zur Folge

rC3, Chaos Communication Congress, Gendergerechte Sprache, Polizeigewalt, Wikidata, Datenguide, Deepfake, Bodyfeedback, Theater, remote Veranstaltungen

Quellen
  • Deutsche Gesellschaft für Psychologie: Automechanikerinnen und Automechaniker - Geschlechtergerechte Sprache beeinflusst kindliche Wahrnehmung von Berufen
  • Twitter, datenleben: Umfrage genderneutrale Sprache
  • taz: ZDF-Moderatorin übers Gendern
  • Deutschlandfunk: Gendern im Radio – Muss das sein?
  • Wikipedia: Chaos Computer Club (CCC)
  • Wikipedia: Chaos Communication Congress
  • https://kviapol.rub.de/
  • media.ccc.de: Körperverletzung im Amt durch Polizeibeamt*innen
  • www.wikidata.org
  • media.ccc.de: Introduction to Wikidata
  • Wikipedia: Python
  • Wikipedia: R
  • Wikidata: Query Service
  • media.ccc.de: Wikidata for (Data) Journalists
  • https://datengui.de/
  • GENESIS online
  • media.ccc.de: Datenguide: Statistiken für alle
  • media.ccc.de: Generative Adversarial Networks
  • media.ccc.de: "But this politician said «xyz»!"
  • media.ccc.de: Boiling Mind


share







 2021-01-30  1h9m