KI – Kaum Intelligent

Zwei Freunde mit Hintergrund KI-Forschung möchten mit Mythen und Legenden zur künstlichen Intelligenz aufräumen. Dazu beleuchten Johannes und Gesina im Gespräch allgemeine und spezielle Fragen zum Thema KI.

https://kaum-intelligent.de

subscribe
share






episode 11: Wie funktioniert der YouTube-Algorithmus?


  • Gesina Schwalbe
    • Email
    • Website
    • GitHub
    • ORCiD
    • ResearchGate
    • Twitter
    • Linkedin
  • Johannes Rabold
    • Twitter
    • Website
    • Email
    • GitHub
    • ResearchGate
    • ORCiD

Es geht um den Algorithmus, mit dem YouTube die Videos auf der Startseite bzw. die Watch Next Empfehlungen bestimmt. Wir betrachten sowohl die technischen Aspekte als auch die sozialen Implikationen.

Inhalt Funktionsweise: Grundlegende Zielsetzung und Einflussfaktoren
  • Was sind Recommender Systeme (Empfehlungsdienste): Zeige einem Nutzer aus einer Auswahl die Objekte, die am relevantesten sind. Nutzt Methoden des maschinellen Lernens und des Information Retrieval.
  • Allgemeines Ziel: Glückliche User, die viel Zeit auf der Platform verbringen (z.B. um viel Werbung einblenden zu können)
  • Historie von YouTube Recommendations:
    • YouTube Gründung 2005, seit 2006 Tochtergesellschaft von Google
    • Bis 2012: Ranking nach Anzahl der Clicks (View-Count) => provoziert viel Click-Bait (reißerische Titel statt gutem Inhalt)
    • Ab 2012: Ranking nach Watch-Time => langatmige Videos, deren wichtigster Inhalt erst am Schluss kommt
    • Ab 2016 (teilweise Offenlegung in einem Whitepaper): Verwendung von Deep Neural Networks => Verwendung vieler weiterer Features
    • Bis heute: Weitere Anpassungen, um anstößige Inhalte zu reduzieren und gut kuratierte Inhalte zu fördern; s. z.B. hier und hier
Technik dahinter
  • Im Speziellen: Wie funktioniert der Youtube Algorithmus (das Whitepaper)
  • Datengetriebene Black-box (tiefe neuronale Netze) mit vielen Features
  • Welche Features sind u.a. wichtig:
    • Metadaten des Videos: Tags, Titel, Beschreibung etc.
    • Video-Performanz
    • Ähnliche User
    • Watch-Time
    • Demographie der User
  • Zweigeteilter Prozess:
    • Kandidatengenerierung: Erst Eingrenzung auf mehrere hundert Videos
      • Ziel: Vorhersage, welches Video als nächstes geschaut wird
      • Embedding von User mit Suchanfrage und Embeddings von Videos werden gematcht
    • Personalisierte Auswahl: Ranking und Fitting auf den User mit wenigen dutzend Videos
      • Weitere User- und Video-spezifische Features (Videos vom selben Channel gesehen, wann das letzte Mal etwas gesehen etc.)
      • Ranking erneut durch Matching der Embeddings
      • Hier wichtigstes Ziel: Watch-Time erhöhen
Soziale Implikationen

Was kann es für einzelne und die Gesellschaft für Probleme geben?

  • Das System ist proprietär => Keiner, insbesondere auch keine unabhängigen Stellen, kann nachschauen, ob hier alles im Lot ist!
  • Ein Recommender-System wählt Vorschläge, die „relevant“, tatsächlich aber einfach bequem für den User sind.
  • Probleme mit Bequemlichkeit:
    • Man wird in seiner eigenen Meinung bestärkt. Egal, ob ein weiterer Blick besser wäre oder nicht.
    • Einem wird möglicherweise eine „heile Welt“ vorgegaukelt.
    • Man wird nicht ermutigt, weitere Meinungen einzuholen oder sich mit weiteren Themen zu befassen.
  • Zementieren von gesellschaftlichem Bias: Es werden sehr sensible Merkmale für die Empfehlungen verwendet, z.B. Geschlecht!
  • Anstößiger, verwerflicher Inhalt, Desinformation: Wer sollte fürs Kuratieren in sozialen Netzwerken zuständig sein? Was sollte der Betreiber bestimmen und ab wann sollte eine unabhängige Stelle oder der Staat das erledigen? Wie verhindert man dabei dann staatliche Kontrolle von unabhängigen Medien?
  • Unsicherheit für Youtuber (=Personen, die über YouTube-Beiträge ihr Haupteinkommen beziehen): Guidelines zum Ranking ändern sich teilw. willkürlich; sie sollten einen klaren Einblick in Verbesserungsmöglichkeiten bekommen!
Sonstige Quellen
  • https://blog.hubspot.de/marketing/youtube-algorithmus
  • Leider haben wir kein „thissandwichdoesnotexist“ gefunden, aber es gibt ein https://thissnackdoesnotexist.com/
  • Der Film über den absoluten Durchschnitts-Bürger: https://de.wikipedia.org/wiki/K%C3%B6nig_von_Deutschland_(Film)


fyyd: Podcast Search Engine
share








 March 6, 2023  1h52m