This page in EN

Veranstaltung

Computer Vision für Mensch-Maschine-Schnittstellen [WS2024180]

Typ
Vorlesung (V)
Online
Semester
WS 20/21
SWS
4
Sprache
Deutsch
Termine
28

Dozent/en

Einrichtung

  • KIT-Fakultät für Informatik

Bestandteil von

Literatur

Weiterführende Literatur

Wissenschaftliche Veröffentlichungen zum Thema, werden auf der VL-Website bereitgestellt.

Veranstaltungstermine

  • 02.11.2020 14:00 - 15:30
  • 06.11.2020 10:00 - 11:30
  • 09.11.2020 14:00 - 15:30
  • 13.11.2020 10:00 - 11:30
  • 16.11.2020 14:00 - 15:30
  • 20.11.2020 10:00 - 11:30
  • 23.11.2020 14:00 - 15:30
  • 27.11.2020 10:00 - 11:30
  • 30.11.2020 14:00 - 15:30
  • 04.12.2020 10:00 - 11:30
  • 07.12.2020 14:00 - 15:30
  • 11.12.2020 10:00 - 11:30
  • 14.12.2020 14:00 - 15:30
  • 18.12.2020 10:00 - 11:30
  • 21.12.2020 14:00 - 15:30
  • 08.01.2021 10:00 - 11:30
  • 11.01.2021 14:00 - 15:30
  • 15.01.2021 10:00 - 11:30
  • 18.01.2021 14:00 - 15:30
  • 22.01.2021 10:00 - 11:30
  • 25.01.2021 14:00 - 15:30
  • 29.01.2021 10:00 - 11:30
  • 01.02.2021 14:00 - 15:30
  • 05.02.2021 10:00 - 11:30
  • 08.02.2021 14:00 - 15:30
  • 12.02.2021 10:00 - 11:30
  • 15.02.2021 14:00 - 15:30
  • 19.02.2021 10:00 - 11:30

Anmerkung

Methoden des Maschinellen Sehens (Computer Vision) erlauben es, in Bildern und Bildfolgen Personen, ihre Körperhaltungen, Blickrichtungen, ihre Mimik, ihr Geschlecht und Alter, ihre Identität und Handlungen automatisch zu erkennen. Für diese computerbasierte visuelle Wahrnehmung von Menschen gibt es zahlreiche Anwendungsmöglichkeiten, wie beispielsweise interaktive "sehende" Roboter, Fahrerassistenzsysteme, automatisierte Personenerkennung, oder auch die Suche in Bild- und Videoinhalten (Image Retrieval).

In dieser Vorlesung werden grundlegende und aktuelle Arbeiten aus dem Bereich des Maschinellen Sehens vorgestellt, die sich mit der Erfassung von Personen in Bildern und Bildfolgen beschäftigen.

  • Im Einzelnen werden in der Vorlesung folgende Themen besprochen:Finden von Gesichtern in Bildern
  • Anwendungen der Personenerfassung in Bildern und Bildfolgen
  • Erkennung von Personen anhand des Gesichts (Gesichtserkennung)
  • Mimikanalyse
  • Schätzen von Kopfdrehung und Blickrichtung
  • Globale und teilbasierte Modelle zur Detektion von Personen
  • Tracking in Bildfolgen
  • Erkennung von Bewegungen und Handlungen
  • Gestenerkennung

Im Rahmen der Vorlesung werden außerdem zwei bis drei Programmierprojekte zu ausgewählten Vorlesungsthemen angeboten, die von den Teilnehmern in kleinen Teams bearbeitet werden sollen. Hierdurch kann das in der Vorlesung erlernte Wissen vertieft und praktisch angewandt werden.

Lehrinhalt:

In dieser Vorlesung werden aktuelle Arbeiten aus dem Bereich der Bildverarbeitung vorgestellt, die sich mit der visuellen Perzeption von Personen für die Mensch-Maschine Interaktion befassen. In den einzelnen Themengebieten werden verschiedene Methoden und Algorithmen, deren Vor- und Nachteile, sowie der State of the Art diskutiert:

  • Lokalisierung und Erkennung von Gesichtern
  • Erkennung der Mimik (facial expressions)
  • Schätzen von Kopfdrehung und Blickrichtung
  • Lokalisation und Tracking von Personen
  • Tracking und Modellierung von Körpermodellen ('articulated body tracking')
  • Gestenerkennung
  • Audio-visuelle Spracherkennung
  • Multi-Kamera Umgebungen
  • Tools und Bibliotheken

Erfolgskontrolle:

Die Erfolgskontrolle erfolgt in Form einer schriftlichen Prüfung (im Umfang von i.d.R. 60 Minuten) nach § 4 Abs. 2 Nr. 1 SPO.
Abhängig von der Teilnehmerzahl wird sechs Wochen vor der Prüfungsleistung angekündigt (§ 6 Abs. 3 SPO), ob die Erfolgskontrolle

  • in Form einer mündlichen Prüfung nach § 4 Abs. 2 Nr. 2 SPO oder
  • in Form einer schriftlichen Prüfung  nach § 4 Abs. 2 Nr. 1 SPO

stattfindet.