Zielgruppen
- Data Scientists in Forschung und Industrie
Ihre Anforderungen
Sie haben Daten und brauchen zunächst einen unvoreingenommenen Zugang zu diesen. Sie fragen sich: “Habe ich genug Daten?”, “Wie ist die Datenqualität?”, “Helfen mir die Daten bei meiner Aufgabe?”Unser Angebot
Unüberwachte Lernverfahren können dazu genutzt werden, die Komplexität der Daten abzuschätzen und diese möglichst kompakt z.B. über geeignete Repräsentaten zu erfassen. Clusterverfahren oder Ansätze zur Dimensionsreduktion bieten sich hier an.
Wir bieten sowohl einfache als auch komplexe Verfahren an, um ein Verständnis für die eigenen Daten aufzubauen. Dazu gehören klassische Verfahren wie das k-means clustering, mean shift, eine PCA oder einfache Autoencoder.
Je nach Fragestellung können auch dünnbesetze Lösungen optimiert werden oder Meta-Informationen in den Aufbau der Repräsentationen eingebaut werden. Desweiteren bieten wir Lösungen für die Anomalie-Detektion an, z.B. basierend auf Normalizing Flows.
Nutzungsvoraussetzungen
Grundlegendes Verständnis zur StatistikErfolgsstories
Verschiedene Komponenten wurden bereits erfolgreich publiziert:- https://www.tnt.uni-hannover.de/papers/data/1553/CMS.pdf
- https://arxiv.org/abs/2008.12577
- https://arxiv.org/abs/2110.02855
- https://github.com/creinders/ClusteringAlgorithmsFromScratch
- https://github.com/marco-rudolph/differnet
- https://github.com/marco-rudolph/cs-flow