Autonome Fahrzeuge, die im Graupelschauer stehen bleiben. Sprachgesteuerte Smart-Home-Assistenten, die nur männliche Stimmen verstehen. Trotz Innovationsschub und verfeinerter Technik steht das maschinelle Lernen (ML) oft vor unerwarteten Herausforderungen. Es wird viel darüber geschrieben und diskutiert, was schlechte Datensätze im Machine Learning bewirken können. Doch was ist eigentlich ein guter Datensatz?
Daniel Kondermann stellte diese pragmatische Frage schon vor über zehn Jahren. Der Forscher im Bereich Computervision an der Universität Heidelberg hat sich auf die Qualitätssicherung von Datensätzen spezialisiert und ein System entwickelt, das hochwertige Datensätze generiert. Im Gespräch mit der Autorin erläutert er auch, wie dieses System einen Beitrag dazu leisten könnte, eine ethisch verantwortungsvolle, sicherere und transparente Anwendung von KI- und ML-Systemen zu erreichen. Um die Relevanz dieser Frage zu verstehen, gilt es zuerst genauer zu betrachten, was das maschinelle Lernen derzeit hemmt.