Künstliche Intelligenz (KI) entwickelt sich zum Gold-Standard in der Industrie. Durch ihre Konstanz, Genauigkeit und Effizienz ergänzen KI-basierte Techniken immer mehr das menschliche Arbeiten in der Industrie und begleiten Prozesse von der Automatisierung bis zur Qualitätssicherung. Jedoch ist eine künstliche Intelligenz immer nur genau so intelligent wie sie trainiert wurde, das heißt ein KI-System muss, wie alle intelligenten Systeme, ihre Aufgaben mit Hilfe von Trainingsdaten erst erlernen. Dazu werden neben realen Daten häufig synthetische Daten genutzt.
Trainingsdaten für KI-basierte Systeme
KI-Systeme, wie das optische Prüfsystem AI.SEE™, basieren auf selbstlernenden Deep-Learning-Modellen, welche die Zusammenhänge der verschiedenen Datensätze mithilfe modernster künstlicher neuronaler Netze erlernen. Wie ein menschliches Gehirn muss das System also erst lernen was genau es als Fehler oder Unregelmäßigkeit erkennen soll und was nicht und dabei gilt auch für die künstliche Intelligenz: üben, üben, üben!
Je mehr Erfahrung die künstliche Intelligenz hat, desto besser kann sie in der Anwendung die richtigen Entscheidungen treffen.
Al.SEE™ muss als optisches Prüfsystem in der produzierenden Industrie flexibel genug sein, um z.B. Risse oder Schweißnähte an verschiedenen Werkstoffen zuverlässig zu überprüfen. Dazu benötigt es die richtige Sensitivität, um auch kleinste Risse und Veränderungen zu detektieren und die richtige Spezifität, um Unterschiede, die nur auf den Werkstoff zurückzuführen sind, aber keine Unregelmäßigkeiten zeigen, zu erkennen.
Zum Training des Algorithmus müssen die Deep-Learning-Modelle also mit möglichst vielen Daten gefüttert werden, die alle Szenarien repräsentieren, die in der tatsächlichen Anwendung vorkommen können. Es werden also Daten benötigt, die die breite der Anwendungsfälle widerspiegeln, als auch Daten, die den Regelfall repräsentieren und sich nur durch kleinste Veränderungen im Detail unterscheiden.
Synthetische Bilddaten zum Training optischer KI-Systeme
Obwohl echte Bilddaten gute und zuverlässige Trainingsdaten für eine optische künstliche Intelligenz sind, sind diese oft sehr teuer. Produktionskosten, einseitige Perspektiven und Datenschutzbestimmungen der echten Bilder führen zu einer geringen Verfügbarkeit und hohen Kosten. Somit steht das Erstellen realer Bilder in keinem Verhältnis zu den benötigten Trainingsressourcen eines KI-basierten Systems. Hier findet sich ein großer Anwendungsbereich synthetischer Bilder wieder.
Zudem müssen AI-Systeme in der optischen Prüfung auf alle möglichen Fehler trainiert werden, um diese im Ernstfall zu erkennen. In der Realität entstehen jedoch sehr selten fehlerhafte Bauteile, in der Luftfahrt zum Beispiel nur ca. alle 12-14 Monate. Doch besonders in diesen Bereichen ist eine zuverlässige AI zur optischen Bauteilprüfung unerlässlich und muss auf solche Fehler trainiert werden. Durch das seltene Auftreten von Produktionsfehlern, gibt es also auch einen Mangel an Fehlerbildern, die für das Training optischer Prüfsysteme essenziell sind. Hier bieten synthetische Bilder, die bestimmte Fehlerausprägungen darstellen, ein wertvolles Tool.
Neue Chancen mit synthetischen Bilddaten
Neuronale Netze können nicht nur Bilddaten verarbeiten und Anomalien erkennen, sondern auch selbst künstliche (synthetische) Bilddaten generieren. Bei elunic nutzen wir CAD Daten, um neue, synthetische Daten zu generieren. Die computergestützten 3D Modelle werden verwendet und mithilfe eines GAN Algorithmus so lange trainiert, bis sie von Originaldaten nicht mehr zu unterscheiden sind. Nach diesem Fine-tuning können die synthetischen Daten gerendert werden und als Datensatz für weitere KI-basierte Prozesse wie Training oder Tests verwendet werden.
Synthetische Daten: Mithilfe von GANs von realen Daten nicht zu unterscheiden
Zur Erstellung synthetischer Bilder werden meist General Adversarial Networks (GANs) verwendet. Hierbei lernt der Algorithmus mit einem großen Datensatz die wichtigsten Strukturen und Merkmale von Bildern. Das vom sogenannten „Generator“ erzeugte Bild wird an ein zweites System dem „Diskriminator“ gesendet, der neben den synthetischen Bildern auch mit realen Bildern (sog. Originaldaten) gefüttert wird und versucht das reale Bild vom synthetischen Bild zu unterscheiden. Ziel des GAN Systems ist, das die Bilder vom Generator nicht mehr von Originaldaten zu unterscheiden sind. Hat man dies erreicht, hat man zuverlässige synthetische Daten, die weiterverwendet werden können.
Vorteile synthetischer Daten
Mit dem wachsenden Bedarf an Daten, gehören synthetische Daten zu einem der wichtigsten Themen im KI-Bereich. Nicht nur kann der Datenbedarf nicht mehr in der nötigen Geschwindigkeit real generiert werden, auch Kosten und Themen wie Datenschutz spielen bei dieser Entscheidung eine große Rolle. Ein synthetischer Datensatz kann AI-Systemen die nötigen Bilder und Informationen liefern, ohne auf Datenschutz oder Einwilligung von Urhebern achten zu müssen. Dieser neue Weg Daten zu generieren und KI-Systeme zu trainieren bringt einen entscheidenden Vorsprung für Unternehmen in der produzierenden Industrie.
Mit langjähriger Erfahrung ist elunic Spezialist beim Generieren und Implementieren synthetischer Daten und unterstützt Sie gerne auf Ihrem Weg zu den optimalen synthetischen Daten für Ihre AI.