Deutsche Nachrichtenveranstaltungen finden statt

WiMi entwickelte ein neuartiges Bildklassifizierungssystem basierend auf einem Modellnetzwerk eines Systems für kontinuierliches Multi-Scale-Feature-Learning

BEIJING, 21. August 2023 – WiMi Hologram Cloud Inc. (NASDAQ: WIMI) (“WiMi” oder das “Unternehmen”), ein führender globaler Anbieter von Hologramm-Augmented-Reality-(“AR”)-Technologie, gab heute bekannt, dass ein neuartiges Bildklassifizierungssystem auf der Grundlage eines Modellnetzwerks eines Systems für kontinuierliches Multi-Scale-Feature-Learning entwickelt wurde, das gut gestaltete Vorverarbeitungs- und Modellierungsarchitekturen verwendet. Das Modell profitiert von der Multi-Scale-Feature-Extraktion und dem kontinuierlichen Feature-Learning und erreicht im Vergleich zu den bestehenden Methoden eine bessere Leistung in Bezug auf Geschwindigkeit und Genauigkeit, indem es verschiedene Feature-Maps mit unterschiedlicher Wahrnehmung verwendet.

Ein Modellnetzwerk für kontinuierliches Multi-Scale-Feature-Learning von WiMi verwendet einen kontinuierlichen Feature-Learning-Ansatz basierend auf der Verwendung verschiedener Feature-Maps mit unterschiedlichen rezeptiven Feldern, um ein schnelleres Training/Inferenz und höhere Genauigkeit zu erreichen. Das Systemnetzwerk enthält drei wichtige Schritte, nämlich Daten-Vorverarbeitung, Datenlernen und Inferenz. In der Phase der Daten-Vorverarbeitung werden die Datensatzbilder als Tensoren dargestellt, was die Berechnung während des Trainings einfacher und effizienter macht. In der Lernphase werden nützliche Merkmale der Bilder mithilfe eines Modells extrahiert, das auf kontinuierlichem Multi-Scale-Feature-Learning basiert. In der Inferenzphase kann nach Abschluss des zweiten Schritts des vorgeschlagenen Systems und nach Erhalt des trainierten Modells das Bild mithilfe des Modells klassifiziert werden.

In der Phase der Daten-Vorverarbeitung werden die Datensatzbilder als Tensoren für nachfolgende Berechnungen und Verarbeitungen dargestellt. Dies macht die Berechnung während des Trainings einfacher und effizienter. Der Prozess der Vorverarbeitung umfasst die Normalisierung, Skalierung und Zuschneidung der Bilder. Der Zweck dieser Schritte ist es, die Daten während des Trainingsprozesses benutzerfreundlicher und effizienter zu machen und die Genauigkeit und Zuverlässigkeit der nachfolgenden Verarbeitung zu verbessern. Dieser Prozess soll sicherstellen, dass die Eingabedaten korrekt verarbeitet werden und vom Modell korrekt erkannt und gelernt werden können.

In der Lernphase verwendet dieses Netzwerksystem von WiMi eine kontinuierliche Multi-Scale-Feature-Learning-Methode, um nützliche Merkmale aus Bildern zu extrahieren. Die Grundidee der Methode besteht darin, das Bild in unterschiedliche Skalen zu zerlegen und dann die entsprechenden Merkmale auf jeder Skala zu extrahieren. Bildinformationen auf unterschiedlichen Skalen enthalten unterschiedliche Merkmalsinformationen, zum Beispiel sind in Bildern mit niedriger Auflösung die Detailinformationen verschwommen, aber die globalen Informationen und Konturinformationen des Bildes sind immer noch gut erhalten. Daher können die Robustheit und Generalisierungsfähigkeit des Modells durch Multi-Scale-Feature-Extraktion verbessert werden.

Konkret besteht die Netzwerkarchitektur aus einer Reihe von Feature-Extraktionsmodulen und Feature-Fusionsmodulen. Das Feature-Extraktionsmodul verwendet eine Reihe von Faltungslayern, Pooling-Layern und Aktivierungsfunktionen, um Feature-Maps auf unterschiedlichen Skalen zu extrahieren. Das Feature Fusion Module wird verwendet, um die Feature-Maps auf unterschiedlichen Skalen zu fusionieren, um eine umfassendere und repräsentativere Feature-Repräsentation zu erhalten. Das Feature Fusion Module verwendet eine spezielle Methode, die die Feature-Maps unterschiedlicher Skalen verbindet und dann die Features durch einige Faltungslayern und Aktivierungsfunktionen fusioniert. Der Vorteil dieser Methode ist, dass Informationsverluste vermieden werden können und die Feature-Informationen unterschiedlicher Skalen voll ausgeschöpft werden können.

In der Inferenzphase kann WiMi ein trainiertes Modell verwenden, um neue Bilder zu klassifizieren. Konkret geben wir ein Testbild in das Modell ein und bestimmen dann die Klasse des Bildes anhand der vom Modell ausgegebenen Vorhersageergebnisse. Um die Genauigkeit und Generalisierungsfähigkeit des Modells zu verbessern, können wir in der Testphase Datenverstärkungsoperationen wie zufällige Drehung, Zuschneidung und Spiegelung auf die Eingabebilder anwenden, um mehr Bildvariationen zu simulieren. In diesem Schritt können wir verschiedene Techniken und Algorithmen verwenden, um die Genauigkeit und Effizienz des Modells zu optimieren. Zum Beispiel können wir Convolutional Neural Networks (CNN) verwenden, um Merkmale aus einem Bild zu extrahieren, oder Recurrent Neural Networks (RNN), um Sequenzdaten zu verarbeiten.

Die Stärke dieses Lernsystemmodellnetzwerks ist seine Fähigkeit, gleichzeitig Bilder auf unterschiedlichen Skalen zu verarbeiten und nützliche Merkmale daraus zu extrahieren. Dies macht es an verschiedene Anwendungsszenarien anpassbar und ermöglicht bessere Ergebnisse in Bezug auf effiziente Berechnung und Generalisierung kleiner Skalen. Darüber hinaus ist die Methode auch effizient und leichtgewichtig, um nützliche Merkmale angemessen zu lernen und Unteranpassungsprobleme zu vermeiden. Nach einer Reihe von Experimenten erreicht die Methode signifikante Verbesserungen in Bezug auf Genauigkeit und Effizienz. Im Vergleich zu den bestehenden State-of-the-Art-effizienten Netzwerken ist die Methode in Bezug auf die Genauigkeit vergleichbar, aber in Bezug auf Effizienz und Geschwindigkeit optimiert. Die Methode erreicht auch die besten Ergebnisse in Bezug auf Genauigkeits- und Effizienz-Trade-off.

Darüber hinaus hat die Bilderkennungsklassifizierungsmethode dieses Lernnetzwerks einen breiten Marktwert und eine große Bedeutung. Zunächst kann sie breit in der Computer Vision eingesetzt werden, wie z. B. automatisiertes Fahren, Sicherheitsüberwachung, medizinische Diagnostik, Smart Home und so weiter. Zum Beispiel benötigen Fahrzeuge im Bereich des automatisierten Fahrens eine schnelle und genaue Erkennung von Straßenschildern, sich bewegenden Fahrzeugen und Fußgängern. Im Bereich der medizinischen Diagnostik können kontinuierliche Multi-Scale-Feature-Learning-Netzwerke Ärzte bei der automatischen Erkennung von Läsionen und Krankheitsmarkern unterstützen, um die Diagnosegenauigkeit und -effizienz zu verbessern. Im Bereich Smart Home können Menschen die Technologie nutzen, um intelligente Türschlösser und Smart-Home-Geräte für einen smarteren Lebensstil zu entwickeln.

Zweitens adressiert dieses System von WiMi einige der Branchenschmerzpunkte und Schwierigkeiten im Bereich Computer Vision. Zum Beispiel ist es im traditionellen Computer Vision Bereich oft notwendig, mehrere manuell entworfene Merkmale und Algorithmen zu verwenden, um Objekte in Bildern zu erkennen, und diese manuell entworfenen Merkmale und Algorithmen sind oft nicht generisch, wenn sie auf neue Datensätze angewendet werden, und müssen neu entworfen und optimiert werden, was zu einer großen Menge verschwendeter Zeit und Ressourcen führt. Im Gegensatz dazu können Bilderkennungsklassifizierungsmethoden mit kontinuierlichen Multi-Scale-Feature-Learning-Netzwerken automatisch Merkmale aus Bildern auf mehreren Skalen extrahieren und so die mühsamen und nicht generalisierbaren Probleme manueller Gestaltung vermeiden.

Darüber hinaus löst diese Bilderkennungsklassifizierungsmethode das Problem begrenzter Datenmengen und begrenzter Rechenressourcen im Bereich Computer Vision. Aufgrund der begrenzten Datenmenge neigen traditionelle Deep Learning Modelle zu Überanpassungsproblemen, während kontinuierliche Multi-Scale-Feature-Learning-Netzwerke die begrenzten Daten besser nutzen können, um so eine Überanpassung zu vermeiden. Darüber hinaus erfordern traditionelle Deep Learning Modelle aufgrund begrenzter Rechenressourcen einen großen Rechenaufwand für Training und Inferenz, während das leichtgewichtige Design kontinuierlicher Multi-Scale-Feature-Learning-Netzwerke den Verbrauch an Rechenressourcen reduzieren kann, ohne die Genauigkeit zu beeinträchtigen.

Die kontinuierliche Multi-Scale-Feature-Learning-Netzwerkmethode von WiMi für die Bilderkennungsklassifizierung hat einen wichtigen Marktwert und eine große Bedeutung. Sie ist in der Lage, die Branchenschmerzpunkte und Schwierigkeiten bei der Bildklassifizierung zu lösen und eine bessere Lösung für die Anwendung der Bildklassifizierungstechnologie bereitzustellen. In Zukunft wird erwartet, dass dieses systematische Modellnetzwerk in mehr Bereichen eingesetzt wird, um eine effizientere, genauere und intelligentere Bildklassifizierung zu erreichen.

Über WIMI Hologram Cloud

WIMI Hologram Cloud, Inc. (NASDAQ: WIMI) ist ein umfassender technischer Lösungsanbieter für Hologramme in den professionellen Bereichen, darunter holographische AR-Automobil-HUD-Software, 3D-holographischer Pulse LiDAR, Kopf montiertes Light Field Holographic Equipment, Holographic Semiconductor, Holographic Cloud Software, Holographic Car Navigation und andere. Seine Dienstleistungen und holografischen AR-Technologien umfassen holographische AR-Automobilanwendungen, 3D-holographische Pulse LiDAR-Technologie, holographische Vision Halbleitertechnologie, holographische Softwareentwicklung, holographische AR-Werbetechnologie, holographische AR-Unterhaltungstechnologie, holographisches ARSDK-Payment, interaktive holographische Kommunikation und andere holographische AR-Technologien.

Safe Harbor-Erklärungen

Diese Pressemitteilung enthält “zukunftsgerichtete Aussagen” im Sinne des Private Securities Litigation Reform Act von 1995. Diese zukunftsgerichteten Aussagen können an Begriffen wie “wird”, “erwartet”, “antizipiert”, “zukünftig”, “beabsichtigt”, “plant”, “glaubt”, “schätzt”, “kann”, “sollte”, “würde”, “prognostiziert”, “potenziell”, “fortsetzen” und ähnlichen Ausdrücken erkannt werden. Diese zukunftsgerichteten Aussagen beruhen auf den aktuellen Erwartungen des Unternehmens und unterliegen erheblichen Risiken und Ungewissheiten, die dazu führen können, dass die tatsächlichen Ergebnisse erheblich von den in diesen zukunftsgerichteten Aussagen zum Ausdruck gebrachten oder implizierten Ergebnissen abweichen.