Classification des modèles de défaillance de carte de tranche à l'aide d'une transformation géométrique
Rapports scientifiques volume 13, Numéro d'article : 8127 (2023) Citer cet article
349 accès
1 Altmétrique
Détails des métriques
La classification des modèles de défauts de carte de tranche est essentielle dans les processus de fabrication de semi-conducteurs pour augmenter le rendement et la qualité de la production en fournissant des informations clés sur les causes profondes. Cependant, le diagnostic manuel par des experts de terrain est difficile dans les situations de production à grande échelle, et les cadres d'apprentissage en profondeur existants nécessitent une grande quantité de données pour l'apprentissage. Pour résoudre ce problème, nous proposons une nouvelle méthode invariante de rotation et de retournement basée sur la règle d'étiquetage selon laquelle le modèle de défaut de carte de plaquette n'a aucun effet sur la rotation et le retournement des étiquettes, obtenant des performances discriminantes de classe dans des situations de données rares. La méthode utilise un squelette de réseau neuronal convolutif (CNN) avec une transformation de Radon et un retournement du noyau pour obtenir une invariance géométrique. La fonction Radon sert de pont équivariant en rotation pour les CNN invariants en traduction, tandis que le module de retournement du noyau permet au modèle d'être invariant en retournement. Nous avons validé notre méthode par de nombreuses expériences qualitatives et quantitatives. Pour l'analyse qualitative, nous suggérons une propagation de la pertinence par couche multi-branches pour expliquer correctement la décision du modèle. Pour l'analyse quantitative, la supériorité de la méthode proposée a été validée par une étude d'ablation. De plus, nous avons vérifié les performances de généralisation de la méthode proposée aux invariants de rotation et de retournement pour les données hors distribution en utilisant des ensembles de tests augmentés de rotation et de retournement.
La classification des modèles de cartes de bacs à tranches attire l'attention en tant qu'approche critique pour augmenter le rendement et la qualité des processus de fabrication de semi-conducteurs en permettant l'analyse des causes profondes (RCA)1,2. À mesure que les puces à circuit intégré (CI), qui sont composées de circuits électroniques qui permettent les fonctions souhaitées dans divers produits électriques, diminuent continuellement en taille, leur processus de fabrication devient plus sophistiqué, ce qui rend la cause des défauts du processus plus difficile à analyser3. À une étape ultérieure du processus de production de semi-conducteurs, avant le conditionnement, différents tests électriques et thermiques sont entrepris pour évaluer si chaque puce est normale au niveau de la puce de tranche en binaire. Ensuite, les défauts sont affichés puce par puce sur la plaquette, ce qui forme un motif de défauts. Étant donné que ce modèle de défaut est le résultat final de l'ensemble de la procédure, il est possible d'analyser la corrélation entre le modèle de défaut et l'historique et les détails du processus, permettant l'ACR dans le processus. Par conséquent, la classification des modèles de défauts de la carte des plaquettes est particulièrement importante dans ce domaine car elle est fortement liée à l'amélioration de la qualité que l'industrie des semi-conducteurs vise tout en augmentant le rendement de production.
En plus de la classification des défauts basée sur des modèles, il y a eu une demande croissante pour l'automatisation du processus de classification. Le processus d'étiquetage du motif de carte de plaquette est directement mené par des experts dans le domaine, ce qui demande beaucoup de main-d'œuvre et de coûts, et les performances de diagnostic varient en fonction des ingénieurs. Des recherches récentes sur l'étiquetage automatisé à l'aide du modèle de classification de cartes de plaquettes ont été menées en raison des capacités d'automatisation supérieures du modèle de classification basé sur les données dans une variété de secteurs. Les approches existantes peuvent être classées en deux catégories en fonction du mécanisme d'inférence basé sur les données : (1) basé sur l'apprentissage automatique et (2) basé sur l'apprentissage en profondeur.
Les approches basées sur l'apprentissage automatique pour la classification des modèles de défauts de tranche utilisent une variété de modèles de prédiction pour extraire des caractéristiques discriminantes de classe basées sur plusieurs caractéristiques artisanales dérivées de la carte de tranche. Yuan et al.4 ont proposé la classification des modèles de défauts spatiaux à l'aide du regroupement des vecteurs de support et de la méthode bayésienne. Wu et al.5 ont proposé une méthode basée sur la machine à vecteurs de support (SVM) utilisant un ensemble de caractéristiques Radon et invariantes à l'échelle. Il a démontré que les caractéristiques basées sur le radon peuvent être utilisées pour acquérir une réponse équivariante en rotation. Yu et Lu6 ont proposé l'utilisation d'analyses discriminantes linéaires locales et non locales conjointes pour la détection et la reconnaissance des défauts de carte de plaquette sur la base de plusieurs caractéristiques, y compris les caractéristiques géométriques et Radon. Saqlain et al.7 ont proposé un classificateur d'ensemble votant utilisant diverses fonctionnalités, y compris les fonctionnalités de Radon. Divers modèles utilisant des fonctionnalités utiles ont été activement examinés pour ces méthodes basées sur la connaissance du domaine; cependant, il existe une limitation en termes de performances d'inférence en raison de la faible profondeur des modèles basés sur l'apprentissage automatique.
À mesure que la profondeur du modèle d'inférence augmente en raison du développement des ressources informatiques, les méthodes basées sur l'apprentissage en profondeur ont été activement étudiées pour la classification des modèles de défauts de tranche, car elles peuvent automatiquement apprendre des caractéristiques significatives à partir de données brutes sans intervention d'experts, ce qui permet d'améliorer les performances de classification des modèles. Cette méthode basée sur l'apprentissage en profondeur suit deux étapes : premièrement, le cadre d'apprentissage en profondeur est simplement appliqué au problème de modèle de défaut de carte de plaquette ; deuxièmement, les préoccupations pratiques, telles que la rareté des données et l'efficacité de la mémoire, sont abordées. En ce qui concerne le premier, les premières recherches ont adopté des modèles de réseau de neurones à convolution (CNN), qui montrent des performances exceptionnelles parmi les modèles d'apprentissage en profondeur dans la classification des images, pour la classification des cartes de plaquettes8,9. Kyeong et al.10 ont proposé des modèles de défauts de type mixte dans les cartes de bacs à tranches en utilisant plusieurs modèles CNN. Yu et al.11 ont proposé deux étapes pour reconnaître et classer les modèles de cartes de plaquettes. Cependant, l'obtention de suffisamment de données de cartographie de tranches étiquetées propres et de haute qualité est souvent une contrainte tout au long du processus de fabrication ; par conséquent, un modèle incluant des approches supplémentaires au modèle CNN traditionnel est nécessaire. Concernant ce dernier, plusieurs études ont proposé des modèles basés sur le fait que l'étiquette n'est pas affectée par la rotation et le retournement, selon la règle d'étiquetage prédéfinie de la carte de plaquette. Kang et al.12 ont proposé une méthode d'augmentation de données pour apprendre la représentation invariante en rotation et en retournement par augmentation le long d'une direction d'angle discrète. Kahng et al.13 ont proposé un apprentissage auto-supervisé pour la représentation invariante de prétexte, qui inclut l'invariance de rotation dans le contexte d'augmentation de données. En conséquence, il a été possible d'obtenir des performances de classification élevées dans des situations de données limitées. Cependant, ces méthodes proposées précédemment ont une limitation car elles n'intègrent pas directement la rotation et l'invariance de retournement dans l'architecture du modèle, ce qui signifie que la capacité du modèle à reconnaître ces invariances n'est pas spécifiquement intégrée à sa conception. Au lieu de cela, ces méthodes reposent sur l'augmentation des données et des paramètres supplémentaires, qui peuvent être inefficaces et insuffisants pour résoudre les problèmes d'efficacité de la mémoire. Cela a déjà été noté pour les CNN à rotation variable dans le domaine de la vision par ordinateur, comme discuté dans "Travaux connexes".
Dans cet article, nous proposons une nouvelle méthode de classification des modèles de défauts de plaquette qui est invariante à la rotation et au retournement. Compte tenu des variations d'orientation dans les modèles de défauts de plaquette dues aux processus de fabrication et à l'équipement, l'obtention d'une invariance de rotation et de retournement devient cruciale pour une classification précise et robuste. De plus, en incorporant ces invariances dans la méthode de classification, notre approche peut extraire efficacement des caractéristiques pertinentes à partir de données limitées, contribuant ainsi à atténuer les problèmes de rareté des données. Pour obtenir une invariance de rotation et de retournement, nous utilisons les traits équivariants des caractéristiques de Radon, une fonctionnalité artisanale précédemment utilisée dans l'apprentissage automatique, dans le cadre CNN. De plus, nous obtenons une invariance inversée en concevant des noyaux au sein du réseau, minimisant ainsi la dépendance à l'augmentation des données. Pour valider notre modèle, nous effectuons des analyses qualitatives et quantitatives. Pour l'analyse qualitative, nous introduisons la méthode de propagation de la pertinence par couche multi-branches (LRP multi-branches) pour interpréter les décisions du modèle, spécialement conçue pour les modèles avec des structures multi-branches comme notre module de retournement du noyau. Nous démontrons l'impact individuel de la transformation du radon et du retournement du noyau à travers des évaluations qualitatives et quantitatives à l'aide d'une étude d'ablation. Nous évaluons également les performances de généralisation invisibles de notre modèle sous rotation et renversons l'ensemble de données augmentées.
Les CNN possèdent intrinsèquement une forte capacité à apprendre des fonctionnalités invariantes à la traduction grâce à des opérations de partage de poids et de mise en commun de la traduction. Cependant, la réalisation d'autres formes d'invariance spatiale, telles que la rotation et le retournement, reste une limitation du cadre CNN. De nombreuses études ont été menées pour relever ces défis en (1) augmentant les caractéristiques d'une image d'entrée avec plusieurs copies transformées et (2) en codant l'invariance de transformation souhaitée pour le CNN à l'aide de modules spécifiques pouvant être formés au sein du réseau.
Le premier peut être décomposé en augmentation des données d'entrée et en augmentation des fonctionnalités par les filtres internes du réseau. Dans de nombreuses études antérieures, les données d'entrée ont été directement augmentées pour diverses applications. Laptev et al.14 ont proposé une couche de mise en commun invariante de transformation (regroupement TI) prenant des caractéristiques invariantes de transformation hautement activées par mise en commun maximale vers la couche entièrement connectée, extraite sur un CNN à poids partagé pour chaque entrée basée sur l'ensemble de données d'entraînement augmenté en rotation . Cheng et al.15 ont proposé une méthode similaire, le CNN invariant en rotation (RICNN), qui entraîne les CNN existants en augmentant par rotation les échantillons d'entraînement pour la tâche de détection d'objet. Cheng et al.16 ont proposé un CNN invariant en rotation et discriminant pour les pêcheurs (RIFD-CNN), utilisant également la stratégie d'augmentation des données comme RICNN, mais en ajoutant une couche discriminante pour Fisher. Cependant, l'augmentation directe des données d'entrée a une limitation critique qui nécessite fondamentalement une taille de mémoire et une capacité de réseau plus élevées pour obtenir une rotation plus généralisable. Pour cette raison, l'augmentation des fonctionnalités par des filtres internes du réseau a récemment attiré une attention considérable dans une variété de méthodes. Dieleman et al.17 ont proposé la structure à branches multiples d'un CNN pour extraire différents points de vue pour chaque image augmentée. Ensuite, Dieleman18 a étendu ce concept en effectuant diverses opérations sur les symétries cycliques. Cohen et al.19 ont proposé un CNN équivariant de groupe basé sur la théorie des groupes, utilisant un groupe de symétrie et une opération de mise en commun sur le groupe. Marcos et al.20 ont suggéré d'incorporer explicitement la méthode d'invariance de rotation dans le modèle en associant les poids des groupes de filtres à diverses copies tournées du filtre canonique du groupe. Gao et al.21 ont proposé un ensemble de méthodes de rotation et de retournement du noyau pour obtenir une invariance de rotation et de retournement dans un CNN. En résumé, la méthode d'augmentation des caractéristiques suit la structure d'échantillonnage de plusieurs branches pour la variation des données au sein du réseau, et la principale limitation de ceci est la relation de compromis entre la généralisation de la variation des données et le nombre de branches.
Le deuxième travail est l'utilisation de certains modules entraînables à l'intérieur d'un CNN pour coder l'invariance de transformation requise pour le CNN. Worrall et al.22 ont proposé un réseau harmonique qui atteint l'invariance de rotation en remplaçant les filtres CNN réguliers par des harmoniques circulaires, renvoyant ainsi une réponse et une orientation maximales. Jaderberg et al.23 ont proposé le réseau de transformateurs spatiaux (STN), qui utilise des modules apprenables, permettant explicitement la manipulation spatiale des données d'entrée pour réduire les variations de pose dans les couches suivantes du réseau. Esteves et al.24 ont suggéré un réseau de transformateur polaire (PTN), qui est une version étendue du STN combinant des représentations de coordonnées canoniques. Dai et al.25 ont proposé un CNN déformable avec une convolution déformable et un pooling RoI basé sur l'idée d'augmenter les emplacements d'échantillonnage spatial dans les modules. Ces travaux ont des contraintes en ce sens qu'ils nécessitent non seulement des paramètres entraînables supplémentaires pour des modules supplémentaires, mais nécessitent également une structure complexe pour s'adapter à un CNN.
Dans cette étude, nous proposons une nouvelle approche CNN invariante de rotation et de retournement pour classer les modèles de défauts de carte de plaquette, en tenant compte du défi de la rareté des données. Pour y parvenir, nous suggérons d'incorporer des fonctionnalités artisanales dans un cadre d'apprentissage en profondeur. Plus précisément, nous utilisons la propriété d'équivariance de rotation de la fonction Radon, une fonction artisanale couramment utilisée dans le contexte d'apprentissage automatique précédent pour la tâche de classification des plaquettes, pour obtenir l'invariance de rotation dans le cadre CNN. De plus, nous obtenons l'invariance de retournement en introduisant un module de retournement du noyau avec seulement une structure à deux branches, qui apprend la variation des données des copies retournées produites par chaque branche. Il convient de noter que notre méthode atteint l'invariance de retournement dans toutes les directions en la sécurisant en combinaison avec l'invariance de rotation, en utilisant la fonction d'équivariance en rotation et les branches minimales du noyau retourné. Cette approche permet des représentations plus compactes et efficaces, conduisant potentiellement à de meilleures performances et à des temps de formation réduits par rapport aux méthodes basées sur l'augmentation des données.
Pour faciliter la compréhension de l'énoncé du problème, il est essentiel de comprendre d'abord les concepts d'équivariance et d'invariance. Étant donné une fonction de mappage \(\Phi\), une entrée \(X\) d'un ensemble d'entrées {\({X}_{i}\)} et un groupe \(G\), nous appelons \( \Phi\) équivariant sous \({T}_{1}\in G\) si la transformation de l'entrée est liée à une transformation \({T}_{2}\in G\) de la sortie, comme indiqué dans l'éq. (1). Inversement, \(\Phi\) est invariant sous \(T\) s'il est indépendant de la relation de transformation dans le domaine de sortie, comme exprimé dans l'Eq. (2).
Pour expliquer clairement le mécanisme proposé d'obtention de l'invariance de rotation et de retournement, nous avons formulé le principe de l'approche proposée comprenant la transformée de Radon, le retournement du noyau et le module dorsal CNN. Les données d'image du motif de défaut de plaquette et son jeu d'étiquettes existent sous la forme \(\left({X}_{i}, {y}_{i}\right)\), les transformations géométriques sont désignées par translation : \({T} _{T}\) rotation : \({T}_{R}\) , retournement : \({T}_{F}\), et chaque groupe de chaque transformation est noté \({G}_{ T}, {G}_{R},\) et \({G}_{F}\). La fonction de règle d'étiquetage \(({\Phi }_{label}\)) est donnée selon l'Eq. (3) lorsque \(T={T}_{R}\cdot {T}_{F}={T}_{F}{\cdot T}_{R}\) dans \({G}_ {R}\cup {G}_{F}\), où \({T}_{R}\cdot {T}_{F}\) représente la composition de la fonction de \({T}_{R}\ ) et \({T}_{F}\), et notre objectif est de construire un modèle qui se rapproche de cette fonction :
Le modèle CNN (\({\Phi }_{CNN})\) que nous utilisons pour l'inférence d'étiquette a la capacité inhérente d'apprendre des caractéristiques invariantes à la traduction, présentant les caractéristiques suivantes :
Cependant, le modèle CNN n'est pas invariant en rotation :
Pour fournir un contexte pour Eq. (5), soit \({T}_{R}\cdot {X}_{i}\) représenter l'application de la transformation de rotation \({T}_{R}\) à l'entrée \({X }_{je}\). Avec cette compréhension, nous pouvons maintenant expliquer que notre modèle utilise la fonction de cartographie équivariante de rotation Radon transform \(({\Phi }_{Radon})\) comme étape intermédiaire pour remédier au manque d'invariance de rotation dans le modèle CNN.
En conséquence, nous avons :
Pour notre modèle proposé, nous visons à atteindre à la fois l'invariance de rotation et de retournement. Pour remédier au manque d'invariance de retournement, nous incorporons le module kernel flip (KF) dans l'architecture CNN :
La symétrie inversée de la carte de tranche est préservée ici en modifiant l'axe d'inversion de \(\uppi\)/2 pour tenir compte de l'effet de la caractéristique Radon :
En combinant les transformations de rotation et de retournement, notre modèle peut intrinsèquement tenir compte de toutes les orientations de retournement possibles. Selon la théorie des groupes26, l'union des groupes rotation et flip reste la même quelle que soit l'orientation de l'axe flip :
En conséquence, notre modèle peut extraire efficacement l'invariance de rotation et de retournement, en tenant compte de toutes les transformations de rotation et de retournement possibles, tout en utilisant le nombre minimal de branches de noyau retournées. Notre méthode proposée est décrite en détail dans la section suivante.
La méthode d'apprentissage de représentation invariante en rotation et en retournement proposée comprend deux modules principaux et un squelette CNN, comme illustré à la Fig. 1. Initialement, le module invariant en rotation de Radon transforme les cartes de plaquettes en images de tomographie, convertissant la rotation en translation. Par la suite, un ensemble de fonctionnalités inversées est obtenu via deux branches d'opérations d'inversion du noyau. En utilisant l'opération max-out sur les fonctionnalités hautement activées parmi la paire d'ensembles de fonctionnalités inversées, le CNN dorsal, souvent appelé invariant de traduction en raison de sa capacité à acquérir des fonctionnalités invariantes de traduction, apprend une représentation discriminante qui capture le caractéristiques d'étiquette de plaquette grâce à des caractéristiques équivariantes de rotation et équivariantes de retournement.
Présentation de notre méthode. Supérieur : l'architecture de modèle proposée comprend un module de transformation de Radon et de retournement de noyau pour acquérir des caractéristiques de rotation et d'équivariance de retournement, suivi d'un classificateur basé sur le CNN de base invariant de traduction. En bas : la méthode LRP multi-branches pour la structure multi-branches induite par le retournement du noyau, qui est utilisée pour interpréter les prédictions du modèle. Les images de carte de plaquette et de carte thermique ont été visualisées à l'aide de Python 3.8.4 et de l'ensemble de données de plaquette WM-811K publié, disponible à l'adresse http://mirlab.org/dataSet/public/. Les transformées de radon et de radon inverse ont été réalisées avec la bibliothèque d'images scikit version 0.20.0, tandis que la carte thermique LRP a été obtenue à l'aide de notre méthode LRP multi-branches proposée.
Notre méthode proposée adopte la fonction Radon comme représentation d'entrée en raison de sa caractéristique de rotation équivariante par rapport à la carte de plaquette. La transformation du radon est une méthode pour acquérir une tomographie sinusoïdale \({P}_{\theta }\left(r\right)\) par projection d'image pour la rotation \(\theta\). La transformée de Radon est une projection vers l'avant pour obtenir une tomographie \({P}_{\theta }\left(r\right)\). Lorsque f(x,y) est une image originale, la fonction de transformée de Radon est donnée par,
La projection ci-dessus convertit l'impact de la rotation de l'image d'origine en une translation de la fonction Radon. En comparant les premières lignes des Fig. 2a, b, nous pouvons reconnaître que la rotation de la carte de plaquette d'origine correspond à la translation de la fonction Radon. En conséquence, la transformée de Radon fonctionne comme un pont équivalent à la rotation, permettant l'utilisation d'un modèle de squelette CNN invariant en translation pour obtenir une représentation invariante en rotation. De plus, en comparant les deuxièmes lignes des Fig. 2a, b, nous pouvons voir que le retournement vertical sur la carte de tranche correspond à un retournement horizontal sur la fonction Radon. Cela implique que l'équivariance de retournement de la fonction Radon est intrinsèquement garantie comme étant une équivariance de retournement pour la carte de tranche, compte tenu du changement \(\uppi /2\) de l'axe de retournement.
( a ) Illustration d'exemples de rotation et de retournement pour les cartes de tranches de classe Edge-loc de WM-811k et ( b ) les transformées de Radon correspondantes pour chaque carte de tranches. Toutes les images de cette figure ont été visualisées à l'aide de Python 3.8.4. Les transformations de Radon ont été réalisées à l'aide de la bibliothèque scikit-image version 0.20.0.
Les modules d'inversion du noyau visent à apprendre l'équivariance d'inversion grâce à des copies inversées générées des caractéristiques d'entrée avec plusieurs versions d'inversion des noyaux. Pour notre méthode proposée, nous n'utilisons que deux branches de noyaux inversés : celui d'origine et celui inversé à un seul axe. Lorsque la fonctionnalité Radon traitée, après avoir traversé plusieurs couches, est entrée dans ce module, les noyaux inversés à partage de poids génèrent un ensemble de fonctionnalités inversées sans augmenter le nombre de paramètres pouvant être entraînés, ce qui garantit l'efficacité du modèle. En apprenant cette variation de retournement sur les caractéristiques basées sur Radon, notre modèle est capable d'acquérir des propriétés équivariantes de retournement en plus de l'équivariance de rotation. En tant que principale considération pour notre structure de branche étroite, comme décrit dans "Travaux connexes", il existe un compromis entre les performances de généralisation et le nombre de branches ; par conséquent, la seule branche unique supplémentaire peut conduire à une faible performance flip-équivariante. Cependant, comme décrit dans "Formulation du problème", l'obtention d'une équivariance inversée sur une représentation équivariante en rotation correspond à toutes les directions d'équivariance inversée. Après avoir généré un ensemble de fonctionnalités inversées, le module max-out prend ensuite les fonctionnalités les plus actives élément par élément pour les transmettre au module de classification CNN tout en visant un flux de mémoire efficace à l'intérieur du réseau et l'effet d'abandon. Enfin, les caractéristiques équivariantes de rotation et de retournement obtenues à partir des modules de retournement de Radon et du noyau permettent d'apprendre l'invariance de rotation et de retournement avec le classifieur CNN.
Dans cette étude, nous avons adopté le LRP pour évaluer notre méthode de manière qualitative, non seulement pour reconnaître l'effet sur l'inférence basée sur la fonction Radon conformément à la prédiction originale basée sur la carte des plaquettes, mais également pour vérifier que notre modèle proposé fonctionne comme prévu. . Le LRP est principalement utilisé pour comprendre l'inférence du modèle en utilisant une approche basée sur l'interprétabilité des modèles basés sur l'apprentissage en profondeur. Sur la base de la méthode de décomposition profonde de Taylor décrite par Eq. (13), le score de pertinence peut être obtenu par prédiction de sortie, où a est un point racine de la série de Taylor et \(\epsilon\) est un terme substitué aux termes polynomiaux d'ordre supérieur de la série de Taylor. En répétant séquentiellement la propagation de la pertinence aux couches précédentes, les scores de pertinence de la couche d'entrée peuvent finalement être obtenus.
Pour appliquer cette technique à notre modèle, il y a une considération structurelle qu'il est difficile de propager le score de pertinence tel quel parce que notre modèle est un modèle multi-branches. À notre connaissance, la méthode LRP n'a jamais été utilisée dans une structure compliquée telle qu'un CNN multi-branches auparavant. Ici, nous proposons une nouvelle méthode LRP pour la structure multi-branches, comme illustré à la Fig. 1. Lorsque le score de pertinence est arrivé aux modules de retournement du noyau, deux scores de pertinence sont générés après le passage de chaque noyau. La propagation du score de pertinence séparé fournit de multiples scores de pertinence qui ne sont pas liés aux motifs de jugement du modèle au niveau de la couche d'entrée. Pour résoudre ce problème structurel, nous concaténons les deux scores de pertinence et les deux noyaux par axe de canal. Ensuite, nous propageons la pertinence via la fonction de pertinence concaténée et le noyau pour générer un score de pertinence combiné.
En général, les modèles de cartes de plaquettes sont classés en sept classes en fonction de la position et de la forme de leur cluster, ce qui a des conditions et des effets de processus spécifiques27 : centre, beignet, bord-loc, anneau, loc, rayure et aléatoire. Par exemple, le type central a pour effet des problèmes dans la zone de plasma28 ou le dépôt de couches minces, et le type edge-loc a le même effet qu'un chauffage irrégulier pendant le processus de diffusion. Par conséquent, il a été considéré comme une tâche importante de les classer et de déterminer l'état du processus afin que la cause de la détérioration du processus puisse être estimée. Les tâches existantes de tri de plaquettes basées sur l'apprentissage automatique ont principalement été étudiées selon deux scénarios : les données de fabrication individuelles et les données ouvertes27, chacune avec ses avantages et ses inconvénients. L'utilisation de données privées est avantageuse pour optimiser le problème posé, mais les généralisations méthodologiques sont difficiles. Cependant, les données accessibles au public sont plus faciles à comparer avec d'autres méthodes, ce qui implique que la généralisation de la méthode pourrait être revendiquée ; par conséquent, il est préférable de l'utiliser pour la vérification.
Les données de fabrication réelles WM-811K ont souvent été utilisées dans des tâches de classification de plaquettes via l'apprentissage automatique et en profondeur29. Pour la représentation des données, chaque carte de plaquette est formée comme une image 2D de différentes tailles. Comme le montre la figure 3, le WM-811K contient un total de neuf classes, y compris les sept classes susmentionnées et des classes supplémentaires quasi-pleines et aucune, avec un total de 172 950. Parmi eux, il y a 25 519 données étiquetées, ce qui ne représente qu'environ 14,8 % des données. De plus, comme le montre le tableau 1, la distribution des données est très déséquilibrée, c'est-à-dire que la classe presque complète ne représente que 0,1 %. Le traitement approprié des données pour l'évaluation est abordé dans "Configuration expérimentale".
Modèles de plaquettes utilisés de WM-811K pour cette étude. Les modèles presque plein et aucun sont exclus, comme décrit dans "Configuration expérimentale".
Pour évaluer l'efficacité de notre méthode proposée, nous avons utilisé les sept classes typiques de WM-811K, comme indiqué sur la figure 3, en définissant des distributions de données équilibrées pour chaque classe. Les recherches antérieures sur la classification des modèles de cartes de plaquettes à l'aide du WM-811K peuvent être classées en deux catégories. Le premier cas utilise neuf classes, tandis que le second ne prend que sept ou huit classes, selon qu'il contient les classes aucune ou presque complètes. Mohamed et al.30 ont souligné les effets négatifs de l'utilisation de la classe none, car elle peut avoir un impact à la fois sur la formation du modèle et sur l'analyse des performances pour plusieurs raisons. Ainsi, nous avons suivi cette dernière approche en prenant sept classes à l'exclusion des classes "Quasi-plein" et "Aucun" pour nous concentrer sur la rareté des données, en dehors du problème de déséquilibre des données. Ensuite, nous avons sous-échantillonné les ensembles de données d'entraînement et de test pour les sept classes avec un petit ensemble de données allant de 100 à 6 400 avec une taille de données équilibrée pour chaque classe. Pour prétraiter les données, nous avons d'abord redimensionné la carte de plaquette en (64, 64) et supprimé l'arrière-plan de la carte de plaquette, en ne conservant que les points de défaut en raison des différentes tailles de carte de plaquette, ce qui peut conduire à des formes légèrement différentes sur les côtés après redimensionnement, affectant ainsi négativement la formation du modèle.
Pour évaluer comparativement le modèle proposé via une étude d'ablation, nous avons établi quatre modèles comparatifs. Le premier, un modèle de base, utilisait la carte des plaquettes comme entrée du réseau de base, comme détaillé dans le tableau 2. Le deuxième modèle, le modèle Radon, a pris la transformation de Radon avant d'entrer la carte des plaquettes dans le même réseau de base. Le troisième modèle, le modèle de basculement du noyau, avait un module de basculement du noyau à deux branches dans le réseau de base et utilisait la carte de tranche comme entrée. Enfin, le modèle proposé incorporait à la fois la transformation de Radon et le module de retournement du noyau sur le modèle de référence qui est également détaillé dans le tableau 2.
Dans les expériences, le taux d'apprentissage initial a été fixé à 0,0003 et l'optimiseur Adam a été utilisé pour mettre à jour les poids du modèle. La décroissance du taux d'apprentissage a été utilisée pour chaque époque avec un taux de décroissance de 0,99. Les étapes de formation ont été arrêtées tôt lorsque la perte de validation n'a pas diminué pendant 30 époques pour éviter le surajustement. La fonction de perte utilisée était la perte d'entropie croisée, qui convient aux tâches de classification. Chaque expérience a été répétée 20 fois en utilisant différentes graines aléatoires. Les résultats sont rapportés sous forme de moyenne et d'écart type de toutes les mesures répétées.
Pour évaluer la performance de notre méthode proposée, nous avons effectué des analyses quantitatives et qualitatives. Dans un premier temps, nous avons effectué une analyse qualitative à l'aide de la méthode LRP pour vérifier l'adéquation de notre méthode proposée. Plus précisément, nous avons examiné visuellement les cartes thermiques LRP pour analyser la manière dont le modèle se concentre sur différentes parties de la carte de la plaquette pour prendre des décisions. De plus, nous avons vérifié l'effet de la rotation et du retournement de la carte de plaquette d'origine sur l'inférence du modèle proposé en évaluant comment ces transformations affectent l'attention du modèle sur la carte de plaquette. Tout au long de ces expériences, nous avons comparé les performances qualitatives de la ligne de base et des méthodes proposées. Comme la carte thermique LRP pour la méthode proposée est basée sur les caractéristiques du radon, la comparaison directe avec la ligne de base était difficile. Ainsi, nous avons appliqué une transformée de Radon inverse aux scores de pertinence obtenus à partir de l'inférence basée sur les caractéristiques de Radon, en utilisant le théorème de tranche de projection pour vérifier la cohérence entre la carte de tranche d'origine et l'inférence basée sur les caractéristiques de Radon. Cela nous a permis de comparer la méthode proposée avec la ligne de base.
Dans un deuxième temps, nous avons mené une analyse quantitative pour évaluer les performances du modèle proposé. Dans un premier temps, nous avons réalisé une étude d'ablation pour vérifier la validité de la méthode proposée en analysant l'effet de chaque module sur la performance globale de l'ensemble et des sous-classes. De plus, nous avons évalué l'impact de la rotation et du retournement sur les performances du modèle proposé pour chaque classe à l'aide de la matrice de confusion. Le degré de variation pour la rotation et le retournement diffère en fonction du modèle de carte de plaquette, certaines classes présentant une variation insignifiante tandis que d'autres affichent une grande variation. Par exemple, les classes center et donut contiennent des points uniformément défectueux dans toutes les directions, ce qui entraîne une variation insignifiante pour la rotation et le retournement, tandis que la classe scratch a une grande variation pour le retournement et la rotation puisqu'elle existe sous des formes courbes ou droites indépendantes de la direction et emplacement.
Enfin, pour valider les performances de généralisation de notre modèle, nous avons procédé à une comparaison approfondie des performances du modèle proposé et des modèles comparatifs sur l'ensemble de test original et un ensemble de test augmenté invisible (hors distribution). Plus précisément, nous avons évalué la capacité des modèles à généraliser à des distributions invisibles pour les transformations de rotation et de retournement. Bien que l'ensemble de test d'origine puisse être considéré comme invisible car il n'a pas été utilisé dans la formation, il était toujours limité à la distribution au sein de l'ensemble de données d'origine. Pour évaluer la robustesse du modèle proposé à la généralisation, nous avons généré un ensemble de données en faisant pivoter et en retournant directement l'ensemble de test pour s'étendre au-delà de la distribution de l'ensemble de données d'origine. L'ensemble de test augmenté par rotation comprenait des ensembles de test augmentés par rotation de 90°, 180° et 270°, tandis que l'ensemble de test augmenté par retournement comprenait des ensembles de test inversés horizontalement et verticalement. Nous avons ensuite intégré les deux méthodes d'augmentation pour la rotation et le retournement. Il est important de noter que l'ensemble de test augmenté n'incluait pas l'ensemble de test d'origine. Cette comparaison nous a permis de confirmer la validité de l'architecture du modèle proposé et de vérifier sa robustesse à des situations inédites.
Pour commencer, nous confirmons comment la décision du modèle est prise pour la classification des étiquettes avec les cartes thermiques LRP obtenues. La figure 4 compare le modèle de référence pour chaque classe au score de pertinence du modèle proposé. En examinant la deuxième colonne, il est clair que le modèle de base concerne principalement le motif visuel représenté sur la carte de plaquette. Pendant ce temps, en raison de la difficulté d'interpréter directement la décision du modèle de Radon, elle a été comparée à l'aide de la pertinence transformée par la transformée de Radon inverse, comme illustré dans la cinquième colonne. En conséquence, il a été déterminé que le modèle proposé correspond également au modèle de défaut sur la carte de plaquette. Il s'agit d'une découverte importante car elle démontre que les informations de forme contenues dans la carte de tranche sont conservées même lorsque le modèle est évalué uniquement sur la base de la fonction Radon. De plus, en comparant les résultats de prédiction, il est évident que le modèle proposé se concentre exclusivement sur l'emplacement du défaut principal, ce qui explique les performances de classification plus élevées. En particulier, les résultats montrent que pour des classes telles que C3 et C7, le modèle proposé accorde plus d'attention à l'emplacement des modèles clairs par rapport à la ligne de base. Cette observation est cohérente avec le fait que C3, C5 et C7 ont une large gamme de variations dans les transformations de rotation et de retournement, ce qui rend difficile pour le modèle de base d'apprendre les caractéristiques discriminantes de classe. En revanche, le modèle proposé montre un apprentissage robuste en ce qui concerne les transformations de rotation et de retournement, ce qui pourrait être la raison de l'amélioration des performances observée. Cette découverte fournit la preuve que la méthode proposée est efficace pour apprendre des caractéristiques plus robustes et discriminantes en présence de diverses transformations d'image, ce qui peut être particulièrement utile pour les scénarios difficiles du monde réel.
Analyse de la carte thermique de pertinence par couche de la ligne de base et des méthodes proposées pour toutes les classes, avec des modèles entraînés sur un train d'échantillons de taille 6400. Les première et troisième colonnes correspondent respectivement aux données d'entrée des modèles de référence et proposé. Les deuxième et quatrième colonnes décrivent les résultats de l'interprétation LRP pour les décisions du modèle. La cinquième colonne affiche les résultats de la transformation inverse de Radon des résultats LRP de la méthode proposée, qui sont représentés pour correspondre à la forme de la carte de plaquette d'origine. Toutes les images de cette figure ont été visualisées à l'aide de Python 3.8.4. Les transformées de radon et de radon inverse ont été réalisées avec la bibliothèque d'images scikit version 0.20.0, tandis que la carte thermique LRP a été obtenue à l'aide de notre méthode LRP multi-branches proposée.
La figure 5 compare les scores de pertinence des modèles de référence et proposés tout en faisant pivoter et en inversant l'ensemble de tests par la méthode LRP multi-branches. La carte de tranches et les rangées de caractéristiques de radon 1 à 4 montrent que la rotation de la carte de tranches agit comme une traduction de la caractéristique de radon, et les rangées 5 à 8 démontrent que le retournement vertical de la carte de tranches agit comme un retournement horizontal de la fonction de radon. Sur la base de la carte thermique LRP obtenue par le modèle proposé, la région activée est traduite horizontalement pour la carte de plaquette tournée et de même pour la carte de plaquette inversée verticalement. De plus, en effectuant une transformation de Radon inverse sur la carte thermique du modèle proposé, il a été confirmé que le score de pertinence indique le modèle de défaut de la carte de plaquette d'origine. En conséquence, la méthode de retournement de noyau basée sur la transformée de Radon du modèle proposé contribue de manière significative à l'obtention d'une invariance de rotation et de retournement pour la classification des modèles de plaquettes.
Analyse de la carte thermique de pertinence par couche de la ligne de base et méthodes proposées pour les cartes de plaquettes de test tournées ou inversées, avec des modèles entraînés sur un ensemble de trains d'échantillons de taille 6400. Les première et troisième colonnes correspondent respectivement aux données d'entrée des modèles de référence et proposé. Les deuxième et quatrième colonnes décrivent les résultats de l'interprétation LRP pour les décisions du modèle. La cinquième colonne affiche les résultats de la transformation inverse de Radon des résultats LRP de la méthode proposée, qui sont représentés pour correspondre à la forme de la carte de plaquette d'origine. Toutes les images de cette figure ont été visualisées à l'aide de Python 3.8.4. Les transformées de radon et de radon inverse ont été réalisées avec la bibliothèque d'images scikit version 0.20.0, tandis que la carte thermique LRP a été obtenue à l'aide de notre méthode LRP multi-branches proposée.
Un autre point notable est que chaque fois que la carte de plaquette d'origine est tournée et retournée, le score de pertinence du modèle de référence prête attention à différentes positions, mais le modèle proposé se concentre davantage sur les points de défaut de la carte de plaquette d'origine. Cela indique que le modèle proposé a des performances de classification de robustesse élevées pour les variations de rotation et de retournement de la plaquette d'entrée, ce qui explique également pourquoi il montre des performances de classification améliorées pour les ensembles de tests originaux et augmentés, comme indiqué plus loin dans "Analyse quantitative".
La figure 6a et le tableau 3 présentent une comparaison de la précision de la classification des modèles comparatifs pour divers paramètres de rame. Les modèles Radon et kernel flip, ainsi que le modèle proposé, présentent une précision de classification supérieure à celle du modèle de référence. Notamment, le modèle Radon fonctionne mieux que le modèle de retournement du noyau, ce qui indique que les modèles de carte de plaquette présentent plus de variation pour la rotation que pour le retournement. De toutes les méthodes, le modèle proposé atteint les performances les plus élevées, indiquant que l'invariance est assurée à la fois pour la rotation et le retournement.
(a) Comparaison de la précision de la classification entre des modèles comparatifs pour différentes tailles de rames, (b) écart de précision pour chaque classe entre les méthodes de référence et proposées, (c) matrice de confusion du modèle de référence, et (d) matrice de confusion du modèle proposé modèle pour une rame de taille 6400.
La figure 6b–d présente une comparaison des modèles de référence et proposés en termes de précision de classe. La figure 6b montre la différence entre la précision des classes, qui est un élément diagonal de la matrice de confusion (Fig. 6c, d). La figure 6b indique que le modèle proposé a une plus grande précision pour toutes les classes que le modèle de référence. En particulier, C3 (edge-loc), C5 (loc), C6 (aléatoire) et C7 (scratch) sont significativement augmentés parmi toutes les classes. Cette tendance va de pair avec le fait que cette classe a considérablement plus de rotation et de variance de retournement que les autres classes. Par conséquent, il peut être confirmé que la grande précision du modèle proposé est dérivée de l'invariance de rotation et de retournement.
Le tableau 4 compare la précision de la classification des modèles comparatifs pour les ensembles de tests augmentés. Dans les lignes 1 à 2, les modèles de base et de retournement du noyau sont évalués dans le cadre du jeu de test augmenté du retournement. Dans les rangées 3 et 4, les modèles de référence et de radon sont évalués dans le cadre de l'ensemble de test augmenté par rotation. Dans les lignes 5 à 6, les modèles de référence et proposés sont évalués dans le cadre de l'ensemble de tests augmenté de rotation et de retournement. Dans tous les cas, les modèles comparatifs obtiennent une plus grande précision que le modèle de référence. Cela signifie que le modèle proposé et ses modèles d'ablation fonctionnent comme une rotation ou un retournement invariant à la situation augmentée invisible pour la rotation ou le retournement.
La figure 7 montre la précision de la classification des modèles comparatifs pour les situations augmentées originales et invisibles dans une rame de taille 6400. 7b représente le résultat d'évaluation pour l'ensemble de test augmenté de rotation des modèles de base et de Radon, et la Fig. 7c représente le résultat d'évaluation pour l'ensemble de test augmenté de rotation et d'inversion des modèles de référence et proposé. Comme illustré à la Fig. 7, les modèles Radon, kernel flip et proposés atteignent tous une précision accrue par rapport au modèle de référence dans chaque ensemble de test augmenté. Cependant, dans les trois cas, les précisions sont légèrement diminuées entre deux situations. Il convient de noter que l'écart de réduction entre les modèles de référence est plus important que celui des autres modèles comparatifs. Cela peut être interprété comme le modèle proposé ayant une plus grande résistance à la dégradation des performances dans les performances de généralisation dans des situations augmentées invisibles.
Précisions des modèles comparatifs pour les ensembles de test originaux et augmentés dans une rame de taille 6400. (a) Modèles de référence et de retournement du noyau comparés dans l'ensemble de test inversé inversé, (b) modèles de référence et de radon comparés dans l'ensemble de test augmenté en rotation, et (c) les modèles de base et proposés comparés dans un ensemble de tests augmenté tourné et inversé.
La figure 8 compare les performances de généralisation pour chaque classe entre les modèles proposés et de référence sur une rame de taille 6400. La figure 8a montre la différence de précision de classe des modèles de référence présentés dans la figure 8b (le jeu de test original) et la figure. 8c (l'ensemble de test augmenté tourné et retourné). La figure 8d montre la différence dans la différence de précision de classe entre la figure 8e (l'ensemble de test d'origine) et la figure 8f (l'ensemble de test augmenté tourné et inversé) pour le modèle proposé. La figure 8g montre la différence entre la figure 8d et la figure 8a, ce qui démontre que le modèle proposé a une meilleure généralisation que le modèle de référence pour chaque classe. À partir de la Fig. 8d, nous pouvons voir que le modèle proposé a une plus grande résistance à la dégradation des performances en termes de généralisation pour un jeu de données augmenté invisible pour toutes les classes, tandis que les classes C3 (edge-loc), C5 (loc) et C7 (scratch) montrent une augmentation significative. Cette extraordinaire performance de généralisation pour les classes sensibles à la rotation et au retournement démontre que le modèle proposé préserve efficacement l'invariance de rotation et de retournement. De plus, cette tendance est conforme aux résultats de l'ensemble de tests d'origine discuté dans "Comparaison des performances de classification".
(a) Écart de précision de classe entre (b) l'ensemble de test d'origine et (c) l'ensemble de test augmenté tourné et inversé pour le modèle de base d'une rame de taille 6400. (d) Écart de précision de classe entre (e) l'ensemble de test d'origine et (f) ensemble de test augmenté tourné et inversé pour le modèle proposé à une rame de taille 6400. (g) Différence entre (d) et (a), indiquant une performance de généralisation accrue par le modèle proposé par rapport au modèle de référence pour chaque classe.
Dans cet article, nous introduisons une nouvelle méthode pour obtenir une invariance de rotation et de retournement dans la classification des modèles de défauts de carte de plaquette, en utilisant une combinaison de techniques de transformation de Radon et de retournement du noyau. La fonction Radon assure l'invariance de rotation en transformant la rotation de la carte de tranche d'origine en translation, tandis que l'approche de retournement du noyau fournit une invariance de retournement. Notre méthode proposée utilise une structure de réseau efficace avec un nombre minimal de branches de noyau inversées en combinant de manière appropriée ces deux modules. Nous validons notre modèle de manière approfondie à l'aide de l'ensemble de données WM-811K avec des évaluations qualitatives et quantitatives. L'interprétabilité de notre modèle proposé est démontrée en vérifiant ses décisions à l'aide de la méthode LRP multi-branches nouvellement suggérée. Le modèle proposé atteint des performances de détection élevées, même dans des situations de données limitées, en assurant avec succès l'invariance de rotation et de retournement. De plus, nous avons évalué les performances de généralisation de la méthode proposée concernant les invariants de rotation et de retournement sur les données hors distribution en utilisant des ensembles de tests augmentés de rotation et de retournement. Notre étude fournit un modèle d'apprentissage en profondeur de bout en bout efficace qui reflète de manière appropriée les caractéristiques de l'étiquetage des plaquettes et peut servir de référence appropriée pour le diagnostic des plaquettes à l'avenir.
Les ensembles de données générés et/ou analysés au cours de l'étude en cours sont disponibles dans le référentiel MIR Corpora (en ligne : http://mirlab.org/dataSet/public/).
Tong, L.-I., Wang, C.-H. & Huang, C.-L. Surveillance des défauts dans la fabrication de circuits intégrés à l'aide d'un tableau de contrôle Hotelling T/sup 2/. IEEE Trans. Semicond. Fab. 18, 140-147 (2005).
Article Google Scholar
Kim, B., Jeong, Y.-S., Tong, SH, Chang, I.-K. & Jeong, M.-K. Test d'aléatoire spatial abaisseur pour détecter les anomalies dans les tranches de DRAM avec plusieurs cartes spatiales. IEEE Trans. Semicond. Fab. 29, 57–65 (2015).
Article Google Scholar
Kameyama, K., Kosugi, Y., Okahashi, T. & Izumita, M. Classification automatique des défauts lors de l'inspection visuelle des semi-conducteurs à l'aide de réseaux de neurones. IEICE Trans. Inf. Syst. 81, 1261-1271 (1998).
Google Scholar
Yuan, T., Bae, SJ & Park, JI Reconnaissance de modèles de défauts spatiaux bayésiens dans la fabrication de semi-conducteurs à l'aide du regroupement de vecteurs de support. Int. J. Adv. Fab. Technol. 51, 671–683 (2010).
Article Google Scholar
Wu, M.-J., Jang, J.-SR et Chen, J.-L. Reconnaissance des schémas de défaillance des cartes de plaquettes et classement des similarités pour les ensembles de données à grande échelle. IEEE Trans. Semicond. Fab. 28, 1–12 (2014).
Google Scholar
Yu, J. & Lu, X. Détection et reconnaissance des défauts de la carte Wafer à l'aide d'une analyse discriminante linéaire locale et non locale conjointe. IEEE Trans. Semicond. Fab. 29, 33-43 (2015).
Article Google Scholar
Saqlain, M., Jargalsaikhan, B. & Lee, JY Un classificateur d'ensemble votant pour l'identification des modèles de défauts de carte de plaquette dans la fabrication de semi-conducteurs. IEEE Trans. Semicond. Fab. 32, 171–182 (2019).
Article Google Scholar
Nakazawa, T. & Kulkarni, DV Classification des modèles de défauts de carte Wafer et récupération d'images à l'aide d'un réseau neuronal convolutif. IEEE Trans. Semicond. Fab. 31, 309-314 (2018).
Article Google Scholar
Devika, B. & George, N. Réseau neuronal convolutif pour la détection des défauts des plaquettes semi-conductrices. en 2019 10th International Conference on Computing, Communication and Networking Technologies (ICCCNT). 1–6 (IEEE, 2019).
Kyeong, K. & Kim, H. Classification des modèles de défauts de type mixte dans les cartes de bacs à plaquettes à l'aide de réseaux de neurones convolutifs. IEEE Trans. Semicond. Fab. 31, 395–402 (2018).
Article Google Scholar
Yu, N., Xu, Q. & Wang, H. Reconnaissance et analyse des modèles de défauts de Wafer basés sur un réseau neuronal convolutif. IEEE Trans. Semicond. Fab. 32, 566-573 (2019).
Article Google Scholar
Kang, S. Classification des modèles de cartes de plaquettes invariantes en rotation avec des réseaux de neurones convolutifs. Accès IEEE 8, 170650–170658 (2020).
Article Google Scholar
Kahng, H. & Kim, SB Apprentissage de représentation auto-supervisé pour la classification des modèles de défauts de la carte des bacs à plaquettes. IEEE Trans. Semicond. Fab. 34, 74–86 (2020).
Article Google Scholar
Laptev, D., Savinov, N., Buhmann, JM & Pollefeys, M. Ti-pooling : Mise en commun invariante par transformation pour l'apprentissage de caractéristiques dans les réseaux de neurones convolutifs. dans Actes de la conférence IEEE sur la vision par ordinateur et la reconnaissance de formes. 289–297.
Cheng, G., Zhou, P. & Han, J. Apprentissage de réseaux de neurones convolutifs invariants en rotation pour la détection d'objets dans des images de télédétection optique VHR. IEEE Trans. Géosci. Remote Sens. 54, 7405–7415 (2016).
Annonces d'article Google Scholar
Cheng, G., Zhou, P. & Han, J. Rifd-cnn : Réseaux de neurones convolutionnels invariants en rotation et discriminants Fisher pour la détection d'objets. dans Actes de la conférence IEEE sur la vision par ordinateur et la reconnaissance de formes. 2884–2893.
Dieleman, S., Willett, KW et Dambre, J. Réseaux de neurones convolutifs invariants en rotation pour la prédiction de la morphologie des galaxies. Lun. Pas. R.Astron. Soc. 450, 1441-1459 (2015).
Annonces d'article Google Scholar
Dieleman, S., De Fauw, J et Kavukcuoglu, K. Exploitation de la symétrie cyclique dans les réseaux de neurones convolutionnels. dans la conférence internationale sur l'apprentissage automatique. (PMLR, 2016).
Cohen, T., & Welling, M. Group réseaux convolutifs équivariants. dans la conférence internationale sur l'apprentissage automatique. (PMLR, 2016).
Marcos, D., Volpi, M. & Tuia, D. Apprentissage des filtres convolutifs invariants de rotation pour la classification des textures. en 2016 23e Conférence internationale sur la reconnaissance de formes (ICPR). 2012-2017 (IEEE, 2016).
Gao, H. & Ji, S. Réseaux de neurones convolutionnels efficaces et invariants pour la prédiction dense. en 2017 Conférence internationale IEEE sur l'exploration de données (ICDM). 871–876 (IEEE, 2017).
Worrall, DE, Garbin, SJ, Turmukhambetov, D. & Brostow, GJ Réseaux harmoniques : traduction profonde et équivariance de rotation. dans Actes de la conférence IEEE sur la vision par ordinateur et la reconnaissance de formes. 5028–5037.
Jaderberg, M., Simonyan, K. & Zisserman, A. Réseaux de transformateurs spatiaux. dans les progrès des systèmes de traitement de l'information neuronale. Vol. 28 (Curran Associates, Inc., 2015).
Esteves, C., Allen-Blanchette, C., Zhou, X. & Daniilidis, K. Réseaux de transformateurs polaires. prétirage arXiv arXiv:1709.01889 (2017).
Dai, J. et al. Réseaux convolutionnels déformables. dans Actes de la conférence internationale IEEE sur la vision par ordinateur. 764–773.
Mimura, M. & Toda, H. Topologie des groupes de Lie, I et II. Vol. 91 (Société mathématique américaine, 1991).
Maksim, K. et al. Classification des défauts des cartes de plaquettes basée sur des méthodes d'apprentissage en profondeur avec une petite quantité de données. en 2019 Conférence internationale sur l'ingénierie et les télécommunications (EnT). 1–5 (IEEE, 2019).
Hansen, C. & Thyregod, P. Utilisation de cartes de plaquettes dans la fabrication de circuits intégrés. Microélectron. Fiab. 38, 1155-1164 (1998).
Article Google Scholar
Wu, M.-J., Jang, J.-S. & Chen, J.-L. Reconnaissance des schémas de défaillance des cartes de plaquettes et classement des similarités pour les ensembles de données à grande échelle. IEEE Trans. Semicond. Fab. 28(1), 1–12 (2014).
Google Scholar
Alawieh, MB, Boning, D. & Pan, DZ Classification des modèles de défauts de la carte Wafer à l'aide d'un apprentissage sélectif approfondi. en 2020 57ème ACM/IEEE Design Automation Conference (DAC). 1–6 (IEEE, 2020).
Télécharger les références
Cette recherche a été financée en partie par la subvention de la Fondation nationale de recherche de Corée (NRF) financée par le ministère coréen des sciences et des TIC (MSIT) (n° 2020R1A2C1009744), en partie par l'Institut de coopération technologique civilo-militaire financé par le Administration du programme d'acquisition de la défense et Ministère du commerce, de l'industrie et de l'énergie du gouvernement coréen dans le cadre de la subvention n° 19-CM-GU-01, et en partie par l'Institut coréen d'évaluation et de planification des technologies énergétiques (KETEP) Subvention financée par le gouvernement coréen [ Ministère du commerce, de l'industrie et de l'énergie (MOTIE)] dans le cadre de la subvention 20206610100290.
Département de génie mécanique, Université des sciences et technologies de Pohang (POSTECH), Pohang, République de Corée
Iljoo Jeong, Soo Young Lee, Parc Keonhyeok, Iljeok Kim, Hyunsuk Huh et Seungchul Lee
École supérieure d'intelligence artificielle, Université des sciences et technologies de Pohang (POSTECH), Pohang, République de Corée
Seungchul Lee
Institute of Convergence Research and Education in Advanced Technology, Université Yonsei, 50 Yonsei-ro, Séoul, République de Corée
Seungchul Lee
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Vous pouvez également rechercher cet auteur dans PubMed Google Scholar
Méthodologie, Rédaction-ébauche originale, Rédaction-révision et édition, IJ ; Conceptualisation, analyse formelle, SYL et KP ; Conservation des données, enquête, IK et HH ; Supervision, Acquisition de financement, SL
Correspondance avec Seungchul Lee.
Les auteurs ne déclarent aucun intérêt concurrent.
Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.
Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui autorise l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur tout support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel de tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.
Réimpressions et autorisations
Jeong, I., Lee, SY, Park, K. et al. Classification des modèles de défaillance de cartes de plaquettes à l'aide d'un réseau neuronal convolutif invariant par transformation géométrique. Sci Rep 13, 8127 (2023). https://doi.org/10.1038/s41598-023-34147-2
Télécharger la citation
Reçu : 16 février 2023
Accepté : 25 avril 2023
Publié: 19 mai 2023
DOI : https://doi.org/10.1038/s41598-023-34147-2
Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :
Désolé, aucun lien partageable n'est actuellement disponible pour cet article.
Fourni par l'initiative de partage de contenu Springer Nature SharedIt
En soumettant un commentaire, vous acceptez de respecter nos conditions d'utilisation et nos directives communautaires. Si vous trouvez quelque chose d'abusif ou qui ne respecte pas nos conditions ou directives, veuillez le signaler comme inapproprié.