A statistical point of view on fatigue criteria : from supervised classification to positive-unlabeled learning

Olivier Coudray

Résumé

The reliability of vehicles is a major issue for automotive manufacturers. In particular, mechanical fatigue is an important preoccupation of the design office. Indeed, fatigue is a complex phenomenon that depends on the design of the part (geometry, materials used), the manufacturing and on the external loads it is subjected to. In order to design a safety part against fatigue, the part is numerically modeled and a deterministic fatigue criterion is applied to identify potential weaknesses. If these criteria prove to be effective when evaluated on experimental test data with standardized specimens, they are less effective for rig tests with prototypes. This results in an increase in development costs and duration. In order to remedy this issue, car manufacturers seek new digital tools to better predict the fatigue risks on new design proposals. In this thesis, we build a fatigue database, based on information provided by Stellantis, gathering numerical results along with fatigue test reports on prototypes. Unsupervised machine learning methods are applied offering a better understanding of the structure of the database and the relations between the available features. Then, the application of supervised machine learning methods (logistic regression, random forests, kernel SVM...) allows to estimate fatigue criteria offering better predictions than the standard fatigue criterion. However, the binary labels in this classification task are affected by a completely asymmetric label noise. This motivates an original approach to fatigue criteria estimation based on Positive-Unlabeled learning (PU learning). This problem is studied from all angles: theory, methodology and application. First, new risk bounds, adapted to this specific framework, are proved. Then, we develop a practical methodology to estimate a PU classifier. Finally, the methodology is evaluated on simulated data and on the fatigue database. The prediction performances confirm the interest of the methodology and its utility for car manufacturers.

La fiabilité des véhicules est un enjeu majeur pour les constructeurs automobiles. En particulier, la fatigue mécanique est une préoccupation importante du bureau d'études. En effet, la fatigue est un phénomène complexe qui dépend du design de la pièce (géométrie, matériaux utilisés), des procédés de fabrication, et des chargements externes subis par la pièce. Le dimensionnement à la fatigue repose sur une modélisation numérique de la pièce et sur l'application de critères de fatigue déterministes afin d'identifier de potentielles faiblesses sur la conception. Ces critères, bien qu'efficaces sur des géométries simples, ne suffisent pas à prédire correctement les risques d'amorçage sur des composants complexes. Cela entraîne un allongement des temps de développement et une augmentation des coûts liés aux prototypes physiques. Pour y remédier, les constructeurs automobiles recherchent de nouvelles méthodes digitales, pour mieux identifier les zones critiques sur de nouvelles conceptions. Dans cette thèse, nous construisons une base de données fatigue, à partir d'informations mises à disposition par Stellantis, regroupant des résultats numériques et des comptes rendus d'essais de fatigue. Une analyse non supervisée du jeu de données est réalisée, permettant de mieux comprendre sa structure ainsi que les liens entre les covariables disponibles. Ensuite, l'application de méthodes d'apprentissage supervisé (régression logistique, forêts aléatoires, SVM à noyau...) permet d'estimer des critères de fatigue offrant de meilleures prédictions que le critère mécanique déterministe usuel. Une difficulté de l'analyse provient du fait que l'étiquetage des zones est affecté par un bruit asymétrique, ce qui motive une approche originale fondée sur l'apprentissage positif-non labellisé (PU learning). Cette approche est abordée suivant tous les angles: théorique, méthodologique et appliqué. De nouvelles bornes de risques adaptées à ce cadre spécifique sont démontrées. Une méthodologie est proposée pour l'estimation d'un classifieur PU à partir des données. Enfin, la méthodologie est évaluée sur des jeux de données simulés ainsi que sur les données de fatigue. Les performances obtenues confirment l'intérêt de la méthode et son utilité pour le constructeur automobile.

A statistical point of view on fatigue criteria : from supervised classification to positive-unlabeled learning

Un point de vue statistique sur les critères de fatigue : de la classification supervisée à l'apprentissage positif-non labellisé

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager