Data-Driven Exploration of SiC MOSFET Aging Using Symbolic Regression
(2025) MVKM01 20242Department of Energy Sciences
- Abstract
- This study explores the relationships between voltage, temperature, and consumed life in silicon carbide (SiC) MOSFETs using symbolic regression as a data-driven tool for deriving interpretable equations. The data comes from an accelerated life-time test performed by RISE. The symbolic regression model was implemented using the open source program ”PySR”. Since real experimental data were used, cleaning was a vital step to ensure that the real trends in the data were not hidden by experimental quirks. The data cleaning process resulted in a notable improvement in the correlations, were all correlation values increased significantly after cleaning. A PCA showed that the feature set could potentially be reduced from 17 to 7 features. It was... (More)
- This study explores the relationships between voltage, temperature, and consumed life in silicon carbide (SiC) MOSFETs using symbolic regression as a data-driven tool for deriving interpretable equations. The data comes from an accelerated life-time test performed by RISE. The symbolic regression model was implemented using the open source program ”PySR”. Since real experimental data were used, cleaning was a vital step to ensure that the real trends in the data were not hidden by experimental quirks. The data cleaning process resulted in a notable improvement in the correlations, were all correlation values increased significantly after cleaning. A PCA showed that the feature set could potentially be reduced from 17 to 7 features. It was also shown that adding the temperature swing to the data set could add vital information. Overall, transistor degradation is a complex phenomenon to model, and providing a good prediction for the lifetime is a tough task for even more complex ML models. The focus was thus to use SR to find simple relationships that can be used to gain insight and eventually that can be used in physical informed networks. In the end, simple models, such as second-, fourth-power and inverse equations, were identified. For voltage-temperature two non-linear models were found (fourth power and inverse), however, the limited temperature range made them appear linear. The underlying data also appear quite linear, suggesting that the range is too short or the models suffer from overfitting. The second order power equations for voltage-consumed life looks reasonable (Less)
- Popular Abstract (Swedish)
- Tänk dig en typisk morgon, du vaknar och med en simpel blick låser du upp din telefon, din resväg planerar du med Google Maps och i bilen lyssnar du på musik som är noggrant utvald för just dig. Så länge det fungerar, behöver du inte fundera över hur det går till. Men vetenskapsmän nöjer sig inte med att det bara fungerar – de vill förstå. Denna rapport undersöker hur AI kan användas för att hitta ekvationer relaterade till hur transistorer slits ut. Ekvationer som kan ge en djupare förståelse för hur en av elektronikens grundläggande komponenter åldras och påverkas av långvarig användning. Transistorn är en av de viktigaste uppfinningarna i modern tid och är en kritisk komponent i elektroniken. Den är grunden för dagens digitalteknik, och... (More)
- Tänk dig en typisk morgon, du vaknar och med en simpel blick låser du upp din telefon, din resväg planerar du med Google Maps och i bilen lyssnar du på musik som är noggrant utvald för just dig. Så länge det fungerar, behöver du inte fundera över hur det går till. Men vetenskapsmän nöjer sig inte med att det bara fungerar – de vill förstå. Denna rapport undersöker hur AI kan användas för att hitta ekvationer relaterade till hur transistorer slits ut. Ekvationer som kan ge en djupare förståelse för hur en av elektronikens grundläggande komponenter åldras och påverkas av långvarig användning. Transistorn är en av de viktigaste uppfinningarna i modern tid och är en kritisk komponent i elektroniken. Den är grunden för dagens digitalteknik, och ett vanligt datachip idag rymmer ofta miljarder transistorer. Mer specifikt är det transistorer av typen MOSFET som används i dessa digitala kretsar. Medan ett datachip hanterar ytterst små strömmar, kan transistorer även användas för höga strömmar. Ett exempel på detta är inom kraftelektroniken där de används för att kontrollera och omvandla elektrisk energi. De är helt enkelt inte bara viktiga för våra datorer utan även för våra elnät. Historiskt har kisel varit det dominerande materialet för tillverkning av transistorer. Detta har lett till att vår nuvarande tidsera ha förslagit vara Kiselåldern. Men forskning driver ständigt utveckling framåt och transistorer är inte ett undantag. Det har visat sig att addera kol till kisel gör att transistorerna kan klara av större spänningar. Traditionellt har MOSFET-transistorer främst används i digitala kretsar, men till följd av det nya materialet spås de vara viktig inom framtidens kraftelektronik. Då kiselkarbid (SiC) MOSFET är en ny teknologi som tros bli allt viktigare är det kritiskt att säkerställa dess pålitlighet. Med hjälp av maskininlärning kunde fyra ekvationer för hur SiC-MOSFETs slits ut hittas. Sammanfattningsvis verkar spänning och temperatur ha ett linjärt samband, medan spänning och livslängd tycks följa en andragradsekvation. Det visade sig att utmattning hos transistorer är ett område med en komplex fysik, därav var det är svårt att hitta enkla matematiska samband. Därav är de funna modellerna ej tillräckliga i sig själva. Eventuellt kan de användas för att stödja mer avancerade AI modeller eller för enkla approximationer. För att hitta dessa fyra ekvationer användes Python biblioteket PySR för genetisk programmering, tillsammans med experimentell data från RISE. Kortfattat representeras varje kandidat i modellen av ett matematiskt uttryck. Dessa genomgår en optimerings process inspirerad av naturligt urval. Kandidaterna tävlar mot varandra och nya uttryck skapas med hjälp av evolutionära operationer så som mutation and rekombination. Tanken är att de bästa generna ska föras vidare och till sist resultera i de ekvationer som bäst överensstämmer med datan. Den experimentella datan kommer från accelererade livstidstester där transistorn har utsätts för extrema förhållanden för att påskynda utmattningsfenomenet. Dessa experiment visade sig ha sina brister, därav var datarengöring en stor del av arbetet. Men trots det komplexa fenomenet med transistor-utmattning och de brister som fanns i den experimentella datan så ger denna studien en försmak på hur genetisk programmering kan användas för att hitta empiriska relationer i experimentell data. (Less)
Please use this url to cite or link to this publication:
http://lup.lub.lu.se/student-papers/record/9185328
- author
- Dahlstedt, Oskar LU
- supervisor
-
- Rixin Yu LU
- Erdzan Hodzic LU
- Leo Svenningsson LU
- organization
- course
- MVKM01 20242
- year
- 2025
- type
- H2 - Master's Degree (Two Years)
- subject
- keywords
- Symbolic regression, Genetic Programming, MOSFET, Fatigue, RUL, Machine Learning, PySR
- report number
- LUTMDN/TMHP-25/5612-S
- ISSN
- 0282-1990
- language
- English
- id
- 9185328
- date added to LUP
- 2025-02-21 13:15:18
- date last changed
- 2025-02-21 13:15:18
@misc{9185328, abstract = {{This study explores the relationships between voltage, temperature, and consumed life in silicon carbide (SiC) MOSFETs using symbolic regression as a data-driven tool for deriving interpretable equations. The data comes from an accelerated life-time test performed by RISE. The symbolic regression model was implemented using the open source program ”PySR”. Since real experimental data were used, cleaning was a vital step to ensure that the real trends in the data were not hidden by experimental quirks. The data cleaning process resulted in a notable improvement in the correlations, were all correlation values increased significantly after cleaning. A PCA showed that the feature set could potentially be reduced from 17 to 7 features. It was also shown that adding the temperature swing to the data set could add vital information. Overall, transistor degradation is a complex phenomenon to model, and providing a good prediction for the lifetime is a tough task for even more complex ML models. The focus was thus to use SR to find simple relationships that can be used to gain insight and eventually that can be used in physical informed networks. In the end, simple models, such as second-, fourth-power and inverse equations, were identified. For voltage-temperature two non-linear models were found (fourth power and inverse), however, the limited temperature range made them appear linear. The underlying data also appear quite linear, suggesting that the range is too short or the models suffer from overfitting. The second order power equations for voltage-consumed life looks reasonable}}, author = {{Dahlstedt, Oskar}}, issn = {{0282-1990}}, language = {{eng}}, note = {{Student Paper}}, title = {{Data-Driven Exploration of SiC MOSFET Aging Using Symbolic Regression}}, year = {{2025}}, }