.
-

La pensée et ses outils > Philosophie > Logique et théorie de la connaissance

La logique floue

La logique floue est une branche de la logique qui étend la logique classique pour traiter l'incertitude et la notion de flou dans les systèmes et les raisonnements. Contrairement à la logique classique, qui est basée sur des valeurs de vérité booléennes (vrai ou faux), la logique floue utilise des opérateurs flous tels que "et flou" et "ou flou", qui généralisent les opérations booléennes classiques en tenant compte des degrés de vérité associés à chaque proposition. Elle permet ainsi une gradation continue des valeurs de vérité, correspondant à des degrés de certitude ou de degrés d'appartenance à un ensemble. 

Dans la logique floue, les variables peuvent prendre des valeurs dans un intervalle continu entre 0 et 1. Les fonctions d'appartenance décrivent à quel point une valeur donnée appartient à un ensemble donné. Par exemple, une température de 25°C peut appartenir partiellement à l'ensemble "chaud" avec un degré de certitude de 0,8. Plutôt que des ensembles et sous-ensembles définis de manière binaire (éléments appartenant ou n'appartenant pas à l'ensemble), la logique floue utilise des ensembles et sous-ensembles flous pour lesquels l'appartenance d'éléments est graduelle. 

La logique floue trouve des applications dans le domaine du contrôle industriel, de l'intelligence artificielle, de la robotique, de la reconnaissance de formes, des systèmes de recommandation et de la prise de décision.

Introduction à la logique floue et ses motivations

La logique floue offre une manière plus nuancée et intuitive de représenter et de manipuler l'information, en particulier lorsque l'incertitude, l'imprécision et la subjectivité sont de la partie.

Qu'est-ce que la logique floue?
En résumé, la logique floue est une extension de la logique classique qui permet aux variables d'avoir un degré de vérité entre 0 et 1. Au lieu de simplement dire qu'une affirmation est vraie ou fausse, la logique floue permet d'exprimer des vérités partielles, comme "un peu vrai", "plutôt vrai", ou "très faux". La logique floue permet de graduer la vérité d'un énoncé.

Aperçu historique et domaines d'application de la logique floue. - Le concept de logique floue a été formalisé par Lotfi A. Zadeh, professeur à l'Université de Californie à Berkeley, en 1965. Dans son article fondateur Fuzzy Sets, Zadeh propose l'idée d'ensembles flous (fuzzy sets), où chaque élément appartient à un ensemble avec un degré d'appartenance compris entre 0 et 1, plutôt que simplement 0 ou 1. Zadeh a également introduit la notion de variables linguistiques (par exemple, "chaud", "froid", "tiède") utilisées pour modéliser des systèmes complexes. Initialement accueillie avec scepticisme, la logique floue a progressivement gagné en reconnaissance grâce à son succès dans diverses applications. L'une des premières applications pratiques de la logique floue, dans les années 1970-1980, a été le contrôle de systèmes complexes (par exemple, les systèmes de régulation de température ou les trains à grande vitesse au Japon). La logique floue a permis de créer des systèmes plus robustes face à l'incertitude, facilitant des applications dans la robotique, l'intelligence artificielle et l'automobile. Dans les années 1990, la logique floue s'est largement diffusée dans l'industrie (électronique grand public, caméras, climatiseurs, machines à laver intelligentes). Le Japon a été un des pionniers dans l'adoption de cette technologie, avec des entreprises comme Sony ou Mitsubishi. Aujourd'hui, la logique floue est utilisée dans :l'intelligence artificielle et l'apprentissage automatique; le traitement du langage naturel; la finance (modélisation du risque, prévisions); la médecine (diagnostic assisté par ordinateur). La logique floue a ouvert de nouvelles perspectives sur la manière dont on peut formaliser l'incertitude et a influencé des domaines comme la théorie des probabilités, les réseaux neuronaux et la théorie des systèmes complexes.
Limitations de la logique classique : vrai/faux, 0/1.
La logique classique, basée sur le principe du tiers exclu (une proposition est soit vraie, soit fausse, il n'y a pas de milieu), est extrêmement puissante et a servi de fondement à l'informatique moderne. Cependant, elle montre ses limites lorsqu'on essaie de représenter le monde réel, qui est rarement aussi tranché.

A la question: "Est-ce qu'il fait chaud aujourd'hui ?", la logique classique apporte une réponse  simple : "oui" ou "non". Mais la sensation de chaleur est subjective et dépend de nombreux facteurs (la personne, le contexte, l'heure de la journée, etc.). Un seuil précis pour définir "chaud" serait arbitraire et ne refléterait pas la réalité. La logique classique a du mal à gérer ces nuances et à quantifier des concepts comme "un peu chaud" ou "très chaud".

Pourquoi utiliser la logique floue?
La principale motivation derrière la logique floue est de mieux modéliser le raisonnement humain et les systèmes complexes où l'information peut être imprécise ou subjective. Elle offre un cadre plus naturel pour traiter des concepts qui ne se prêtent pas facilement à une classification binaire. En utilisant la logique floue, il devient possible de concevoir des systèmes qui répondent aux besoins suivants :

Gestion de l'incertitude. -  Face à des informations incomplètes ou ambiguës sur un état ou un événement, la logique floue permet de prendre des décisions raisonnables plutôt que de s'arrêter face à l'indécision. Par exemple, que faire lorsqu'une prévision météorologique annonce "une forte probabilité de pluie"?

Intégration de l'imprécision. - Des termes comme "chaud", "grand", "petit", "rapide" sont imprécis car leurs limites ne sont pas clairement définies. Le manque de clarté ou de définition précise d'un concept  peuvent être formalisés et utilisés dans des règles de décision. . 

Prise en compte de la subjectivité. - Le caractère relatif d'une perception ou d'un jugement dépend de l'observateur. La perception de la "chaleur" est subjective, car ce qui est chaud pour une personne peut être tiède pour une autre. Ce qui est "rapide" pour une tortue ne l'est pas pour une voiture de course. La logique floue permet de modéliser ces perceptions relatives. 

Simplification la conception de systèmes complexes. - En utilisant des règles linguistiques intuitives, il est souvent plus facile de développer des systèmes sophistiqués, en particulier dans des domaines où une modélisation mathématique précise est difficile.

Exemples introductifs : "grand", "chaud", "rapide".
La logique floue offre un cadre puissant pour traiter l'incertitude, l'imprécision et la subjectivité, ouvrant de nouvelles perspectives pour la conception de systèmes plus intelligents et adaptés au monde réel. Elle nous permet de passer du "tout ou rien" à une vision plus nuancée et flexible de la vérité. Quelques exemples concrets :
• "Grand". - En logique classique, une personne est soit "grande", soit "pas grande". Il faudrait définir un seuil arbitraire (par exemple, 1,80 m). En logique floue, on peut définir des "ensembles flous" pour "petit", "moyen" et "grand", où une personne de 1,75 m pourrait appartenir à la fois à l'ensemble "moyen" avec un certain degré, et à l'ensemble "grand" avec un degré inférieur.

• "Chaud". - Au lieu de simplement dire qu'une température est "chaude" au-dessus de 25°C, la logique floue peut définir des degrés d'appartenance à l'ensemble "chaud" en fonction de la température. Par exemple, 26°C pourrait être "un peu chaud", 30°C "modérément chaud" et 35°C "très chaud".

• "Rapide". - La vitesse d'une voiture peut être qualifiée de "lente", "moyenne" ou "rapide" selon le contexte (ville, autoroute, course automobile). La logique floue permet de définir ces ensembles flous et d'adapter l'interprétation de la rapidité en fonction de la situation.

Ensembles flous : définitions et représentations

Les ensembles flous (ou fuzzy sets en anglais) sont une généralisation de la théorie des ensembles classiques. Contrairement aux ensembles classiques où un élément appartient ou n'appartient pas à l'ensemble (appartenance binaire 0 ou 1), dans un ensemble flou, un élément peut avoir un degré d'appartenance à l'ensemble, compris entre 0 et 1. Cela permet de modéliser des concepts vagues et imprécis du langage naturel.

Univers du discours et ensembles flous.
On appelle univers du discours (X) l'ensemble de tous les éléments possibles que l'on considère dans un contexte donné. Un ensemble (ou sous-ensemble) flou, défini sur un univers du discours X (on parle d'ensemble flou sur X), représente une sous-partie de cet univers, mais avec une appartenance graduelle. Par exemple, si on parle de la "température chaude" (ensemble flou des rempératures chaudes), l'univers du discours pourrait être l'ensemble de toutes les températures possibles (en degrés Celsius, en kelvins, etc.).

Fonction d'appartenance.
Un ensemble flou A défini sur un univers du discours X est caractérisé par sa fonction d'appartenance (ou fonction caractéristique floue), notée généralement μA(x). Cette fonction associe à chaque élément x de l'univers du discours X un nombre réel dans l'intervalle [0, 1]. Ce nombre représente le degré d'appartenance de x à l'ensemble flou A.

μA(x) = 1 : l'élément x appartient pleinement à l'ensemble flou A.

μA(x) = 0 : l'élément x n'appartient pas du tout à l'ensemble flou A.

0 < μA(x) < 1 : l'élément x appartient partiellement à l'ensemble flou A. Plus la valeur est proche de 1, plus l'appartenance est forte.

Types de fonctions d'appartenance.
La forme de la fonction d'appartenance détermine comment les éléments sont associés à l'ensemble flou. Voici quelques types courants :
Fonction d'appartenance triangulaire. - Utile pour représenter des concepts avec un point central clair, comme "environ 50". Forme : un triangle défini par trois paramètres (a, b, c) où b est le sommet. Définition : μA(x) = 0, si x ≤ a ou x ≥ c; μA(x) = (x - a) / (b - a), si a < x ≤ b; μA(x) = (c - x) / (c - b), si b < x < c.

Fonction d'appartenance trapézoïdale. -  Permet de représenter des concepts avec une zone d'appartenance totale, comme "entre 20 et 30". Forme : un trapèze défini par quatre paramètres (a, b, c, d). Définition :μA(x) = 0, si x ≤ a ou x ≥ d; μA(x) = (x - a) / (b - a), si a < x ≤ b; μA(x) = 1, si b < x ≤ c; μA(x) = (d - x) / (d - c), si c < x < d.

Exemple d'utilisation d'une fonction d'appartenance trapézoïdale pour representer le concept  de "température chaude". Univers du discours (X) : Températures en degrés Celsius (par exemple, de 0 à 50°C). Ensemble flou : "chaud".  Fonction : d'appartenance : μChaud(x) = 0, si x ≤ 20°C;  μChaud(x) = (x - 20) / 5, si 20°C < x ≤ 25°C;  μChaud(x) = 1, si 25°C < x ≤ 35°C;μChaud(x) = (40 - x) / 5, si 35°C < x < 40°C; μChaud(x) = 0, si x ≥ 40°C. Une température de 22°C aurait un degré d'appartenance de 0.4 à "chaud", tandis qu'une température de 30°C aurait un degré d'appartenance de 1.
Fonction d'appartenance gaussienne (ou normale). -  : Idéale pour modéliser des phénomènes naturels avec une incertitude statistique, comme "autour de la moyenne". Forme : une cloche, définie par la moyenne (m) et l'écart-type (σ).  Définition : μA(x) = exp(-(x - m)² / (2σ²)).
Exemple d'utilisation d'une fonction d'appartenance gaussienne pour représenter le concept d'"âge moyen". Univers du discours (X) : âges en années (par exemple, de 0 à 100 ans). Ensemble flou : "moyen". Fonction d'appartenance :μMoyen(x) = exp(-(x - 45)² / (2 * 10²)). L'âge de 45 ans aurait le degré d'appartenance maximal (1) à "moyen", et l'appartenance diminue au fur et à mesure que l'âge s'éloigne de 45 ans.
Fonction d'appartenance sigmoïde. - Souvent utilisée pour représenter des transitions progressives, comme "croissant" ou "décroissant". Forme : Une courbe en forme de "S" ou de "S" inversé, définie par des paramètres qui contrôlent la pente et le point d'inflexion. Il existe plusieurs formes de fonctions sigmoïdes. Une forme courante est : μA(x) = 1 / (1 + exp(-a(x - b))).
Exemple d'utilisation d'une fonction d'appartenance sigmoïde pour représenter le concept de "vitesse élevée". Univers du discours (X) : vitesses en km/h (par exemple, de 0 à 150 km/h). Ensemble flou : "élevée". Fonction d'appartenance : μÉlevée(x) = 1 / (1 + exp(-0.2(x - 80))). À mesure que la vitesse augmente au-delà de 80 km/h, le degré d'appartenance à "élevée" augmente progressivement vers 1.
Il existe d'autres fonctions comme la fonction en forme de "pi", la fonction en forme de "Z", etc., adaptées à des situations spécifiques.

Représentation graphique des ensembles flous.
La représentation graphique d'un ensemble flou permet de visualiser sa forme et comprendre comment les éléments de l'univers du discours y appartiennent. L'axe des abscisses (x) eeprésente l'univers du discours X.; l'axe des ordonnées (y) eeprésente le degré d'appartenance μA(x), allant de 0 à 1. La fonction d'appartenance est tracée comme une courbe (ou une série de segments de droite) au-dessus de l'univers du discours. La hauteur de la courbe au-dessus d'un point x indique le degré d'appartenance de x à l'ensemble flou.

Opérations sur les ensembles flous

Opérations de base.
Soient A et B deux ensembles flous définis sur un univers de discours X. Chaque élément x de X a un degré d'appartenance à A (noté μA(x)) et à B (noté μB(x)), où μA(x) et μB(x) appartiennent à l'intervalle [0, 1].

Complémentation ( ¬A ou Ac).
Le complément d'un ensemble flou A contient les éléments qui n'appartiennent pas à A. Le degré d'appartenance d'un élément x au complément de A est défini comme :

μ¬A(x) = 1 - μA(x)

Plus le degré d'appartenance à A est élevé, plus le degré d'appartenance à son complément est faible, et vice versa.

Union (OU) (A ∪ B).
L'union de deux ensembles flous A et B contient les éléments qui appartiennent à A ou à B. Il existe différentes interprétations pour l'union, les plus courantes étant :

• L'interprétation min/max (opérateur maximum) :  μA ∪ B(x) = max(μA(x), μB(x)). Le degré d'appartenance à l'union est le maximum des degrés d'appartenance aux deux ensembles. On prend le niveau d'appartenance le plus élevé.
• L'interprétation probabiliste (opérateur somme algébrique) :  μA ∪ B(x) = μA(x) + μB(x) - μA(x) * μB(x). Cette interprétation est inspirée de la probabilité d'événements indépendants. Elle donne un degré d'appartenance à l'union qui est souvent supérieur à celui obtenu avec l'opérateur maximum, sauf si l'un des degrés d'appartenance est 1.
Intersection (ET) (A ∩ B).
L'intersection de deux ensembles flous A et B contient les éléments qui appartiennent à la fois à A et à B. Comme pour l'union, il existe différentes interprétations :
L'interprétation min/max (opérateur minimum) :  μA ∩ B(x) = min(μA(x), μB(x)). Le degré d'appartenance à l'intersection est le minimum des degrés d'appartenance aux deux ensembles. On prend le niveau d'appartenance le plus faible, car l'élément doit appartenir aux deux ensembles.

L'interprétation produit (opérateur produit algébrique) : μA ∩ B(x) = μA(x) * μB(x). Cette interprétation multiplie les degrés d'appartenance. Le résultat est toujours inférieur ou égal au minimum des deux degrés d'appartenance. Elle est souvent utilisée lorsque les ensembles représentent des contraintes qui doivent être satisfaites simultanément.

Différentes interprétations des opérateurs.
Comme illustré ci-dessus, les opérations d'union et d'intersection peuvent être interprétées de différentes manières. Le choix de l'interprétation dépend du contexte et de la sémantique que l'on souhaite donner aux opérations logiques "OU" et "ET" dans le domaine étudié. Les interprétations min/max sont les interprétations les plus courantes et les plus intuitives. Elles sont souvent utilisées en raison de leur simplicité et de leurs propriétés intéressantes. Les interprétations produit et probabiliste sont utiles dans des contextes où l'indépendance des événements ou une conjonction/disjonction plus "douce" est souhaitée. L'opérateur produit pour l'intersection a tendance à réduire davantage le degré d'appartenance que l'opérateur minimum. L'opérateur probabiliste pour l'union a tendance à augmenter davantage le degré d'appartenance que l'opérateur maximum. Il existe d'autres t-normes (pour l'intersection) et t-conormes (pour l'union) possibles, mais les opérateurs min/max et produit/probabiliste sont les plus fondamentaux et les plus largement utilisés.

Propriétés des opérations sur les ensembles flous.
Les opérations sur les ensembles flous héritent de nombreuses propriétés des opérations sur les ensembles classiques, mais avec quelques différences notables :

• Commutativité :  A ∪ B = B ∪ A; A ∩ B = B ∩ A. Vrai pour toutes les interprétations courantes.

• Associativité : (A ∪ B) ∪ C = A ∪ (B ∪ C);  (A ∩ B) ∩ C = A ∩ (B ∩ C). VVrai pour toutes les interprétations courantes.

• Distributivité :  A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C);  A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C). Vrai pour l'interprétation min/max.

• Idempotence :  A ∪ A = A;  A ∩ A = A. Vrai pour toutes les interprétations courantes.

• Lois de De Morgan : ¬(A ∪ B) = ¬A ∩ ¬B; ¬(A ∩ B) = ¬A ∪ ¬B. Vrai pour toutes les interprétations courantes, à condition que les opérations d'union et d'intersection soient duales par rapport à la négation choisie.

• Loi du tiers exclu et loi de contradiction :

A ∪ ¬A ≠ X (ensemble universel). En général, l'union d'un ensemble flou et de son complément ne donne pas l'ensemble universel. Il peut exister des éléments avec un degré d'appartenance intermédiaire à A et à ¬A.

A ∩ ¬A ≠ Ø (ensemble vide). En général, l'intersection d'un ensemble flou et de son complément ne donne pas l'ensemble vide. Il peut exister des éléments avec un certain degré d'appartenance à la fois à A et à ¬A.

Concepts dérivés.
Les concepts suivants permettent d'analyser et de caractériser davantage les ensembles flous :
Hauteur : h(A). - La hauteur d'un ensemble flou A est le supremum (la plus petite borne supérieure) de ses degrés d'appartenance :

h(A) = supx  X μA(x). -  Indique le degré d'appartenance maximal atteint par au moins un élément dans l'ensemble flou. Un ensemble flou est dit normal si sa hauteur est égale à 1.

Support : Supp(A). - Le support d'un ensemble flou A est l'ensemble des éléments dont le degré d'appartenance est strictement supérieur à zéro :

Supp(A) = {x  X | μA(x) > 0}. - Contient tous les éléments qui ont une certaine appartenance à l'ensemble flou, même si elle est faible.

Noyau : Noy(A). - Le noyau d'un ensemble flou A est l'ensemble des éléments dont le degré d'appartenance est égal à un :

Noy(A) = {x  X | μA(x) = 1}. - Contient les éléments qui appartiennent pleinement à l'ensemble flou.

Alpha-coupure : Aα. - L'alpha-coupure d'un ensemble flou A pour un niveau α  [0, 1] est un ensemble classique contenant tous les éléments dont le degré d'appartenance est supérieur ou égal à α : Aα = {x  X | μA(x) ≥ α}. Permet de transformer un ensemble flou en un ensemble classique en fixant un seuil d'appartenance. Plus α est élevé, plus l'alpha-coupure est restrictive.

Relations floues

Les relations floues sont une extension du concept de relations classiques (ou nettes) qui permettent de modéliser des liens entre des éléments avec un certain degré d'association ou d'appartenance. Contrairement aux relations classiques où un élément est soit en relation avec un autre (appartenance binaire : 0 ou 1), les relations floues introduisent un degré d'appartenance compris entre 0 et 1.

Définition d'une relation floue.
Soient deux ensembles non vides, A et B. Une relation floue R de A vers B est définie comme un sous-ensemble flou du produit cartésien A x B. Ceci signifie que pour chaque paire ordonnée (a, b) appartenant à A x B, on associe un degré d'appartenance à la relation R, noté μR(a, b), tel que : μR(a, b)  [0, 1], où  μR(a, b) = 1 signifie que l'élément 'a' est pleinement en relation avec l'élément 'b'; μR(a, b) = 0 signifie que l'élément 'a' n'est absolument pas en relation avec l'élément 'b';  0 < μR(a, b) < 1 signifie que l'élément 'a' est partiellement en relation avec l'élément 'b', avec un degré d'association donné par la valeur de μR(a, b).

Considérons, par exemple, l'ensemble A = {Paris, Marseille, Toulouse} et l'ensemble B = {Grande ville}. On peut définir une relation floue "est une grande ville" de A vers B : μR(Paris, Grande ville) = 0,9 (Paris est fortement considérée comme une grande ville); μR(Marseille, Grande ville) = 0,8 (Marseille est également une grande ville, mais peut-être un peu moins que Paris); μR(Toulouse, Grande ville) = 0,7 (Toulouse est aussi une grande ville, mais avec un degré d'appartenance potentiellement inférieur).
Représentation matricielle des relations floues:
Une relation floue R de A = {a1, a2, ..., am} vers B = {b1, b2, ..., bn} peut être représentée par une matrice d'appartenance MR de dimension m x n, où l'élément à la i-ème ligne et j-ème colonne est le degré d'appartenance de la paire (ai, bj) à la relation R.
Reprenons l'exemple précédent et considérons l'ensemble B = {Ville moyenne, Grande ville}. La relation floue "est de la taille d'une" de A vers B pourrait être représentée par la matrice suivante :

Composition de relations floues.
La composition de relations floues permet de combiner deux relations floues pour en obtenir une nouvelle, exprimant une relation indirecte. Cette opération est souvent utilisée dans des systèmes où plusieurs étapes de raisonnement incertain ou partiel doivent être enchaînées. Il existe deux principales méthodes de composition : la composition max-min et la composition max-produit.

Composition max-min.
La composition max-min est la plus utilisée en logique floue. Elle repose sur les opérations de minimum et de maximum pour évaluer la force de la relation entre les ensembles. On considère tous les chemins possibles reliant x à z via y. Pour chaque yy, on évalue le degré minimal entre R1(x,y) et R2(y,z). Puis on prend le maximum de ces valeurs pour obtenir le degré de R3(x,z). Formule :

min mesure la force minimale dans la chaîne relationnelle (intersection floue); sup⁡  cherche le chemin qui maximise cette force minimale.

Composition max-produit.
La composition max-produit est une alternative qui utilise l'opération produit pour modéliser la combinaison des relations floues. Ici, on calcule le produit des degrés d'appartenance pour chaque chemin, et on retient le chemin qui donne la plus grande valeur. Cela reflète une approche plus continue que le max-min, en multipliant directement les degrés flous au lieu de les limiter par une borne inférieure. Formule :

.  correspond au produit des degrés d'appartenance.; sup ⁡ prend la valeur maximale parmi tous les produits possibles.

L'inférence floue

Les systèmes d'inférence floue (SIF), également appelés systèmes de règles floues, sont des outils de calcul qui permettent de modéliser et de raisonner sur des informations imprécises, incertaines ou qualitatives. Les SIF sont particulièrement utiles dans les situations où la modélisation mathématique précise est difficile ou impossible, les données sont bruitées, incertaines ou incomplètes, les connaissances sont exprimées de manière linguistique (ex : "Si la température est élevée ALORS le ventilateur doit être rapide"). On souhaite imiter le raisonnement humain qui est habituellement basé sur des notions subjectives.

Le processus d'inférence floue.
Le processus d'inférence floue se déroule généralement en plusieurs étapes :

Fuzzification.
L'étape de fuzzification (de l'anglais fuzzy = flou) consiste à transformer les entrées numériques (valeurs nettes / crisp values) en ensembles flous. Chaque valeur d'entrée est associée à un ou plusieurs ensembles flous avec un degré d'appartenance. Par exemple, une température de 25°C pourrait appartenir à la fois à l'ensemble flou "Tiède" avec un degré de 0,8 et à l'ensemble flou "Chaud" avec un degré de 0,2. Ceci se fait en utilisant des fonctions d'appartenance (triangulaires, trapézoïdales, gaussiennes, etc.) qui définissent la forme de l'ensemble flou.

Règles floues.
Le coeur du système d'inférence floue réside dans un ensemble de règles SI-ALORS (IF-THEN) qui décrivent le comportement du système. Ces règles relient les variables d'entrée aux variables de sortie en utilisant des termes linguistiques (les ensembles flous définis précédemment). La partie SI ou IF (antécédent) décrit les conditions sur les entrées, et la partie ALORS ou THEN (conséquent) décrit les actions ou conclusions sur les sorties.

Agrégation.
L'agrégation est application de l'opérateur logique à l'antécédent. Si l'antécédent d'une règle contient plusieurs propositions liées par des opérateurs logiques (ET ou AND, OU ou OR), il faut combiner les degrés d'appartenance de ces propositions pour obtenir le degré d'activation de l'antécédent. Les opérateurs logiques flous -comme MIN pour ET (AND) et MAX pour OU (OR) -  sont utilisés ici.

Activation (inférence)
Le degré d'activation de l'antécédent (calculé à l'étape précédente) est utilisé pour déterminer le degré avec lequel le conséquent de la règle est activé. Dans le système de Mamdani, cette étape se fait généralement par troncature (clipping) ou mise à l'échelle (scaling) de la fonction d'appartenance de l'ensemble flou du conséquent.

Troncature. - La fonction d'appartenance du conséquent est coupée à la hauteur du degré d'activation de l'antécédent.

Mise à l'échelle. - La fonction d'appartenance du conséquent est multipliée (verticalement) par le degré d'activation de l'antécédent.


Accumulation.
L'accumulation est l'agrégation des conséquents. Les sorties floues de toutes les règles activées sont combinées pour former un seul ensemble flou représentant la sortie globale du système. Plusieurs méthodes d'accumulation existent, comme la méthode MAX (on prend le maximum des fonctions d'appartenance) ou la méthode SOMME (on additionne les fonctions d'appartenance, en limitant le résultat à 1).

Défuzzification.
La dernière étape consiste à transformer l'ensemble flou résultant en une valeur de sortie numérique (crisp value) compréhensible pour le monde réel. Plusieurs méthodes de défuzzification sont disponibles, les plus courantes étant :

• Le centre de gravité. - La valeur de sortie est le centre de gravité de l'aire sous la fonction d'appartenance de l'ensemble flou résultant. C'est une méthode très utilisée.
• La bissectrice. - La valeur de sortie est l'abscisse de la droite verticale qui divise l'aire sous la fonction d'appartenance en deux parties égales.

• La moyenne des maximums (mean of maxima - MOM). - La valeur de sortie est la moyenne des abscisses pour lesquelles la fonction d'appartenance atteint son maximum.

• Le plus petit des maximums (smallest of maxima - SOM). - La valeur de sortie est la plus petite abscisse pour laquelle la fonction d'appartenance atteint son maximum.

• Le plus grand des maximums (largest of maxima - LOM). - La valeur de sortie est la plus grande abscisse pour laquelle la fonction d'appartenance atteint son maximum.

Les systèmes d'inférence de Mamdani et de Sugeno-Takagi-Kang (TSK).
Les systèmes d'inférence floue de Mamdani et de Sugeno-Takagi-Kang (TSK) sont deux approches courantes en logique floue pour modéliser des systèmes complexes. 

Système d'inférence de Mamdani.
Le système d'inférence de Mamdani, développé en 1975 par Ebrahim Mamdani et son équipe, est l'une des premières et des plus répandues architectures de systèmes d'inférence floue. Sa principale caractéristique est que les conséquents des règles sont également des ensembles flous (structure : entrée floue → règles floues → sortie floue). L'output final est obtenu par défuzzification (transformation de l'ensemble flou de sortie en une valeur unique). Déroulement :

1) Fuzzification : Convertit les entrées précises en valeurs floues (ex. température élevée). 2) Évaluation des règles : Applique des opérateurs logiques flous (min, max). 3) Agrégation : Combine les sorties des règles. 4)  Défuzzification : Transforme la sortie floue en une valeur précise (par exemple, moyenne pondérée).
Les avantages de ce système sont l'interprétation facile et intuitive (similaire au raisonnement humain) et l'adaptation aux systèmes complexes où les relations sont difficiles à modéliser mathématiquement. Les inconvénients tiennent à ce que la défuzzification peut entraîner une perte d'information et à la nécessité d'un calcul intensif pour des systèmes à plusieurs entrées et sorties.

Système d'inférence de Sugeno-Takagi-Kang (TSK)
Le système d'inférence de Sugeno-Takagi-Kang (STK), ou simplement système de Sugeno, se distingue du système de Mamdani par sa manière de définir les conséquences des règles floues. Au lieu d'utiliser des ensembles flous pour les conséquences comme dans le système de Mamdani, le système de Sugeno utilise des fonctions linéaires ou constantes des variables d'entrée (structure : entrée floue → règles floues → sortie précise (linéaire ou constante)).

Développé par Michio Sugeno, Tomohiro Takagi et Geon Kang dans les années 1980, le système de Sugeno a été conçu pour offrir une approche plus mathématiquement tractable et computationnellement efficace que les systèmes d'inférence floue traditionnels. Son principal avantage réside dans la simplification du processus de déflouzification, qui devient une simple opération algébrique. Déroulement : 

1) Fuzzification : convertit les entrées précises en valeurs floues. 2)    Évaluation des règles : les règles sont définies par des fonctions linéaires ou constantes. 3) Agrégation : combine les sorties pondérées (sans défuzzification classique).
Les avantages sont la rapidité de calcul (pas de défuzzification complexe), ce qui convient aux systèmes en temps réel, et la facilité d'intégrationr dans des systèmes d'apprentissage automatique (modèles hybrides). Les inconvénients sont le moindre caractère intuitif pour les humains et la nécessité des données précises pour établir les fonctions linéaires.
.


Dictionnaire Idées et méthodes
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
[Aide][Recherche sur Internet]

© Serge Jodra,2024. - Reproduction interdite.