 |
La
logique
floue est une branche de la logique qui étend la logique classique
pour traiter l'incertitude et la notion de flou dans les systèmes et les
raisonnements.
Contrairement à la logique classique, qui est basée sur des valeurs
de vérité booléennes (vrai ou faux), la logique floue utilise des
opérateurs flous tels que "et flou" et "ou flou", qui généralisent les
opérations booléennes classiques en tenant compte des degrés de vérité
associés à chaque proposition. Elle permet ainsi une gradation continue
des valeurs de vérité, correspondant à des degrés de certitude ou de
degrés d'appartenance à un ensemble.
Dans la logique floue,
les variables peuvent prendre des valeurs dans un intervalle
continu entre 0 et 1. Les fonctions d'appartenance décrivent à quel point
une valeur donnée appartient à un ensemble donné. Par exemple, une température
de 25°C peut appartenir partiellement à l'ensemble "chaud" avec un degré
de certitude de 0,8. Plutôt que des ensembles et sous-ensembles définis
de manière binaire (éléments appartenant ou n'appartenant pas à l'ensemble),
la logique floue utilise des ensembles et sous-ensembles flous pour lesquels
l'appartenance d'éléments est graduelle.
La logique floue
trouve des applications dans le domaine du contrôle industriel, de l'intelligence
artificielle, de la robotique, de la reconnaissance de formes, des
systèmes de recommandation et de la prise de décision.
Introduction à la
logique floue et ses motivations
La logique floue offre
une manière plus nuancée et intuitive de représenter et de manipuler
l'information, en particulier lorsque l'incertitude, l'imprécision et
la subjectivité sont de la partie.
Qu'est-ce que
la logique floue?
En résumé, la
logique floue est une extension de la logique classique qui permet aux
variables d'avoir un degré de vérité entre 0 et 1. Au lieu de simplement
dire qu'une affirmation est vraie ou fausse, la logique floue permet d'exprimer
des vérités partielles, comme "un peu vrai", "plutôt vrai", ou "très
faux". La logique floue permet de graduer la vérité d'un énoncé.
Aperçu
historique et domaines d'application de la logique floue. - Le concept
de logique floue a été formalisé par Lotfi A. Zadeh, professeur à l'Université
de Californie à Berkeley, en 1965. Dans son article fondateur Fuzzy
Sets, Zadeh propose l'idée d'ensembles flous (fuzzy sets),
où chaque élément appartient à un ensemble avec un degré d'appartenance
compris entre 0 et 1, plutôt que simplement 0 ou 1. Zadeh a également
introduit la notion de variables linguistiques (par exemple, "chaud", "froid",
"tiède") utilisées pour modéliser des systèmes complexes. Initialement
accueillie avec scepticisme, la logique floue a progressivement gagné
en reconnaissance grâce à son succès dans diverses applications. L'une
des premières applications pratiques de la logique floue, dans les années
1970-1980, a été le contrôle de systèmes complexes (par exemple, les
systèmes de régulation de température ou les trains à grande vitesse
au Japon). La logique floue a permis de créer des systèmes plus robustes
face à l'incertitude, facilitant des applications dans la robotique, l'intelligence
artificielle et l'automobile. Dans les années 1990, la logique floue s'est
largement diffusée dans l'industrie (électronique grand public, caméras,
climatiseurs, machines à laver intelligentes). Le Japon a été un des
pionniers dans l'adoption de cette technologie, avec des entreprises comme
Sony ou Mitsubishi. Aujourd'hui, la logique floue est utilisée dans :l'intelligence
artificielle et l'apprentissage automatique; le traitement du langage naturel;
la finance (modélisation du risque,
prévisions); la médecine (diagnostic assisté par ordinateur). La logique
floue a ouvert de nouvelles perspectives sur la manière dont on peut formaliser
l'incertitude et a influencé des domaines comme la théorie des probabilités,
les réseaux neuronaux et la théorie
des systèmes complexes.
Limitations
de la logique classique : vrai/faux, 0/1.
La logique classique,
basée sur le principe du tiers exclu (une proposition est soit vraie,
soit fausse, il n'y a pas de milieu), est extrêmement puissante et a servi
de fondement à l'informatique moderne. Cependant, elle montre ses limites
lorsqu'on essaie de représenter le monde réel, qui est rarement aussi
tranché.
A la question: "Est-ce
qu'il fait chaud aujourd'hui ?", la logique classique apporte une réponse
simple : "oui" ou "non". Mais la sensation de chaleur est subjective et
dépend de nombreux facteurs (la personne, le contexte, l'heure de la journée,
etc.). Un seuil précis pour définir "chaud" serait arbitraire et ne refléterait
pas la réalité. La logique classique a du mal à gérer ces nuances et
à quantifier des concepts comme "un peu chaud" ou "très chaud".
Pourquoi
utiliser la logique floue?
La principale motivation
derrière la logique floue est de mieux modéliser le raisonnement humain
et les systèmes complexes où l'information peut être imprécise ou subjective.
Elle offre un cadre plus naturel pour traiter des concepts qui ne se prêtent
pas facilement à une classification binaire. En utilisant la logique floue,
il devient possible de concevoir des systèmes qui répondent aux besoins
suivants :
• Gestion
de l'incertitude. - Face à des informations incomplètes ou
ambiguës sur un état ou un événement, la logique floue permet de prendre
des décisions raisonnables plutôt que de s'arrêter face à l'indécision.
Par exemple, que faire lorsqu'une prévision météorologique annonce "une
forte probabilité de pluie"?
• Intégration
de l'imprécision. - Des termes comme "chaud", "grand", "petit", "rapide"
sont imprécis car leurs limites ne sont pas clairement définies. Le manque
de clarté ou de définition précise d'un concept peuvent être
formalisés et utilisés dans des règles de décision. .
• Prise en compte
de la subjectivité. - Le caractère relatif d'une perception ou d'un
jugement dépend de l'observateur. La perception de la "chaleur" est subjective,
car ce qui est chaud pour une personne peut être tiède pour une autre.
Ce qui est "rapide" pour une tortue ne l'est pas pour une voiture de course.
La logique floue permet de modéliser ces perceptions relatives.
• Simplification
la conception de systèmes complexes. - En utilisant des règles linguistiques
intuitives, il est souvent plus facile de développer des systèmes sophistiqués,
en particulier dans des domaines où une modélisation mathématique précise
est difficile.
Exemples
introductifs : "grand", "chaud", "rapide".
La logique floue
offre un cadre puissant pour traiter l'incertitude, l'imprécision et la
subjectivité, ouvrant de nouvelles perspectives pour la conception de
systèmes plus intelligents et adaptés au monde réel. Elle nous permet
de passer du "tout ou rien" à une vision plus nuancée et flexible de
la vérité. Quelques exemples concrets :
• "Grand".
- En logique classique, une personne est soit "grande", soit "pas grande".
Il faudrait définir un seuil arbitraire (par exemple, 1,80 m). En logique
floue, on peut définir des "ensembles flous" pour "petit", "moyen" et
"grand", où une personne de 1,75 m pourrait appartenir à la fois à l'ensemble
"moyen" avec un certain degré, et à l'ensemble "grand" avec un degré
inférieur.
• "Chaud". - Au
lieu de simplement dire qu'une température est "chaude" au-dessus de 25°C,
la logique floue peut définir des degrés d'appartenance à l'ensemble
"chaud" en fonction de la température. Par exemple, 26°C pourrait être
"un peu chaud", 30°C "modérément chaud" et 35°C "très chaud".
• "Rapide". - La
vitesse d'une voiture peut être qualifiée de "lente", "moyenne" ou "rapide"
selon le contexte (ville, autoroute, course automobile). La logique floue
permet de définir ces ensembles flous et d'adapter l'interprétation de
la rapidité en fonction de la situation.
Ensembles flous :
définitions et représentations
Les ensembles flous
(ou fuzzy sets en anglais) sont une généralisation de la théorie
des ensembles classiques. Contrairement aux ensembles classiques où
un élément appartient ou n'appartient pas à l'ensemble (appartenance
binaire 0 ou 1), dans un ensemble flou, un élément peut avoir un degré
d'appartenance à l'ensemble, compris entre 0 et 1. Cela permet de modéliser
des concepts vagues et imprécis du langage naturel.
Univers du discours
et ensembles flous.
On appelle univers
du discours (X) l'ensemble de tous les éléments possibles que l'on considère
dans un contexte donné. Un ensemble (ou sous-ensemble) flou, défini sur
un univers du discours X (on parle d'ensemble flou sur X), représente
une sous-partie de cet univers, mais avec une appartenance graduelle. Par
exemple, si on parle de la "température chaude" (ensemble flou des rempératures
chaudes), l'univers du discours pourrait être l'ensemble de toutes les
températures possibles (en degrés Celsius, en kelvins, etc.).
Fonction d'appartenance.
Un ensemble flou
A défini sur un univers du discours X est caractérisé par sa fonction
d'appartenance (ou fonction caractéristique floue), notée généralement
μA(x). Cette fonction associe à chaque élément x de l'univers du discours
X un nombre réel dans l'intervalle [0, 1]. Ce nombre représente le degré
d'appartenance de x à l'ensemble flou A.
μA(x) =
1 : l'élément x appartient pleinement à l'ensemble flou A.
μA(x) = 0 : l'élément
x n'appartient pas du tout à l'ensemble flou A.
0 < μA(x) <
1 : l'élément x appartient partiellement à l'ensemble flou A. Plus la
valeur est proche de 1, plus l'appartenance est forte.
Types
de fonctions d'appartenance.
La forme de la fonction
d'appartenance détermine comment les éléments sont associés à l'ensemble
flou. Voici quelques types courants :
• Fonction
d'appartenance triangulaire. - Utile pour représenter des concepts
avec un point central clair, comme "environ 50". Forme : un triangle défini
par trois paramètres (a, b, c) où b est le sommet. Définition : μA(x)
= 0, si x ≤ a ou x ≥ c; μA(x) = (x - a) / (b - a), si a < x ≤
b; μA(x) = (c - x) / (c - b), si b < x < c.
• Fonction d'appartenance
trapézoïdale. - Permet de représenter des concepts avec une
zone d'appartenance totale, comme "entre 20 et 30". Forme : un trapèze
défini par quatre paramètres (a, b, c, d). Définition :μA(x) = 0, si
x ≤ a ou x ≥ d; μA(x) = (x - a) / (b - a), si a < x ≤ b; μA(x)
= 1, si b < x ≤ c; μA(x) = (d - x) / (d - c), si c < x < d.
Exemple
d'utilisation d'une fonction d'appartenance trapézoïdale pour representer
le concept de "température chaude". Univers du discours (X) : Températures
en degrés Celsius (par exemple, de 0 à 50°C). Ensemble flou : "chaud".
Fonction : d'appartenance : μChaud(x) = 0, si x ≤ 20°C; μChaud(x)
= (x - 20) / 5, si 20°C < x ≤ 25°C; μChaud(x) = 1, si 25°C
< x ≤ 35°C;μChaud(x) = (40 - x) / 5, si 35°C < x < 40°C;
μChaud(x) = 0, si x ≥ 40°C. Une température de 22°C aurait un degré
d'appartenance de 0.4 à "chaud", tandis qu'une température de 30°C aurait
un degré d'appartenance de 1.
• Fonction d'appartenance
gaussienne (ou normale). - : Idéale pour modéliser des phénomènes
naturels avec une incertitude statistique, comme "autour de la moyenne".
Forme : une cloche, définie par la moyenne (m) et l'écart-type (σ).
Définition : μA(x) = exp(-(x - m)² / (2σ²)).
Exemple
d'utilisation d'une fonction d'appartenance gaussienne pour représenter
le concept d'"âge moyen". Univers du discours (X) : âges en années (par
exemple, de 0 à 100 ans). Ensemble flou : "moyen". Fonction d'appartenance
:μMoyen(x) = exp(-(x - 45)² / (2 * 10²)). L'âge de 45 ans aurait le
degré d'appartenance maximal (1) à "moyen", et l'appartenance diminue
au fur et à mesure que l'âge s'éloigne de 45 ans.
• Fonction d'appartenance
sigmoïde. - Souvent utilisée pour représenter des transitions progressives,
comme "croissant" ou "décroissant". Forme : Une courbe en forme de "S"
ou de "S" inversé, définie par des paramètres qui contrôlent la pente
et le point d'inflexion. Il existe plusieurs formes de fonctions sigmoïdes.
Une forme courante est : μA(x) = 1 / (1 + exp(-a(x - b))).
Exemple d'utilisation d'une fonction d'appartenance sigmoïde pour représenter
le concept de "vitesse élevée". Univers du discours (X) : vitesses en
km/h (par exemple, de 0 à 150 km/h). Ensemble flou : "élevée". Fonction
d'appartenance : μÉlevée(x) = 1 / (1 + exp(-0.2(x - 80))). À mesure
que la vitesse augmente au-delà de 80 km/h, le degré d'appartenance à
"élevée" augmente progressivement vers 1.
Il existe d'autres fonctions
comme la fonction en forme de "pi", la fonction en forme de "Z", etc.,
adaptées à des situations spécifiques.
Représentation
graphique des ensembles flous.
La représentation
graphique d'un ensemble flou permet de visualiser sa forme et comprendre
comment les éléments de l'univers du discours y appartiennent. L'axe
des abscisses (x) eeprésente l'univers du discours X.; l'axe des ordonnées
(y) eeprésente le degré d'appartenance μA(x), allant de 0 à 1. La fonction
d'appartenance est tracée comme une courbe (ou une série de segments
de droite) au-dessus de l'univers du discours. La hauteur de la courbe
au-dessus d'un point x indique le degré d'appartenance de x à l'ensemble
flou.
Opérations sur les
ensembles flous
Opérations de base.
Soient A et B deux
ensembles flous définis sur un univers de discours X. Chaque élément
x de X a un degré d'appartenance à A (noté μA(x)) et à B (noté μB(x)),
où μA(x) et μB(x) appartiennent à l'intervalle [0, 1].
Complémentation
( ¬A ou Ac).
Le complément d'un
ensemble flou A contient les éléments qui n'appartiennent pas à A. Le
degré d'appartenance d'un élément x au complément de A est défini
comme :
μ¬A(x) = 1 - μA(x)
Plus le degré d'appartenance
à A est élevé, plus le degré d'appartenance à son complément est
faible, et vice versa.
Union
(OU) (A ∪ B).
L'union de deux
ensembles flous A et B contient les éléments qui appartiennent à A ou
à B. Il existe différentes interprétations pour l'union, les plus courantes
étant :
• L'interprétation
min/max (opérateur maximum) : μA ∪ B(x) = max(μA(x), μB(x)).
Le degré d'appartenance à l'union est le maximum des degrés d'appartenance
aux deux ensembles. On prend le niveau d'appartenance le plus élevé.
• L'interprétation
probabiliste (opérateur somme algébrique) : μA ∪ B(x) = μA(x)
+ μB(x) - μA(x) * μB(x). Cette interprétation est inspirée de la probabilité
d'événements indépendants. Elle donne un degré d'appartenance à l'union
qui est souvent supérieur à celui obtenu avec l'opérateur maximum, sauf
si l'un des degrés d'appartenance est 1.
Intersection
(ET) (A ∩ B).
L'intersection de
deux ensembles flous A et B contient les éléments qui appartiennent à
la fois à A et à B. Comme pour l'union, il existe différentes interprétations
:
L'interprétation
min/max (opérateur minimum) : μA ∩ B(x) = min(μA(x), μB(x)).
Le degré d'appartenance à l'intersection est le minimum des degrés d'appartenance
aux deux ensembles. On prend le niveau d'appartenance le plus faible, car
l'élément doit appartenir aux deux ensembles.
L'interprétation
produit (opérateur produit algébrique) : μA ∩ B(x) = μA(x) * μB(x).
Cette interprétation multiplie les degrés d'appartenance. Le résultat
est toujours inférieur ou égal au minimum des deux degrés d'appartenance.
Elle est souvent utilisée lorsque les ensembles représentent des contraintes
qui doivent être satisfaites simultanément.
Différentes
interprétations des opérateurs.
Comme illustré
ci-dessus, les opérations d'union et d'intersection peuvent être interprétées
de différentes manières. Le choix de l'interprétation dépend du contexte
et de la sémantique que l'on souhaite donner aux opérations logiques
"OU" et "ET" dans le domaine étudié. Les interprétations min/max sont
les interprétations les plus courantes et les plus intuitives. Elles sont
souvent utilisées en raison de leur simplicité et de leurs propriétés
intéressantes. Les interprétations produit et probabiliste sont utiles
dans des contextes où l'indépendance des événements ou une conjonction/disjonction
plus "douce" est souhaitée. L'opérateur produit pour l'intersection a
tendance à réduire davantage le degré d'appartenance que l'opérateur
minimum. L'opérateur probabiliste pour l'union a tendance à augmenter
davantage le degré d'appartenance que l'opérateur maximum. Il existe
d'autres t-normes (pour l'intersection) et t-conormes (pour l'union) possibles,
mais les opérateurs min/max et produit/probabiliste sont les plus fondamentaux
et les plus largement utilisés.
Propriétés des
opérations sur les ensembles flous.
Les opérations
sur les ensembles flous héritent de nombreuses propriétés des opérations
sur les ensembles classiques, mais avec quelques différences notables
:
• Commutativité
: A ∪ B = B ∪ A; A ∩ B = B ∩ A. Vrai pour toutes les interprétations
courantes.
• Associativité
: (A ∪ B) ∪ C = A ∪ (B ∪ C); (A ∩ B) ∩ C = A ∩ (B ∩
C). VVrai pour toutes les interprétations courantes.
• Distributivité
: A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C); A ∩ (B ∪ C)
= (A ∩ B) ∪ (A ∩ C). Vrai pour l'interprétation min/max.
• Idempotence :
A ∪ A = A; A ∩ A = A. Vrai pour toutes les interprétations courantes.
• Lois de De Morgan
: ¬(A ∪ B) = ¬A ∩ ¬B; ¬(A ∩ B) = ¬A ∪ ¬B. Vrai pour toutes
les interprétations courantes, à condition que les opérations d'union
et d'intersection soient duales par rapport à la négation choisie.
• Loi du tiers
exclu et loi de contradiction :
A ∪ ¬A
≠ X (ensemble universel). En général, l'union d'un ensemble flou et
de son complément ne donne pas l'ensemble universel. Il peut exister des
éléments avec un degré d'appartenance intermédiaire à A et à ¬A.
A ∩ ¬A ≠ Ø
(ensemble vide). En général, l'intersection d'un ensemble flou et de
son complément ne donne pas l'ensemble vide. Il peut exister des éléments
avec un certain degré d'appartenance à la fois à A et à ¬A.
Concepts dérivés.
Les concepts suivants
permettent d'analyser et de caractériser davantage les ensembles flous
:
Hauteur
: h(A). - La hauteur d'un ensemble flou A est le supremum (la plus petite
borne supérieure) de ses degrés d'appartenance :
h(A) = supx
X μA(x). - Indique le degré d'appartenance maximal atteint par
au moins un élément dans l'ensemble flou. Un ensemble flou est dit normal
si sa hauteur est égale à 1.
Support : Supp(A).
- Le support d'un ensemble flou A est l'ensemble des éléments dont le
degré d'appartenance est strictement supérieur à zéro :
Supp(A) = {x
X | μA(x) > 0}. - Contient tous les éléments qui ont une certaine appartenance
à l'ensemble flou, même si elle est faible.
Noyau : Noy(A). -
Le noyau d'un ensemble flou A est l'ensemble des éléments dont le degré
d'appartenance est égal à un :
Noy(A) = {x
X | μA(x) = 1}. - Contient les éléments qui appartiennent pleinement
à l'ensemble flou.
Alpha-coupure : Aα.
- L'alpha-coupure d'un ensemble flou A pour un niveau α
[0, 1] est un ensemble classique contenant tous les éléments dont le
degré d'appartenance est supérieur ou égal à α : Aα = {x
X | μA(x) ≥ α}. Permet de transformer un ensemble flou en un ensemble
classique en fixant un seuil d'appartenance. Plus α est élevé, plus
l'alpha-coupure est restrictive.
Relations floues
Les relations floues
sont une extension du concept de relations classiques (ou nettes) qui permettent
de modéliser des liens entre des éléments avec un certain degré d'association
ou d'appartenance. Contrairement aux relations classiques où un élément
est soit en relation avec un autre (appartenance binaire : 0 ou 1), les
relations floues introduisent un degré d'appartenance compris entre 0
et 1.
Définition d'une
relation floue.
Soient deux ensembles
non vides, A et B. Une relation floue R de A vers B est définie comme
un sous-ensemble flou du produit cartésien A x B. Ceci signifie que pour
chaque
paire ordonnée (a, b) appartenant à A x B, on associe un degré d'appartenance
à la relation R, noté μR(a, b), tel que : μR(a, b)
[0, 1], où μR(a, b) = 1 signifie que l'élément 'a' est pleinement
en relation avec l'élément 'b'; μR(a, b) = 0 signifie que l'élément
'a' n'est absolument pas en relation avec l'élément 'b'; 0 <
μR(a, b) < 1 signifie que l'élément 'a' est partiellement en relation
avec l'élément 'b', avec un degré d'association donné par la valeur
de μR(a, b).
Considérons,
par exemple, l'ensemble A = {Paris, Marseille, Toulouse} et l'ensemble
B = {Grande ville}. On peut définir une relation floue "est une grande
ville" de A vers B : μR(Paris, Grande ville) = 0,9 (Paris est fortement
considérée comme une grande ville); μR(Marseille, Grande ville) = 0,8
(Marseille est également une grande ville, mais peut-être un peu moins
que Paris); μR(Toulouse, Grande ville) = 0,7 (Toulouse est aussi une grande
ville, mais avec un degré d'appartenance potentiellement inférieur).
Représentation matricielle
des relations floues:
Une relation floue
R de A = {a1, a2, ..., am}
vers B = {b1, b2, ..., bn}
peut être représentée par une matrice d'appartenance MR
de dimension m x n, où l'élément à la i-ème ligne et j-ème colonne
est le degré d'appartenance de la paire (ai, bj)
à la relation R.
Reprenons
l'exemple précédent et considérons l'ensemble B = {Ville moyenne, Grande
ville}. La relation floue "est de la taille d'une" de A vers B pourrait
être représentée par la matrice suivante :

Composition de relations
floues.
La composition de
relations floues permet de combiner deux relations floues pour en obtenir
une nouvelle, exprimant une relation indirecte. Cette opération est souvent
utilisée dans des systèmes où plusieurs étapes de raisonnement incertain
ou partiel doivent être enchaînées. Il existe deux principales méthodes
de composition : la composition max-min et la composition max-produit.
Composition
max-min.
La composition max-min
est la plus utilisée en logique floue. Elle repose sur les opérations
de minimum et de maximum pour évaluer la force de la relation entre les
ensembles. On considère tous les chemins possibles reliant x à z via
y. Pour chaque yy, on évalue le degré minimal entre R1(x,y)
et R2(y,z). Puis on prend le maximum de ces valeurs
pour obtenir le degré de R3(x,z). Formule :

min mesure la force
minimale dans la chaîne relationnelle (intersection floue); sup
cherche le chemin qui maximise cette force minimale.
Composition
max-produit.
La composition max-produit
est une alternative qui utilise l'opération produit pour modéliser la
combinaison des relations floues. Ici, on calcule le produit des degrés
d'appartenance pour chaque chemin, et on retient le chemin qui donne la
plus grande valeur. Cela reflète une approche plus continue que le max-min,
en multipliant directement les degrés flous au lieu de les limiter par
une borne inférieure. Formule :

. correspond
au produit des degrés d'appartenance.; sup prend la valeur maximale
parmi tous les produits possibles.
L'inférence floue
Les systèmes d'inférence
floue (SIF), également appelés systèmes de règles floues, sont des
outils de calcul qui permettent de modéliser et de raisonner sur des informations
imprécises, incertaines ou qualitatives. Les SIF sont particulièrement
utiles dans les situations où la modélisation mathématique précise
est difficile ou impossible, les données sont bruitées, incertaines ou
incomplètes, les connaissances sont exprimées de manière linguistique
(ex : "Si la température est élevée ALORS le ventilateur doit être
rapide"). On souhaite imiter le raisonnement humain qui est habituellement
basé sur des notions subjectives.
Le
processus d'inférence floue.
Le processus d'inférence
floue se déroule généralement en plusieurs étapes :
Fuzzification.
L'étape
de fuzzification (de l'anglais fuzzy = flou) consiste à transformer
les entrées numériques (valeurs nettes / crisp values) en ensembles
flous. Chaque valeur d'entrée est associée à un ou plusieurs ensembles
flous avec un degré d'appartenance. Par exemple, une température de 25°C
pourrait appartenir à la fois à l'ensemble flou "Tiède" avec un degré
de 0,8 et à l'ensemble flou "Chaud" avec un degré de 0,2. Ceci se fait
en utilisant des fonctions d'appartenance (triangulaires, trapézoïdales,
gaussiennes, etc.) qui définissent la forme de l'ensemble flou.
Règles
floues.
Le coeur du système
d'inférence floue réside dans un ensemble de règles SI-ALORS (IF-THEN)
qui décrivent le comportement du système. Ces règles relient les variables
d'entrée aux variables de sortie en utilisant des termes linguistiques
(les ensembles flous définis précédemment). La partie SI ou IF (antécédent)
décrit les conditions sur les entrées, et la partie ALORS ou THEN (conséquent)
décrit les actions ou conclusions sur les sorties.
Agrégation.
L'agrégation est
application de l'opérateur logique à l'antécédent. Si l'antécédent
d'une règle contient plusieurs propositions liées par des opérateurs
logiques (ET ou AND, OU ou OR), il faut combiner les degrés d'appartenance
de ces propositions pour obtenir le degré d'activation de l'antécédent.
Les opérateurs logiques flous -comme MIN pour ET (AND) et MAX pour OU
(OR) - sont utilisés ici.
Activation
(inférence)
Le degré d'activation
de l'antécédent (calculé à l'étape précédente) est utilisé pour
déterminer le degré avec lequel le conséquent de la règle est activé.
Dans le système de Mamdani, cette étape se fait généralement par troncature
(clipping) ou mise à l'échelle (scaling) de la fonction
d'appartenance de l'ensemble flou du conséquent.
• Troncature.
- La fonction d'appartenance du conséquent est coupée à la hauteur du
degré d'activation de l'antécédent.
• Mise à l'échelle.
- La fonction d'appartenance du conséquent est multipliée (verticalement)
par le degré d'activation de l'antécédent.
Accumulation.
L'accumulation est
l'agrégation des conséquents. Les sorties floues de toutes les règles
activées sont combinées pour former un seul ensemble flou représentant
la sortie globale du système. Plusieurs méthodes d'accumulation existent,
comme la méthode MAX (on prend le maximum des fonctions d'appartenance)
ou la méthode SOMME (on additionne les fonctions d'appartenance, en limitant
le résultat à 1).
Défuzzification.
La dernière étape
consiste à transformer l'ensemble flou résultant en une valeur de sortie
numérique (crisp value) compréhensible pour le monde réel. Plusieurs
méthodes de défuzzification sont disponibles, les plus courantes étant
:
• Le centre
de gravité. - La valeur de sortie est le centre de gravité de l'aire
sous la fonction d'appartenance de l'ensemble flou résultant. C'est une
méthode très utilisée.
• La bissectrice.
- La valeur de sortie est l'abscisse de la droite verticale qui divise
l'aire sous la fonction d'appartenance en deux parties égales.
• La moyenne des
maximums (mean of maxima - MOM). - La valeur de sortie est la moyenne
des abscisses pour lesquelles la fonction d'appartenance atteint son maximum.
• Le plus petit
des maximums (smallest of maxima - SOM). - La valeur de sortie est
la plus petite abscisse pour laquelle la fonction d'appartenance atteint
son maximum.
• Le plus grand
des maximums (largest of maxima - LOM). - La valeur de sortie est
la plus grande abscisse pour laquelle la fonction d'appartenance atteint
son maximum.
Les systèmes d'inférence
de Mamdani et de Sugeno-Takagi-Kang (TSK).
Les systèmes d'inférence
floue de Mamdani et de Sugeno-Takagi-Kang (TSK) sont deux approches courantes
en logique floue pour modéliser des systèmes complexes.
Système
d'inférence de Mamdani.
Le système d'inférence
de Mamdani, développé en 1975 par Ebrahim Mamdani et son équipe, est
l'une des premières et des plus répandues architectures de systèmes
d'inférence floue. Sa principale caractéristique est que les conséquents
des règles sont également des ensembles flous (structure : entrée floue
→
règles floues → sortie floue). L'output final est obtenu par défuzzification
(transformation de l'ensemble flou de sortie en une valeur unique). Déroulement
:
1) Fuzzification
: Convertit les entrées précises en valeurs floues (ex. température
élevée). 2) Évaluation des règles : Applique des opérateurs logiques
flous (min, max). 3) Agrégation : Combine les sorties des règles. 4)
Défuzzification : Transforme la sortie floue en une valeur précise (par
exemple, moyenne pondérée).
Les avantages de ce
système sont l'interprétation facile et intuitive (similaire au raisonnement
humain) et l'adaptation aux systèmes complexes où les relations sont
difficiles à modéliser mathématiquement. Les inconvénients tiennent
à ce que la défuzzification peut entraîner une perte d'information et
à la nécessité d'un calcul intensif pour des systèmes à plusieurs
entrées et sorties.
Système
d'inférence de Sugeno-Takagi-Kang (TSK)
Le système d'inférence
de Sugeno-Takagi-Kang (STK), ou simplement système de Sugeno, se distingue
du système de Mamdani par sa manière de définir les conséquences des
règles floues. Au lieu d'utiliser des ensembles flous pour les conséquences
comme dans le système de Mamdani, le système de Sugeno utilise des fonctions
linéaires ou constantes des variables d'entrée (structure : entrée floue
→ règles floues → sortie précise (linéaire ou constante)).
Développé par Michio
Sugeno, Tomohiro Takagi et Geon Kang dans les années 1980, le système
de Sugeno a été conçu pour offrir une approche plus mathématiquement
tractable et computationnellement efficace que les systèmes d'inférence
floue traditionnels. Son principal avantage réside dans la simplification
du processus de déflouzification, qui devient une simple opération algébrique.
Déroulement :
1) Fuzzification
: convertit les entrées précises en valeurs floues. 2)
Évaluation des règles : les règles sont définies par des fonctions
linéaires ou constantes. 3) Agrégation : combine les sorties pondérées
(sans défuzzification classique).
Les avantages sont la
rapidité de calcul (pas de défuzzification complexe), ce qui convient
aux systèmes en temps réel, et la facilité d'intégrationr dans des
systèmes d'apprentissage automatique (modèles hybrides). Les inconvénients
sont le moindre caractère intuitif pour les humains et la nécessité
des données précises pour établir les fonctions linéaires. |
|