Centre d’aide

1/6/2024

La réduction de la dimensionnalité est une technique utilisée pour réduire le nombre de variables d’un jeu de données, aussi appelé dimensionnalité, tout en conservant un maximum d’informations pertinentes. Autrement dit, elle consiste à représenter des données de haute dimensionnalité (c.-à-d. avec un nombre élevé de variables) dans un espace de dimensions inférieures (c.-à-d. en réduisant le nombre de variables), tout en préservant autant que possible la structure locale et globale des données originales1. Comme pour l’analyse de partitionnement, la réduction de la dimensionnalité fait référence à un ensemble de méthodes qui peuvent être utilisées pour atteindre cet objectif.

Fig. 1 Illustration de la projection de données en trois dimensions en deux dimensions.

Ce processus est principalement utilisé pour simplifier les données et faciliter leur analyse. Premièrement, l’un des problèmes des données à haute dimensionnalité est qu’il en résulte généralement une dégradation des performances des modèles à mesure que le nombre de variables augmente. En effet, la complexité du modèle croît avec le nombre de variables, rendant ainsi plus difficile la détermination d’une solution optimale, particulièrement lorsque l’échantillon est de taille limitée. De plus, ces méthodes peuvent également aider à éradiquer les variables redondantes et potentiellement colinéaires, qui peuvent affecter les performances de certains modèles. Lorsque le volume de données est considérable, la réduction de la dimensionnalité peut par ailleurs contribuer à diminuer le temps de calcul.

Au-delà de la simplification des données, la réduction de la dimensionnalité peut aussi être utile pour visualiser les données, en les projetant dans un espace à deux ou trois dimensions. Ceci peut permettre une meilleure compréhension des relations entre les variables et facilite la détection des structures sous-jacentes. Ces méthodes sont par exemple appliquées dans notre outil de cartographie conceptuelle, pour faciliter la visualisation des thèmes émergents.

Pour des revues comparatives de différentes méthodes de réduction de dimensionnalité, voir les articles de Wang et al., (2021) et Anowar et al., (2023).

Pour plus d’informations sur la cartographie conceptuelle et l’outil CM* de Polygon, veuillez consulter les liens suivants : En quoi consiste la cartographie conceptuelle ? & page de l’outil CM*.

Note :

Préserver la structure locale implique que des points proches dans l’espace à haute dimension le resteront dans l’espace à plus basse dimension. Préserver la structure globale fait référence au maintien des relations à plus larges échelles, soit les motifs caractérisant le jeu de données.

Outil de cartographie conceptuelle

Réduction de la dimensionnalité

FAQ

No items found.

Related articles

Consultez notre documentation

Bienvenue sur le site web de Polygon. Nous respectons votre vie privée. C’est pourquoi pour le suivi de la navigation, nous utilisons l’outil https://plausible.io, qui ne dépose aucun cookie sur votre terminal. Pour en savoir plus, consultez notre politique de confidentialité.