La cluster analysis è una delle tecniche più diffuse nel campo statistico. L’obiettivo è quello di comprendere se gli individui osservati hanno elementi comuni tali da poter creare dei gruppi, appunto cluster.
Sia in campo medico che in quello economico e del marketing la cluster analysis trova ampio impiego. Essa consente di identificare similarità in un set di individui. Ad esempio, identificare come i pazienti di una determinata patologia possano essere suddividi in gruppi in base a delle caratteristiche cliniche è uno degli scopi della cluster analysis. Un altro esempio tipico è quello relativo alla segmentazione dei consumatori in un determinato settore.
Una delle caratteristiche tipiche della cluster analysis, caratteristica che la separa dall’analisi discriminante, è quella di essere un metodo tipicamente esplorativo. Consiste nella ricerca di gruppi tra loro similari in un set di n osservazioni, non sapendo a priori se esistano o meno gruppi omogenei. Dunque, lo scopo è quello di riconoscere i gruppi che appaiono in modo naturale nelle osservazioni.
E’ un’analisi che può essere condotta sia a priori che a posteriori, dipende dalla finalità della ricerca. Da essa ne consegue sempre una riduzione delle dimensioni e ciò a vantaggio della parsimonia nella descrizione e nell’interpretazione dei dati.
Le tecniche di cluster analysis sono svariate, ma l’obiettivo è sempre e solo quello di capire in che modo i dati osservati possono essere raggruppati secondo un metodo “naturale”, insito cioè nei dati stessi.