loading table of contents...

5.16. Faktorenanalyse / Clusteranalyse

Die Faktorenanalyse und die Clusteranalyse sind Sonder-Auswertungsformen, die genutzt werden können, wenn das entsprechende Zusatzpaket für mediMACH Online gebucht wurde.
 
Wozu verwendet man eine Faktoren- oder Clusteranalyse?
Bei der Faktorenanalyse handelt es sich um einen Sammelbegriff für mehrere statistische Verfahren, die stets darauf abzielen, in einer Grundgesamtheit eine größere Anzahl von (sog. "aktiven") Variablen auf weniger ("latente") Variablen (auch "Faktoren") zu reduzieren, ohne dass darin zu viel von der Erklätungskraft der einzelnen aktiven Variablen verlorengeht.
Eine Faktorenanalyse fragt also: Welche latenten Variablen stecken hinter diesen vielen einzelnen Merkmalen? Haben vielleicht viele Zielgruppen in meinem Set eine ähnliche "Richtung", wenn ich versuche, sie z.B. anhand ihrer Konsumgewohnheiten zu ordnen? Kann ich anstelle der vielen Variablen auch mit weniger Dimensionen arbeiten und somit das Thema anschaulicher machen?
Der Vorteil an einer solchen Analyse besteht darin, nicht nach Außenvorgaben, sondern explorativ anhand der Datenstruktur selbst die Komplexität zu reduzieren und ggf. eine Variable zu finden, die stellvertretend für eine Vielzahl an Zielgruppen als eine Art "Index" eingesetzt werden kann. Der prominenteste auf diese Weise entstandene Index kommt aus der Sozialpsychologie und heißt Intelligenzquotient. Ähnlich wie bei diesem kann in mediMACH zum Beispiel eine Variable entdeckt werden, die für "Offenheit gegenüber neuen Technologien" steht oder für "Nachhaltigkeitsdenken".
 
Die Form der Clusteranalyse, die in mediMACH verwendet wird, baut auf der Faktorenanalyse auf und zielt darauf ab, eine Anzahl von Menschen (z.B. die Grundgesamtheit) in Gruppen zusammenzufassen, so dass die Gruppen ("Cluster") in vorgegeben Kriterien (aktiven Variablen) möglichst stark voneinander unterscheiden, während sich die Menschen innerhalb eines Clusters ähneln, ebenso in Bezug auf die aktiven Variablen.
Eine Clusteranalyse fragt also: Kann ich innerhalb der (bei Bedarf auch vorgefilterten) Grundgesamtheit Gruppen finden, die sich in Bezug auf bestimmte Zielgruppenmerkmale ähnlich sind?
Als Ergebnis kann man ganze Typologien selbst erstellen, die sich aus den Daten der Markt-Media-Studie rechnerisch selbst ergeben haben, ohne dass man dazu per Trial and Error Zielgruppen zusammensetzen und mehrmals gegeneinander abgleichen muss. Denkbar wären zum Beispiel 4 Typen, die sich in Bezug auf ihr Verhalten gegenüber Technologie voneinander unterscheiden oder 5 Typen, die zum Thema Nachhaltigkeit unterschiedlich eingestellt sind.
Diese somit gewonnenen Typologien lassen sich abspeichern und als Zielgruppen in mediMACH Online weiterverwenden. So kann dann beispielsweise das Mediennutzungsverhalten der Technologie-Typen analysiert werden oder die Konsumentscheidungen von Nachhaltigkeits-Typen.
 
Selektion von aktiven Variablen
 
Der erste Schritt zur erfolgreichen Faktoren- / Clusteranalyse führt über die Variablenauswahl (Ändern-Button).
 
 
 
Die Selektion der aktiven Variablen soll sich inhaltlich aus Ihren Auswertungsinteressen speisen, muss aber auch mathematisch bestimmte Anforderungen erfüllen:
  • So dürfen sich die gewählten Ausprägungen innerhalb eines gewählten Merkmals nicht überschneiden ( = sie müssen disjunkt sein).
  • Und die gewählten Ausprägungen müssen zusammengenommen die gesamte Grundgesamtheit abdecken, mit der Sie arbeiten.
Beide Kriterien gelten nur für Markmale mit mehreren Ausprägungen. Wählen Sie einzelne Ausprägungen, so wird jeweils die Gegengruppe (Auspärgung erfüllt vs. Ausprägung nicht erfüllt) in die Clusteranalyse mit einbezogen, so dass eine Überschneidung oder eine Nichtabdeckung der Grundgesamheit kein Problem werden kann.
 
Beispiele:
1. Ausprägungen überschneiden sich
 
In der Skala gibt es eine Ausprägung ("Trifft voll und ganz zu oder eher zu"), welche eine TOP2-Zusammenfassung aus 2 anderen Ausprägungen darstellt. Deshalb sind die Ausprägungen nicht disjunkt. Zusammengenommen ergeben die Ausprägungen über 100%.
Empfehlung: "Trifft voll und ganz zu oder eher zu" aus der Auswahl rechts im Ausprägungsfenster entfernen.
 
2. Nicht gesamte Grundgesamtheit abgedeckt
 
 
Dieses Merkmal wurde nur bei Rauchern abgefragt, und damit nicht in der ganzen Grundgesamtheit. Zusammengenommen ergeben beide Ausprägungen weniger als 100%.
Empfehlung: "Raucher/Raucherin nein" aus der Auswahl rechts im Ausprägungsfenster entfernen.
 
 
Ergebnisse Faktoren- / Clusteranalyse
 
Wenn Sie Ihre aktiven Variablen definiert und bestätigt haben, erhalten Sie einige statistische Outputs, die hier knapp mit ihrer Funktion benannt werden:
 
  • Korrelationsmatrix: Stellt die Korrelationen zwischen den Variablen dar, indem diese in einer Tabelle jeweils in der Vorspalte und auch im Kopf aufgeführt und somit gekreuzt werden.
    • 0 bedeutet: keine Korrelation
    • 1 bedeutet: perfekte lineare positive Korrelation
    • - 1 bedeutet: perfekte lineare negative Korrelation
    • Je kleiner der absolute Wert in einer Zelle ist, desto geringer ist die Korrelation. Ein negatives Vorzeichen heißt: umgekehrter Zusammenhang.
  • Eigenwerte: geben den Anteil der Varianz an, die jeder der Faktoren erklärt. Der Wert 1 steht dabei stellvertretend für die Größe der Varianz einer einzelnen aktiven Variablen. Ist dieser größer als 1, gilt das also als Qualitätskriterium für einen Faktor. Die optimale Anzahl der Faktoren wird oft gleich der Anzahl der Eigenwerte gesetzt, die größer als 1 sind.
  • Anzahl Faktoren: Hier können Sie eingeben, ob sich Faktoren mit Eigenwert > 1 oder >0,5 qualifizieren sollen. Somit beeinflussen sie indirekt die Anzahl der extrahierten Faktoren.
  • Ladungsmatrix: ähnlich zu interpretieren wie die Korrelationsmatrix. Hier werden allerdings die aktiven Variablen gekreuzt mit den Faktoren. Zu sehen ist also, wie stark die Ausgangsvariablen mit den Faktoren zusammenhängen.
  • Rotierte Ladungsmatrix: hat sich als eigentlich wichtigstes Ergebnis einer Faktorenanalyse durchgesetzt. Um die aktiven Variablen besser eindeutig nur einem Faktor zuordnen zu können, wird ein mathematisches Verfahren angewandt. Dadurch wird die Varianz, die einzelne aktive Variablen auf einen Faktor laden, entweder minimiert oder maximiert. Die dadurch entstandenen Korrelationen lassen sich in dieser Matrix ablesen. Zur besseren Lesbarkeit werden positive Korrelationen grün und negative rot eingefärbt. Je tiefer die Farbe, desto stärker der Zusammenhang.
  • Tabellierung (ganz unten): Hier werden die Cluster im Kopf einer Kreuztabelle dargestellt und die Vorspalte mit den aktiven Variablen gefüllt. Dadurch erlangen Sie die Möglichkeit, sich ein Bild von der Zusemmansetzung der Cluster zu bekommen, bevor Sie sie abspeichern (siehe Abschnitt weiter unten).
 
Einstellungsmöglichkeiten Clusteranalyse
 
Die Clusteranalse bietet Ihnen neben dem indirekten Eingriff (über das Eigenwertkriterium) auch direkte Kalibrierungsmöglichkeiten:
  • Anzahl Cluster: Legen Sie hier selbst fest, wie viele Cluster Sie haben möchten. Achtung! Es ist sinnvoll, sich nicht allzu weit von der Anzahl der Eigenwerte über 1 zu entfernen, den die Matrizen im oberen Bereich auch folgen! Ansonsten leiden die entstehenden Faktoren an zu wenig Erklärungs-/Differenzierungskraft. Anders gesagt: Die entstehenden Typen der Typologie unterscheiden sich untereinander dann wenig und man kann ihnen umso schlechter Labels geben, wie z.B. "progressiver Familienmensch" oder "hedonistische Konsumorientierung".
  • Anzahl Iterationen (Standard 100): Bei der Faktorenanalyse werden mehrere "Runden" gedreht. Das mathematische Verfahren wird mit dem Resultat immer wieder wiederholt, um ein immer besser passendes Ergebnis zu bekommen. Die Anzahl dieser "Runden" ( = Iterationen) stellt man hier ein. Je mehr Itationen man dem Verfahren zubilligt, desto feiner kann das Ergebnis sein.
 
 
 
Speichern und Verwenden von Typologien
Wenn Sie nun auf den Button „Übernehmen“ klicken neben dem Feld, in dem Sie eine Bezeichnung für Ihre Typologie eingeben können, speichern Sie die aktuell angezeigte Typologie. Sie finden dieses gespeicherte Set später wieder, wenn Sie in den Bereich „Individuelle Zielgruppen“ (Bereich oben neben Auswertung und Planung) gehen und dort unten rechts „Importierte Zielgruppen öffnen“ klicken. In diesem Bereich können Sie Ihre Typen auch umbenennen und wieder abspeichern.
 
Achtung! Individuelle Zielgruppen / Cluster können nur in dem Studienjahrgang verwendet werden, in dem sie gebildet wurden! in einem neuen Studienjahrgang müssten diese neu gebildet werden, da dort andere Fälle und Daten enthalten sind!

Die Typologie kann anschließend in der in der Selektion (z.B. einer Tabellierung) verwendet werden. Sie finden neben den Reitern „Zielgruppen“ und den verschiedenen Gattungen dann oben einen Extra-Reiter mit dem Namen „Individuelle Zielgruppen“.