Zusammenfassung und Hintergrund
Abstract
Hintergrund: Statistische Modelle, die auf der Item-Response-Theorie basieren, wurden verwendet, um (a) die Leistung einzelner Items der Positiven und Negativen Syndrom-Skala (PANSS) und ihrer Optionen zu untersuchen, (b) die Wirksamkeit verschiedener Subskalen zur Unterscheidung individueller Unterschiede in der Symptomschwere und (c) die Angemessenheit von Cutoff-Scores, die kürzlich von Andreasen und ihren Kollegen (2005) empfohlen wurden, um eine Symptomremission festzustellen.
Methoden: Optionscharakteristikkurven wurden unter Verwendung eines nichtparametrischen Item-Response-Modells geschätzt, um die Wahrscheinlichkeit der Befürwortung jeder der 7 Optionen innerhalb jedes der 30 PANSS-Items als Funktion der standardisierten Gesamtsymptomschwere zu untersuchen. Bei unseren Daten handelte es sich um die PANSS-Basisscores von 9205 Patienten mit Schizophrenie oder schizoaffektiver Störung, die zwischen 1995 und 2003 entweder an einer großen naturalistischen Beobachtungsstudie oder an einer von 12 randomisierten, doppelblinden klinischen Studien teilgenommen hatten, in denen Olanzapin mit anderen Antipsychotika verglichen wurde.
Ergebnisse: Unsere Analysen zeigen, dass die Mehrheit der Items, die die positiven und negativen Subskalen der PANSS bilden, sehr gut abschneiden. Wir haben auch Schlüsselbereiche identifiziert, in denen die Items und Optionen der Subskala Allgemeine Psychopathologie verbessert oder überarbeitet werden sollten. Die Ergebnisse der Positiven und Negativen Subskala sind nicht nur aussagekräftiger für individuelle Unterschiede in der Symptomschwere als das Ergebnis der Subskala Allgemeine Psychopathologie, sondern auch im Durchschnitt effizienter als das 30 Items umfassende Gesamtergebnis. Von den 8 Items, die kürzlich zur Feststellung einer Symptomremission empfohlen wurden, unterschied sich 1 deutlich von den 7 anderen und sollte entweder gestrichen oder neu bewertet werden, wobei die Patienten einen niedrigeren Score von 2 (statt 3) erreichen müssen, um eine Remission zu signalisieren.
Schlussfolgerung: Diese erste Item-Response-Analyse der PANSS unterstützt ihre soliden psychometrischen Eigenschaften; die meisten PANSS-Items waren entweder sehr gut oder gut in der Lage, den Gesamtschweregrad der Erkrankung zu beurteilen. Die Analysen haben einige Items identifiziert, die zur Messung individueller Schweregradunterschiede oder zur Definition von Remissionsschwellen weiter verbessert werden könnten. Die Ergebnisse deuten auch darauf hin, dass die Positiv- und Negativ-Subskalen empfindlicher auf Veränderungen reagieren als der PANSS-Gesamtscore und somit eine „Mini-PANSS“ darstellen könnten, die zuverlässiger ist, eine kürzere Verwaltungs- und Trainingszeit erfordert und möglicherweise die für künftige Forschungen erforderlichen Stichprobengrößen reduziert.
Hintergrund
Die Positiv- und Negativ-Syndrom-Skala (PANSS) ist das am häufigsten verwendete Maß für den Schweregrad von Symptomen bei Schizophrenie. Diese 30 Punkte umfassende Skala wird in der Regel von geschulten Klinikern verwaltet, die den aktuellen Schweregrad jedes Symptoms (Punkt) bewerten, indem sie 1 von 7 Optionen (Gewichtungen) mit den Nummern 1 bis 7 bestätigen. Die PANSS hat eine hohe interne Zuverlässigkeit, eine gute Konstruktvalidität und eine ausgezeichnete Sensitivität für Veränderungen sowohl in Kurzzeit- als auch in Langzeitstudien gezeigt. Trotz umfangreicher psychometrischer Untersuchungen ist jedoch unklar, wie sich die einzelnen PANSS-Items in ihrer Nützlichkeit für die Beurteilung des Schweregrads der Schizophrenie unterscheiden.
Studien, die die psychometrischen Eigenschaften der PANSS untersuchten, konzentrierten sich ausnahmslos auf Schätzungen der Skalenreliabilität, der Validität und der Faktorenanalyse unter Verwendung von Methoden der klassischen Testtheorie und identifizierten typischerweise fünf zugrunde liegende Faktoren. Ansätze, die auf der klassischen Testtheorie beruhen, stützen sich in erster Linie auf Omnibus-Statistiken, die einen Mittelwert über die Ebenen der individuellen Variation bilden und keine Möglichkeit bieten, die Qualität einzelner Items oder Optionen über verschiedene Stufen der Symptomschwere hinweg zu beurteilen. Im Gegensatz dazu bieten Methoden, die auf der Item-Response-Theorie (IRT) basieren, erhebliche Verbesserungen gegenüber den klassischen Verfahren, da sie die Beziehung zwischen Itemantworten und Symptomschwere direkt modellieren und quantifizieren, wie sich die Leistung einzelner Items und Optionen (Schweregrade 1 bis 7) in Abhängigkeit von der gesamten, standardisierten Symptomschwere verändert. IRT-Analysen liefern einzigartige und relevante Informationen darüber, (a) wie gut ein Satz von Item-Optionen das gesamte Kontinuum der Symptomschwere erfasst, (b) ob die den einzelnen Item-Optionen zugewiesenen Gewichtungen für die Messung einer bestimmten Eigenschaft oder eines bestimmten Symptoms geeignet sind, und (c) wie gut einzelne Items oder Subskalen mit dem zugrunde liegenden Konstrukt verbunden sind und individuelle Unterschiede in der Symptomschwere diskriminieren (für einen Überblick siehe die Veröffentlichung von Santor und Ramsay).
IRT-Methoden sind ideal, um die Leistung von Optionen innerhalb von Items zu untersuchen, die zur Definition der Remission von Psychopathologie verwendet werden sollen. Andreasen und ihre Kollegen haben Richtlinien veröffentlicht, in denen empfohlen wird, dass eine Remission der Schizophrenie als das Erreichen von Optionswerten von weniger als oder gleich 3 bei jedem der nur 8 PANSS-Items definiert wird: Wahnvorstellungen, ungewöhnliche Gedankeninhalte, halluzinatorisches Verhalten, konzeptuelle Desorganisation, Manierismen und Körperhaltung, abgestumpfter Affekt, sozialer Rückzug und fehlende Spontaneität. Die Festlegung gleicher Remissionsschwellen (≤3) für alle 8 Items deutet darauf hin, dass der Schweregrad der Symptome, der einer „3 oder weniger“ entspricht, im Allgemeinen für alle 8 Items gleich ist. Wenn der Bereich des Symptomschweregrads, bei dem die Optionen 1, 2 und 3 am wahrscheinlichsten bestätigt werden, bei den einzelnen Items unterschiedlich ist, dann haben einige Items einen größeren Einfluss auf die Feststellung, ob eine Remission erreicht wurde oder nicht. Wenn der Schwellenwert von „3 oder weniger“ einem höheren Schweregrad für ein Item entspricht (d. h. leichter zu erreichen ist, wenn sich der Schweregrad der Symptome verbessert), dann ist dieses Item entweder überflüssig (da es mit größerer Wahrscheinlichkeit zuerst erreicht wird) oder sein Schwellenwert sollte nach unten korrigiert werden. Zum Beispiel könnte der Remissionsschwellenwert für dieses Item auf 2 statt auf 3 gesetzt werden. IRT-Analysen untersuchen die Art und Weise, in der einzelne Itemoptionen (und Cutoff-Scores) mit der Gesamtsymptomschwere zusammenhängen, was für die Bewertung der Angemessenheit der vorgeschlagenen Cutpoint-Scores (Schwellenwerte) zur Bestimmung der Krankheitsremission von zentraler Bedeutung ist.
Die drei Hauptziele unserer Studie sind (a) die Untersuchung und Charakterisierung der Leistung einzelner Items der PANSS sowohl auf der Ebene der Optionen (Schweregrad) als auch auf der Ebene der Items (Symptome) mit dem Ziel, verbesserungsbedürftige Bereiche zu identifizieren, (b) die Untersuchung der Fähigkeit verschiedener Subskalen, zwischen individuellen Unterschieden im Krankheitsschweregrad zu diskriminieren, wodurch dann ein besseres Maß für Veränderungen identifiziert werden könnte, und (c) die Bewertung der Angemessenheit von Items und Optionen, die für die Bestimmung des Erreichens einer Symptomremission vorgeschlagen wurden.