Qualität von Gutachten 


Wie entsteht und woran erkennt man

ein qualitativ gutes Sachverständigengutachten?

Kritische Anmerkungen zur aktuellen Diskussion


Erstveröffentlichnug in Zeitschrift für Kindschaftsrecht und Jugendhilfe 11/15 und 12/15

"Jedes zweite familiengerichtliche Gutachten ist falsch". Diese Botschaft ist frappierend schnell als vermeintlich wissenschaftlich gesichertes Forschungsergebnis im Lande angekommen, verbreitet durch eine im Auftrag des Landes NRW erstellte Studie von Stürmer u. Salewski (2014)[1]. Der nachfolgende Beitrag zeigt zunächst auf, dass die Studie tatsächlich keine Aussagen darüber macht, ob die untersuchten Gutachten inhaltlich richtig oder falsch sind, da sie sich lediglich an der Logik hypothesenprüfender wissenschaftlicher Experimente orientiert und unkritisch standardisierte Testverfahren und Datenerhebungen für geeignet hält, familienpsychologische Leitfragen unmittelbar zu beantworten.

Im Weiteren soll aufgezeigt werden,  dass die Verallgemeinerbarkeit der Ergebnisse über die untersuchten vier Amtsgerichtsbezirke hinaus wissenschaftsmethodisch ebensowenig gesichert ist wie die erhobene berufspolitische Forderung nach einer verpflichtendengerichtspsychologischenWeiterbildung. Im Zusammenhang einer Diskussion möglicher berufspolitischer Maßnahmen zur Qualitätssicherung von Sachverständigengutachten in familiengerichtlichen Verfahren wird deraktuelle Referentenentwurf des Bundesministeriums der Justiz und für Verbraucherschutz(vgl. ZKJ 2015, ###)  berücksichtigt

 

Einleitende Bemerkungen zum Qualitätsbegriff

Es ist evident, dass man sämtliche formale Anforderungen erfüllen kann und dennoch zu falschen oder voreiligen und daher zumindest zweifelhaften Realitätseinschätzungen, zu intransparenten und unvollständigen Prognosen, zu konfliktverschärfenden undinhaltlich unangemessenen Bewertungen und schließlich zu unverantwortlichen Empfehlungen kommen kann. Ebenso kann es umgekehrt sein, dass man fast alle formalen Hürden derStudie von Stürmer und Salewski (2014)reißt und dennoch in inhaltlicher Hinsicht richtig liegt - oder aber eine einvernehmliche und kindeswohldienliche Lösung auf den Weg bringt.

Man fragt sich zunächst, ob es in der untersuchten Stichprobevon vier Amtsgerichten aus dem Bezirk des OLG Hamm ausschließlich entscheidungsorientierte Gutachten gibt und keinen einzigen Fall, in dem eine einvernehmliche Lösung dokumentiert wird.Von der jahrgangsbezogenen Vollerhebung der vier Amtsgerichte seien acht Fälle herausgenommen worden,in denen lediglich eine psychologische Stellungnahme erstattet wurde sowie ein weiterer Fall, bei dem es sich um ein Kurzgutachten handelt. Da das vollständige Fehlen erfolgreicher Konfliktlösungen angesichts der Größe der untersuchten Population unwahrscheinlich ist, ist vorstellbar, dass diese Fälle zu einem nicht unerheblichen Teil von erfolgreich arbeitenden Gutachter  stammen, die eine kindeswohldienliche und einvernehmliche Vereinbarung auf den Weg gebracht haben[2].

 

Selbst wenn es tatsächlich keine "gelösten Fälle" geben sollte, blieb aufgrund des methodischen Ansatzes der Hagener Studie die Chance ungenutzt, diejenigen Sachverständigengutachten ausfindig zu machen, in denen eine kontextsensible lösungsorientierte Intervention unterblieben ist (bzw. nicht dokumentiert ist) und ggf. nur deshalb ein umfangreiches Sachverständigengutachten erstellt werden musste.

Es stellt sich mit Blick auf die Urteilslogik der Hagener Studie auch die Frage, ob die Erstellung eines familienpsychologischen Gutachtens  mit einem Hypothesen prüfenden wissenschaftlichen Experimentgleichgesetzt werden kann, mit der Folge, sämtliche Abweichungen als Anzeichen eines unqualifizierten Vorgehens von Sachverständigen zu brandmarken.

 

Wissenschaftliche Hypothesenprüfungoder Beantwortung ergebnisoffener psychologischer Fragen?

Zunächstwird in der Hagener Studie zu Recht kritisiert, dass erkenntnisleitende Begriffe wie Kindeswohl, Bindung, Erziehungsfähigkeit etc. oftmals nicht definiert und keine fachlich begründeten differenzialdiagnostischen Kriterien zu ihrer Feststellung formuliert werden. Hieran anschließend wird bemängelt, dass vielen Gutachten keine wissenschaftliche Arbeitshypothese zu Grunde liege. In fast ständiger Gleichsetzung wird moniert, dass es an der Formulierung psychologischer Fragestellungen ermangele. Letzteres ist indessen etwas anderes, weil keine Aussagen über Wirklichkeitszusammenhänge getroffen werden. Im Zuge der Erläuterung der Minimalanforderungen, die zum "Bestehen der Prüfung" herangezogen wurden, heißt es dannin einer dritten Variation des Anliegens ohne jede Erläuterung, es genüge lediglich eine Begriffsdefinition.

 

Weiter wird moniert, dass häufig psychologische Fragestellungen nicht wissenschaftlich hergeleitet worden seien.Es stellt sich die Frage, was eigentlich diejenigen Sachverständigen getan haben, die diesem Kriterium genügen? Nehmen wir prototypisch an, es gehe um die Einschätzung einer möglichen Kindeswohlgefährdung. Die Aktenlage ergibt Verdachtsmomente, dass das Kind von beiden Eltern regelmäßig massiv geschlagen wird.Die wissenschaftlich als anerkannt geltende allgemeine Leithypothese könnte dannlauten: wenn ein Kind regelmäßig von seinen Eltern massiv geschlagen wird, ist (auch) sein seelisches Wohlergehen erheblich gefährdet. Das Zitieren entsprechender wissenschaftlicher Fachliteratur und empirischer Forschungsergebnisse würde die Hypothese untermauern. Hiervon systematisch zu unterscheiden ist eine fallbezogene bloße Tatsachen-Hypothese, die eingangs aus der Aktenlage abgeleitet werden könnte: das Kind X wird in der Weise massiv geschlagen, dass es seit 2 Jahren in Fällen von Ungehorsam mehrmals wöchentlich von den Eltern auf den nackten Hintern geschlagen wird, so dass durch neutrale Augenzeugen deutliche Rötungen und gelegentlich blaue Flecken feststellbar waren.

Diese fall- und tatsachenbezogene Hypothese operationalisiert den unbestimmten Begriff "massiv" und ermöglicht so die logische Subsumtion unter die allgemeine wissenschaftliche Wenn-Dann-Hypothese. 

Ein wissenschaftliches Vorgehen würde nun bekanntlich bedeuten, die Null-Hypothese anzunehmen, also zu zeigen versuchen, dass die aktenkundigen Aussagen in einem nur zufälligen Zusammenhang mit der gutachterlich explorierten Realität stehen. Das Scheitern dieses Versuchs würde diese konkrete Tatsachen-Hypothese bestätigen.

In allen Fällen, in denen keine evidenten Beobachtungen unzweifelhaft glaubwürdig geschildert werden, kommt bereits im Zusammenhang mit der bloßen Sachverhaltsaufklärung hinzu, dass zur besseren Absicherung auf fachlich mehr oder minder geteilte Allgemein- Hypothesen zurückgegriffen wird. Ist z. B. nicht sicher nachzuweisen, noch weniger aber auszuschließen, dasseine umgangsverhindernde Mutter das Kind gegen den Vater manipuliert, rettet man sich gleichsam hinüber zu einer Allgemein-Hypothese: der Umgang mit beiden Eltern dient dem Kindeswohl. Gleichwohl sind solche Hypothesen latent oftmals ausgesprochen unsicher – ebenso wie Hypothesen, die von einem gegebenen Befund aus Zukunftsprognosen formulieren, also z. B. die Aussage: Wenn das Kind keinen Kontakt mit seinem Vater haben wird, wird es eine unvollständige Identität ausbilden. Oder noch vager mit Bezug auf das gewählte Beispiel: Wenn ein Elternteil in seiner Kindheit selbst geschlagen wurde, besteht ein signifikant erhöhtes Risiko, sein eigenes Kind ebenfalls zu schlagen. Die Tatsachenzweifel, die sich aus den medizinischen und familienpsychologischen Erhebungen ergeben, sollen oft durch eine Art Brückenfunktion wissenschaftlich als anerkannt geltender Zusammenhangshypothesen beruhigt werden.

 

Nun legen die Hagener Autoren in ihrem entwickelten "Gutachten –TÜV" großen Wert darauf, dass eine theoretische Allgemeinhypothese in schöner Analogie zu einer empirischen wissenschaftlichen Untersuchung am Anfang zu stehen habe. Wer erst im Kontext der Befunderhebung und der Prognose unter Verweis auf wissenschaftliche Fachliteratur aus einer nun nachgewiesenen regelmäßigen Gewalt gegen das Kind, also einer bestätigten Tatsachen-Hypothese, eine Kindeswohlgefährdung kriteriengeleitetableitet, hat nach Vorstellung der Psychologie-Professoren dagegen etwas Entscheidendes falsch gemacht.Geht man von einer stringenten Argumentation aus, ist offenbar eine abstrakte wissenschaftliche Leithypothese gefordert, die einen bereits als aktenkundig (scheinbar) gesicherten abstrakten Befund wie "massive Schläge" auf die gerichtliche Leitfrage nach dem Vorliegen einer Kindeswohlgefährdung bezieht. Warum ist den Autoren dieser Gesichtspunkt so wichtig?

Zunächst ist festzuhalten, dass die wissenschaftliche Leithypothese selbst in einem auf Fallerkenntnis zielenden familiengerichtlichen Gutachten niemals überprüft bzw. in Frage gestellt wird. Nur im Kontext einer nomothetischen wissenschaftlichen Hypothesenprüfung geht es im Sinne des Popperschen Falsifikationsprinzip um den Versuch, konkrete Tatsachen zu finden, die den aus der Hypothese deduktiv abgeleiteten Vorhersagen widersprechen.[3].Es ginge also dann - nach einer fallbezogenen Tatsachenerhärtung - darum zu fragen, ob das konkrete Kind vielleicht eines jener resilienten "Wunderkinder" ist, die ohne erhebliche seelische Folgeschäden geschlagen wurden und auch weiter geschlagen werden kann. Wenn es wenigstens ein solches Kind gibt, wäre die Ausgangshypothese, dass massive langdauernde Schläge eine seelische Kindeswohlgefährdung darstellen, in ihrer generellen gesetzmäßigen Form jedenfalls widerlegt und wäre weiter zu spezifizieren und einzuschränken.

Würde man eine solche Diskussionsrichtung in einem Gutachten ernsthaft einschlagen, auch wenn alle Verfahrensbeteiligten die anzustrengende Forschungsdiskussion als solche mit Befremden zur Kenntnis nehmen, wird nun das im Fall konkret interessierende Kind betrachtet als mögliche Instanz zur Falsifikation wissenschaftlicher Hypothesen. Von den unnötigen erheblichen Kosten, die auf diese Weise produziert werden, ganz abzusehen. Die gerichtliche Leitfrage, ob dieses Kind nun gefährdet ist oder nicht,würde exemplarisch behandelt als Gegenstand einer avancierten wissenschaftlichen Forschungsdiskussion. Die empirische Überprüfung der Hypothese könnte dennoch nicht mit Abschluss des Gutachtens zeitlich zusammenfallen, da die Ergebnisse erst in der Zukunft eintreten.

Verfolgt man vorläufig die Vorstellung, familiengerichtliche Gutachten seien wie Forschungsvorhaben zu strukturieren, dennoch weiter, ist darauf hinzuweisen , dass im Hinblick auf seelische und geistige Kindeswohlgefährdung sowie auf elterliche Sorgerechtsstreitigkeiten in aller Regel keine streng gesetzesartigen wissenschaftlichen Zusammenhangsaussagen vorliegen. Selbst bei gravierenden negativen Erfahrungen wie körperlicher Kindesmisshandlung oder sexuellem Missbrauchbeweisen retrospektive Studien lediglich ein statistisch signifikant erhöhtes Risiko mittel- und langfristiger persönlichkeitsbezogener, psychosozialer und psychosomatischer Beeinträchtigungen, die auf einen erheblichen Teil der Betroffenen zutreffen Es gibt jedoch kein einheitliches Syndrom, das als sichere Folge erlebter Misshandlung anzusehen ist. [4]. Die Leithypothesen, die sich auf diese Weise generieren lassen, können also grundsätzlich nur dielogisch schwächere prototypische Form haben: "Je früher, je häufiger und je massiver ein Kind eine sexuelle Misshandlung erleben musste, desto größer ist sein Risiko, dauerhafte kognitive, psychosoziale und psychosomatische Schäden davon zutragen." Eine solche Wahrscheinlichkeitsaussage lässt sich als solche jedoch nur in einer weiteren statistischen Untersuchung prüfen und gegebenenfalls widerlegen, nicht jedoch in einer am Einzelfall orientierten gutachterlichen Untersuchung. Selbst wenn ein familiengerichtlicher Sachverständiger also allen Ernstes seinen Auftrag, die gerichtliche Beweisfrage zu beantworten, umfunktionieren würde zu einer Diskussion der wissenschaftlichen Leithypothese im Medium seines Einzelfalls, wäre sein Versuch vorab erkennbar zum Scheitern verurteilt.

Mit Blick auf den Einzelfall kann es in gerade umgekehrter Blickrichtung allenfalls darum gehen, statistische Wahrscheinlichkeiten als Begründung für die gerichtlich geforderte ziemliche Wahrscheinlichkeit einer Gefährdungsprognose heranzuziehen. Eine sinnvolle Forderung wäre es ganz allgemein, den Bewertungsvorgang, ob der aus dem Fallmaterial abgeleitete psycho-soziale Befund eine Kindeswohlgefährdung prognostizieren lasse, im Spiegel der fachwissenschaftlichen Diskussion vorzunehmen. Es ist nicht statthaft, die eigene Vorstellung von Kindeswohlgefährdung solitär hinzustellen und mal eben einen Gewährsmann aus der Literatur zu zitieren, ohne darauf hinzuweisen, dass es andere statistische Befunde oder wissenschaftliche Auffassungen gibt, denen der Sachverständige nicht folgen möchte. Es ist darzulegen, dass die Forschungslage -  in vielfacher Hinsicht muss man treffender sagen Diskussionslage, wenn man etwa an die konkurrierenden Bindungs- und Identitätsentwicklungstheorien oder das strittige Potenzial von sozialpädagogischen und familientherapeutischen Angeboten denkt -  keine klaren und eindeutigen Orientierungen geben kann, selbst wenn man  - wie in der Hagener Studie - den Hiatus zum prinzipiell einmaligen und diesseits vager statistischer Tendenzen zu eruierenden Einzelfall noch gar nicht in den Blick nimmt. Eine ausführliche wissenschaftliche Diskussion widerstreitender Auffassungen z. B. über die Reichweite von kindlicher Resilienz oder protektiver Faktoren im Umfeld des Kindes,  kann in einem Sachverständigengutachten jedoch niemals geleistet werden.

 

Zur Eigenlogik sachverständigen Vorgehens in familiengerichtlichen Verfahren

Es ist also summa summarum weder möglich noch indiziert, in einem familiengerichtlichen Gutachten wissenschaftliche Hypothesen zu prüfen noch aus gesicherten allgemeinen Kausalzusammenhängen Einzelfalltatsachen zu deduzieren.Vielmehr dienen wissenschaftliche Hypothesen bzw. im zuvor erläuterten Sinne wissenschaftlich begründete Wahrscheinlichkeitsaussagen ggf. dazu, zu einer möglichst validen Prognose von Kindeswohlgefährdungen - einschließlich natürlich der Möglichkeiten ihrer Überwindung durch zusätzliche Hilfen - zu kommen.Insoweit es tatsächlich empirische Untersuchungen gibt, die wahrscheinliche Folgen bestimmter belastender kindlicher Lebenserfahrungen nachweisen können, sind diese zweifellos bedeutsam, um ggf. das gerichtlich geforderte Kriterium des Nachweises einer ziemlich wahrscheinlichen Gefährdung des Kindeswohls als Voraussetzung für einen Sorgerechtsentzug erfüllen zu können. Je gravierender das Risiko ist, also z. B. Dehydrierung eines Säuglings, schwerem sexuellem Missbrauch und schwerer körperlicher Misshandlung, desto größer ist die praktische Bereitschaft der Gerichte, der Jugendämter und der forensischen Sachverständigen, auch bei einer relativ geringeren Prognosesicherheit zukünftiger Gefährdungen der Wiederholungsgefahr konsequent zu begegnen. Für den praktischen Zweck, Kinder zu fördern und zu schützen, reicht im familiengerichtlichen Verfahren also im Unterschied zu einer nomothetischenwissenschaftlichen Hypothesenprüfung ein allenfalls wahrscheinlicher prognostischer Kausalzusammenhang aus. Diese Wahrscheinlichkeit ist aber entscheidend nicht allein unter Rückgriff auf statistisch signifikante Mittelwertunterschiede zu begründen, die eine unverantwortliche Fehlerquote provozieren würden, sondern kasuistisch in gründlicher Befassung mit dem Einzelfall.

 

Die unabweisbare praktische Anforderung des Familiengerichts, eine gerichtliche Entscheidung zu treffen, sofern sich kein Einvernehmen herstellen lässt, erfordert selbstverständlich immer einen gerichtlichen Beschluss auch dann, wenn im gerichtlichen Verfahren, also insbesondere durch die gutachterlichen Explorationen, auch eine vergangenheitsbezogene Tatsachenaufklärung nur sehr eingeschränkt möglich ist. Während wissenschaftliche Hypothesenprüfungen auf eindeutige Tatsachenfeststellungen strikt angewiesen sind, gehört es zur Kunst des Sachverständigen wie des Familienrichters, mit unklaren Tatsachen und mehrdeutigen Tatsachenbezügen rational und verantwortungsbewusst umzugehen. Die regelhaft weit auseinandergehenden Sachverhalts- und Zusammenhangsschilderungen der konkret Betroffenen und auch der befragten Professionellen stellt die Ambiguitätstoleranz des familienpsychologisch tätigen Sachverständigen ebenso regelmäßig auf eine harte Probe. In dieser Situation kann der Rückgriff auf eine wissenschaftlich im beschriebenen Sinne wenigstens einigermaßen abgesicherte fachwissenschaftliche Zusammenhangshypothese für manche wie ein Rettungsanker wirken, die womöglich zu diesem Zweck gerne kryptisch in unangreifbar wirkendem Fachjargon vorgetragen wird.Da es jedoch nicht genuin um Tatsachenerkenntnis und um wissenschaftliche Erkenntnis geht, sondern um Ermöglichung einer möglichst guten Zukunft der betroffenen Kinder und Familien und einer juristisch tragfähigen Rechtsprechung, muss immer eine Brücke zwischen Exploration und Sorgerechtsregelung geschlagen werden.

Die Bezugnahme auf wissenschaftliche Fachliteratur geschieht nicht in der kritischen Absicht, diese durch eine neue bahnbrechende Erkenntnis im vorliegenden Einzelfall kritisch zu reflektieren. Sie dient gerade umgekehrt dazu, die sich im eruierten Einzelfall konkret mehr oder weniger erschließenden Tatsachen-Zusammenhänge zusätzlich abzusichern. Das Qualitätskriterium, um das es also in diesem Zusammenhang tatsächlich gehen müßteund auch nur gehen kann, ist die Frage,ob die abstrahierenden Schlussfolgerungen in dergutachterlichen Bewertung unter schlüssiger Bezugnahme auf die aktuelle wissenschaftliche Fachdiskussion sowie die ausreichend eruierten Sachverhalte erfolgen. Eine solche explizite Bezugnahme bietet sich indessen in der Logik eines Sachverständigengutachtens weit eher zum Zeitpunkt der Befunderstellung,der Prognose und der daraus abgeleiteten Empfehlungen an, weil erst zu diesem Zeitpunkt die Sachverhalte selbst gutachterlich exploriert wurden. Da sich erst allmählich abzeichnet, worum es aus Sachverständigensicht tatsächlich geht, ist die Steuerungsfunktion, die wissenschaftliche Leithypothesen zu Beginn der Gutachtenerstellung einnehmen, weit begrenzter, als von den Autoren der Expertiseunterstellt wird.Soweit es um die Einschätzung einer Kindeswohlgefährdung (oder entsprechend einer Kindeswohlförderlichkeit) geht, braucht der Gutachter ein explizites, differenziertes und nachvollziehbares Begriffsverständnis, dass sprachlich auch in Form einer wissenschaftlichen Wenn-Dann- Hypothese oder Je-Desto-Hypothese formuliert werden kann, jedoch nicht muß. Er muss auf allgemeiner Ebene begründet darlegen können, wann die Schwelle zur Kindeswohlgefährdung für ihn erreicht ist oder welche operationalisierbaren (auf konkrete Tatsachen beziehbaren) Kriterien für eine Evaluation von Kindeswohlförderlichkeit zur Geltung gebracht werden. Dennoch ist der Prüfauftrag nicht so zu verstehen, dass der Sachverständige ausschließlich solche Informationen erhebt und für bedeutsam hält, die oberhalb der Schwelle einer Kindeswohlgefährdung liegen oder zwischen streitenden Elternteilen diskriminieren. Er muss ebenso Entlastungsfaktoren in der Persönlichkeit und im Umfeld des Kindes erheben wie auch für sich genommen geringfügigere Belastungsfaktoren, die in einer summarischen Betrachtung ausschlaggebend werden können und ohnedies für die Formulierung von Hilfeempfehlungen bedeutsam sind.

Wenn man also Hoffnung hegen sollte, durch Formulierung einer wissenschaftlichen Leithypothese zu Beginn des Gutachtens eine zielführende Leitlinie in der Hand zu haben,um zwischen bedeutsamen und nicht bedeutsamen Informationen unterscheiden zu können, wird man enttäuscht werden. Da man auch im Zuge eines Gutachtens eine Menge an unvorhergesehenen Informationen bekommt, die neue Gefährdungstatbestände etc. begründen oder nach Aktenlage bereits bestehende als unbegründet erscheinen lassen können, müsste man zu Beginn mögliche konkrete Kindeswohl-(Gefährdungs-)Tatbestände in geradezu epischer Breite darlegen - oder aber besser sich mit der allseits bekannten abstrakt- universellen Definition von Kindeswohl (-gefährdung) begnügen. Solche abstrakte Definitionenbereits zu Beginn - bei der Ãœbersetzung der gerichtlichen Fragestellung in eine psychologische Fragestellung - zu zitieren, um sie dann im Rahmen der Stellungnahme erneut dezidiert aufzugreifen, ist sicher plausibel und ausgesprochen ratsam. Es will nur nicht einleuchten, dass die Hagener Professoren hier ein K.O- Kriterium für die tatsächliche Qualität eines Gutachtens entdeckt haben wollen. 

 

Begründung der ausgewählten  diagnostischen Verfahren

Als zweites zentrales Ergebnis präsentieren die Begutachtungs- Gutachter die scheinbar skandalöse Zahl von 85,5 % der Gutachten, die die eingesetzten diagnostischen Verfahren nicht anhand der psychologischen Fragestellungen begründen.

Ich erinnere mich aus meiner über zehnjährigen Sachverständigentätigkeit lediglich an eine Richterin, die vor vielen Jahren eben diesen Wunsch geäußerthat. Ich habe bewusst im Sinne eines intelligenten und effektiven Einsatzes meiner Ressourcen eine etwas andere Lösung für mich gewählt: ich habe alle von mir eingesetzten standardisierten und projektiven Testverfahren sowie standardisierten und (halb-)offenen Fragebögen in allgemeinverständlicher Form erläutert einschließlich grundlegender Hinweise zur "psychometrischen Qualität" des Verfahrens. Ausgehend von diesen Erläuterungen und den sich ergebenden Bezugnahmen auf die Test- und Gesprächsergebnisse bin ich davon ausgegangen, dass die Relevanz der eingesetzten diagnostischen Verfahren spätestens im Zusammenhang mit der Befunderstellung, die einzelne Testergebnisse diskutiert und diagnostisch, also mit Bezug auf inhaltliche Leitfragen einordnet, evident wird. Es hat sich niemals ein Verfahrensbeteiligter über diese Vorgehensweise beschwert bzw. ein tatsächliches Unverständnis deutlich gemacht, aus welchem Grund ein bestimmtes Verfahren überhaupt eingesetzt wurde. Daher bekenne ich gerne, dass ich keinen Anlass sehe, an dieser bewährten Praxis etwas zu ändern. Unklar bleibt, ob eine solche Vorgehensweise durch das Bewertungsraster der Hagener Studie fallen würde.

In der Hagener Studie wird die Begründung der Verfahren weit weniger mit Blick auf die tatsächliche inhaltliche Relevanz für die Situation des Kindes als vielmehr mit Blick auf die wissenschaftlichen Gütekriterien in allgemeiner Form moniert. Ganz im Gegensatz zu der Unterstellung der Autorenerweisen sich als ausreichend valide, reliabel und objektiv geltende, also allgemein als wissenschaftlich anerkannt geltende Verfahren im Zuge ihrer Interpretation im Zusammenhang mit den Leitfragen oft als überraschend unbrauchbar und irreführend. Als besonders drastische Beispiele seien- in der hier gebotenen Kürze - der EBSK (Eltern-Belastungsscreening zur Kindeswohlgefährdung)und der FIT(Familien- Identifikations- Test) als vermeintlich sichere Instrumente zur Beurteilung möglicher Kindeswohlgefährdungen oder Scheidungskonfliktegenannt. Es lässt sichvor dem Erfahrungshintergrund einer langjährigen  Anwendung dieser Testskasuistisch überzeugend zeigen, dass dieses Verfahren noch nicht einmal den Belastungsgrad der Probandin (EBSK)oder tatsächliche Identifikationen (FIT) auch nur einigermaßen angemessen widerspiegeln. Noch weniger existiert eine theoretische Vorverständigung darüber, wie scheinbar valide Belastungsangaben eines Elternteils mit den Befindlichkeiten des Kindes zusammenhängen oder inwieweit Identifikationen zwischen Eltern und Kindern Ausdruck einer pädagogisch optimalen oder problematischen Eltern - Kind - Beziehung sind. Die vermeintlich unsystematischen, durch Aktenanalyse, in offenen Gesprächen und Verhaltensbeobachtungen systematisch zusammengetragenen und verdichteten Informationen ermöglichen weit triftigere Erkenntnisse über etwaige Ãœberforderungen der Eltern im Alltag und die Qualität der Eltern- Kind - Beziehungen. Die im Einzelfall sich zeigenden Sachverhalte werden in den standardisierten Testverfahren häufig noch nicht einmal angesprochen und in den Testwerten nicht auch nur einigermaßen zuverlässig abgebildet. Hoch auffällige Elternteile, die seit Jahren vielfältigster Unterstützung bedürfen, haben im EBSK als völlig unbelastet abgestritten, obschon im vertieften Gespräch über die einzelnen Antworten keine Anzeichen für bewusst falsche Antworten sich ergeben hätten. Sowohl die Auswahl der Items als auch ihrer Faktorladungen lassen solche offensichtlich irreführenden Testergebnisse auch psychologisch nachvollziehbar zu. Man muss also in aller Deutlichkeit sagen, ob ein Testergebnis tatsächlich zuverlässig verwertbar ist oder nicht, lässt sich verantwortlich erst nach Abschluss der gesamten gutachterlichen Exploration im Zuge der "Einbettung" der Testergebnisse einschätzen, mag es auch noch so viele metapsychologische Studien geben,  die letztlich zirkelschlüssig behaupten, dass standardisierte Testverfahren immer zu zuverlässigeren Ergebnissen kommen als klinische Beurteiler.

Die Autoren der Hagener Studie halten demgegenüber ohne inhaltliche Begründung eine Begründung des Einsatzes von standardisierten Testverfahren ganz ausdrücklich für überflüssig. Selbst wenn man meint, sie würden zuverlässig messen, was sie zu messen vorgeben, soll es doch der Studie zufolge um eine explizite Zuordnung der Testergebnise zu differenzialdiagnostischen Leitfragen gehen. Wie kann diese überflüssig werden, zumal es keine standardisierten Tests gibt, die "familienrechtspsychologische" Leitfragen [5]direkt und vollständig beantworten können?!

 

Die kritisierten projektiven Tests und nicht minder das freie und auch das geleitete Spiel am Puppenhaus sind nach der hier vertretenen und seit vielen Jahren bestätigten beruflichen Erfahrung die entscheidenden Türöffner, um überhaupt Zugang zum kindlichen Fühlen,Denken und Erleben zu finden.In der symbolischen Spielinteraktion etwa kann das Kind seine inneren Themen geschützt in Szene setzen und zu einem späteren Zeitpunkt nicht selten auch den Transfer in die Wirklichkeit gemeinsam mit dem kindertherapeutischqualifizierten Gutachter vollziehen. Sich vom Kind an der Hand nehmen zu lassen, um den bekannten Grundsatz der nondirektiven Spieldiagnostik und Spieltherapie einmal zu zitieren, ist oft der Königsweg, der den Gutachter tatsächlich sicher an den Ort führt, an dem er Erkenntnisse über das Erleben und Wünschen des Kindes gleichsam geschenkt bekommt. Wo Dunkelheit war, entsteht nun ein ausstrahlendes Licht, jedenfalls so weit ausstrahlend, wie es die geistigen Möglichkeiten, Abhängigkeiten und Loyalitäten des Kindes zulassen.

Gleichwohl sind projektive Verfahren, noch stärker als freie direkte und indirekte Äußerungen des Kindes, nachvollziehbar und somit kritisierbar mit aller gebotenen Vorsicht und Einschränkung zu interpretieren. Nur genau das Gleiche gilt auch für standardisierte Verfahren, deren leicht zu berechnenden Zahlenwerten in keiner Weise Wahrheitswert und Relevanz zukommen muss!

 

Letztlich verweist die Forderung nach einer Begründung der ausgewählten diagnostischen Verfahren in der Diktion der Studie in einem gedanklich  eingeschränkten Problemaufrissunmittelbar auf dasdritte Prüfkriterium der psychometrischen Qualität der Datenerhebung.

 

PsychometrischeQualität der diagnostischen Verfahren

Da für eine Diskussion der wissenschaftlichen Gütekriterien eines einzelnen Verfahrens in einem gerichtlichen Gutachten unstrittig kein Raum ist, stellt sich die Rückfrage, welchen Aufwand die Minderheit der Gutachter betrieben haben, um die Hagener Psychologen zufriedenzustellen. Nach Ãœberzeugung der Autoren gibt es vor allem deshalb wenig zu diskutieren, weil gleich zu Beginn der Ergebnismitteilung - ohne jede psychologische Begründung -  dem Leser die an deutschen Universitäten vorherrschende Ideologie mitgeteilt wird,dass so genannte "unsystematische Gespräche", so genannte "unsystematische Beobachtungen" sowie psychometrisch prinzipiell ungenügende projektive Tests methodisch problematisch sein. Sie sehen fachliche Ãœbereinstimmung, dass die psychometrischen Gütekriterien auch bei Gesprächen und Verhaltensbeobachtungen zu beachten seien, die bekanntermaßen grundsätzlich Validität, Reliabilität und Objektivität meinen. Unterstellt wird andererseits ohne jede methodenkritische Reflexion ihrer eigenen Hypothese, dass vorab geplante Gespräche und Verhaltensbeobachtungen genau wie standardisierte Testverfahren im Hinblick auf die gerichtlichen Fragestellungen immer zu geeigneter erscheinen, weil und insoweit sie die wissenschaftlichen Gütekriterien erfüllen.

Dass eine Arbeitsgruppe im Auftrag der Deutschen Gesellschaft für Psychologie (DGP)  im Jahr 2011 kurzerhand eine Beachtung der Psychometrischen Gütekriterien fordert, erübrigt eine kontextsensible Diskussion über eine angemessene gutachterliche Vorgehensweise keineswegs.

Es ließe sich etwa als Kriterium für die Qualität eines Gutachtens postulieren, dass der Sachverständige eine tragfähige vertrauensvolle Beziehung zu den beteiligten Personen aufbaut, um auf diese Weise eine Basis für authentische und tiefergehende Selbstmitteilungen zu bekommen. Schon Vorschulkinder beginnen, ihre Mitteilungsbereitschaft von der Beziehungsqualität abhängig zu machen. Schulkinder sind bereits grundsätzlich in der Lage, bewusst zu entscheiden, wem sie welche Mitteilungen machen möchten, Entscheidendes also absichtlich zu verschweigen oder falsch darzustellen. Der bereitwillig offenbarte Blick hinter die Kulissen ist die conditio sine qua non eines qualifizierten Familienpsychologischen Gutachtens.[6]Nun sind die ebenso einfühlsame wie gezielte Gesprächsführung, die teilnehmende nondirektive Beobachtung der Eltern- Kind- Interaktion sowie die symbolische Spiel-Interaktion mit dem Kind genau solche unverzichtbaren Schlüssel.

Die Vorstellung dass die "Erhebung" der "Daten" selbst systematisch vorgeplant sein soll (eben wie bei der Durchführung eines Experiments), führt daher in die Irre. Sie geht von einer ohnehin realitätsfremden Kontrollfantasie des Sachverständigen aus.Es ist gerade nicht empfehlenswert, einem fremden Menschen gleich mit einem strukturierten Interview zu begegnen, mit der logischen Folge, dass die ausgesprochen bedeutsamen eigenen Mitteilungsbedürfnisse der betreffenden Personen als unerwünscht abzuschneiden sind. So wird der Aufbaueiner tragfähigen, möglichst vertrauensvollen und gleichberechtigten Beziehung durch ein hochgradig dominantes, unpersönliches und unempathisches Verhalten des Sachverständigen behindert. Die aus Sicht der Praxis atypische Forderung, es müsse sich um systematische vorgeplante diagnostische Gespräche handeln, die zur Einholung von relevanten Informationen dienen, macht deutlich, dass die hoch emotionale und belastete Situation der Eltern und Kinder, die in die - hoffentlich vorhandene - Praxis des Sachverständigen kommen, aus dem Blick verloren wurde. Wer versucht, durchweg  so zu handeln, wie es in dieser Diktion zugehen sollte, wird in der Praxis der Gesprächsführung zum Scheitern verurteilt sein.

 

Erst im Laufe der gutachterlichen Explorationen wird systematisch deutlich, welche Themenfelder und Fragestellungen noch unklar oder offen geblieben sind. Diese offenen Punkte arbeitet der Unterzeichner dann in der Tat anhand einer fallbezogen erstelltenChecklisteab.

 

Weiterhin wird bemängelt, dass 72,4 % der Gutachten keine konkrete Zielsetzung des Gesprächs im Sinne der Beantwortung der psychologischen Leitfragen benennen. Vielleicht könnte es erneut so sein, dass dieser Zusammenhang spätestensim Kapitel der Befunderstellung ohnehin evident wird. Wenn man beispielsweise schon in der Darlegung des gutachterlichen Vorgehens zu Beginn  den Erziehungsstil als eine Dimension von Erziehungsfähigkeit definiert hat,dannerscheint es plausibel, sich diesbezüglich z. B. mit Fragen nach Belohnung- und Bestrafungspraktiken als Konkretisierung des Erziehungsstils zu befassen. Eine explizite systematische Zuordnung sowie auch eine Beiziehung wissenschaftlicher Fachliteratur, die den Begriff des Erziehungsstils systematisch konkretisiert, sollte selbstverständlich zu erwarten sein. Unklar bleibt aber, ob nach dem Verständnis von Salewski und Stürmer auf diese Weise das Kriterium der Zielformulierung erfüllt ist oder nicht. Was ist nun ein systematisches Gespräch und was ist ein unsystematisches Gespräch? Aus Sicht der Praxis ist die Feststellung wichtig, dass die geforderteOrientierung an einem vorbereiteten Gesprächsleitfaden nicht identisch ist mit einer insgesamt systematischen, aber im konkreten Vorgehen flexiblen Abarbeitung zum Beispiel eines differenzialdiagnostisch systematisch entfalteten Begriffs der Erziehungsfähigkeit.

Die Studie lässt nur eine einzige theoretisch mögliche, praktisch jedoch hoch problematische Vorgehensweise gelten. Sie reflektiert nicht mögliche Motive der Mehrheit der Gutachter, anders vorzugehen. Ich lege z. B. zu Beginn des Kontakts großen Wert auf die Herstellung einer tragfähigen Beziehung durch Transparenz, emphatisches Zuhören und Begleiten. Nach oder während dem zweiten Einzelgespräch sind die Eltern in aller Regel schon weit weniger emotionalisiertund verunsichert, weil sie durch entsprechende Rückmeldungen die Erfahrung gemacht haben, dass der Sachverständige ihre Sicht der Dinge wohlwollend und neutral nachvollziehen kann. Erst wenn eine stabile Gesprächsebene entstanden ist, kann der Gutachter gezielt und erfolgversprechend vertiefte Nachfragen zu oft heiklen und belastenden Themen stellen.Sofern nicht gerade hoch brisante aktuelle Ereignissee berücksichtigt werden müssen, können die diagnostischen Leitfragen des Sachverständigen kontextsensibel und d. h. nicht in einer vorher festgelegten Reihenfolge und Ausprägung Schritt für Schritt eingebracht und abgearbeitet werden. Neue grundsätzliche wie konkrete Fragen tun sich auf, anfänglich für wichtig gehaltene offene Fragen erübrigen sich. Dieses intelligente und flexible Vorgehen ist im Ergebnis systematisch und doch weit entfernt von jenen irrealen Kontrollfantasien, die offenbar in der akademischen Psychologie noch immer ihr Unwesen treiben. Die wichtigsten weiterführenden Informationen sind in der Regel nicht konkret vorhersehbar, sondern ergeben sich fast wie am unsichtbaren roten Faden gezogen im Kontakt.

 

Mit Blick auf Verhaltensbeobachtungen unterliegt die Hagener Studie dem gleichen Grundirrtum, dass nur systematisch geplante, also vom Sachverständigen vollständig kontrollierte interaktionelle Settings auch systematisch auswertbar seien. Die Umsetzung der Vorstellungen der Hagener Studie würden so entsprechend systematisch verhindern, die zu erkennenden tatsächlichen Eltern-Kind-Beziehungen in Erfahrung zu bringen, so dass man schon geradezu hoffen muss, dass die allermeisten Sachverständigen (81 Prozent in dieser Studie) diesen Kriterien nicht genügen.

Es ist zwar fraglos sinnvoll, zum Beispiel in einer alltäglichen pädagogischen Situation im Elternhaus oder auf dem Spielplatz den Eltern eine bestimmte Aufgabe zu stellen, um ihre Erziehungsfähigkeit zu prüfen. Solche Formen der aktiv vom Gutachter initiierten und in der Durchführung kontrollierten Datenerhebungen können jedoch nicht die Regel, sondern sinnvollerweise immer nur die Ausnahme sein. In der Beurteilung der gutachterlichen Vorgehensweise wäre eine klare Beschränkung auf das systematische Beobachten - etwas unterstützt durch Verwendung von Videokameras - und Auswerten sachgerecht gewesen. Sinnvoller Weise zu fordern ist eine fortlaufende systematische Protokollierung und Auswertung der in Erfahrung gebrachten Aussagen, Verhaltensweisen und sonstigen relevanten Beobachtungen. Für die Qualität des schriftlichen Gutachtens insoweit entscheidend ist, ob in der gutachterlichen Darstellung die relevanten Sachverhalte vollständig (ggf. auch mit allen Widersprüchlichkeiten), nachvollziehbar und übersichtlich dargestellt werden.

 

Wenn hingegen kritisiert wird, dass häufig nur allegorische Schilderungen eine systematische Beschreibung typischer Interaktionsmuster ersetzen, dann ist dieser Kritik ausdrücklich zuzustimmen.Nur lassen sich eben auch spontane Interaktionen – etwa unter Einsatz der Videotechnik - systematisch auswerten.

 

Methodenkritische Interpretation der Ergebnisse

Wie schon deutlich wurde, wird im Kern von Sachverständigenerwartet, dass die eingeschränkte Verwertbarkeit projektiver Tests in der psychologischen Stellungnahme vermerkt werden müsste, während als wissenschaftlich anerkannt geltende standardisierte Verfahren keiner methodenkritischen Würdigung mehr zu unterziehen seien.

 

Der Gedanke der Methodenkritik wird dabei entscheidend verengt  auf den ausführlich diskutierten Aspekt der psychometrischen Gütekriterien. Die mögliche Relevanz oder eben auch Irrelevanz eines eingesetzten Verfahrens für die gutachterlichen Leitfragen wird dagegen in keiner Weise reflektiert.

 

Not tut eine methodenkritische Interpretation der Ergebnisseund vor allem der hieraus wenig konsistent abgeleiteten berufspolitischen Empfehlungen der Expertise selbst.

 

In der Studie wird eher wenig überraschend festgestellt, dass lediglich jeweils in einem einzigen Fall (!) Interviewergebnisse und Verhaltensbeobachtungen methodenkritisch diskutiert worden sindund in lediglich 10 von 85 Gutachten eine methodenkritische Bewertung der eingesetzten Testverfahren zu finden war.  Dass methodenkritische Einschränkungen so gut wie nie diskutiert werden, hat vermutlich damit zu tun, dass zu unreflektiert der Sorge stattgegeben wird, auf diese Weise die Basis für die eigene gutachterliche Empfehlung  zu schwächen, wenn nicht sogar der Unbrauchbarkeit des eigenen Gutachtens in wissenschaftlicher Lauterkeit das Wort zu reden, nach dem Motto: wenn der Gutachter selber schon seine Untersuchungen für fragwürdig hält, dann haben die Anwälte leichtes Spiel.

 

Hätten die Autoren der Studie ihre eigenen Kriterien und diesbezüglichen statistischen Ergebnisse konsequent angewendet, hätte die zentrale Botschaft also nur lauten können: nahezu alle Gutachten genügen wissenschaftlichen Kriterien nicht, also auch solche, die von "Gerichtspsychologen" erstellt worden sind. Wie schon Fichtner (ZKJ 1 u. 2/ 2015) richtig erkannt hat, kommenSalewski und Stürmer jedoch zu dem Ergebnis, lediglich über die Hälfte der Gutachten seien mängelbehaftet, obwohl es tatsächlich95 % sind - und damit mathematisch zwingend auch die große Mehrheit der Gutachten forensisch weitergebildeter Psychologen. Solltedie große Mehrzahl der speziell forensisch weitergebildeten Psychologen hierdurch nicht in gleicher Weise einer Pauschalkritik zu unterzogen werden wie die nicht forensisch weitergebildeten Psychologen? Denn mit ihren Untersuchungsergebnissen stellen sie sich bereits unweigerlich in einen massiven Gegensatz zu der  empiriefreien, offenkundig lobbyistischen Behauptung des Berufsverbands Deutscher Psychologinnen und Psychologinnen, der sichetwa in seiner  Stellungnahme vom 3.6.2013 zum FAZ Artikel vom 12.11.2012, nachzulesen auf der Internetseite http://www.bdp-verband.org, wörtlich folgende Behauptung aufstellt:"Nur Diplom-Psychologen und Psychologen mit einem Masterabschluss sind kompetent, als psychologische Sachverständige zu arbeiten."

Stürmer und Salewskiverzichten leider darauf, im Hinblick auf ihre vier Leitfragen differenziert das Abschneiden der forensisch weitergebildeten und nicht weitergebildeten Gutachter in absoluten (Prozent-)Zahlen darzulegen. Stattdessen sprechen sie lediglich von "signifikanten Unterschieden" zwischen beiden Gruppen, obwohl bei einer entsprechend hohen Stichprobengröße auch praktisch bedeutungslose, geringfügige Mittelwertunterschiede statistisch signifikant sind[7].

Die Stichprobengröße ist nun in der Interpretation der Autoren der  Studie identisch mit der Grundgesamtheit, da es sich um eine jahrgangsbezogene Vollerhebung von vier Amtsgerichten handelt.Dann sind allerdings Schlussfolgerungen über die gewählten Amtsgerichtsbezirke hinaus wissenschaftlich unzulässig! Mit jeder vergrößerten Grundgesamtheit (OLG Hamm, NRW, Bund)müßten die Signifikanzen neu berechnet werden – möglicher Weise mit dem Ergebnis, dass die allgemein als zulässig geltende höchste Zufallswahrscheinlichkeit von 5 Prozent überschritten würde! Ferner müßte nachgewiesen werden, dass die ausgewählten Bezirke repräsentativ sind, da es sich nicht um eine Zufallsauswahl handelt.Nicht nachvollziehbar ist eine solche Vorgehensweise, weil mindestens eine landesweite, tatsächlich aber eine bundesweite Interpretation der Ergebnisse vorgenommen und erwartet wird.

 

Berufspolitische Schlussfolgerungen

1.  In der gegenwärtigen Diskussion wird kaum berücksichtigt, dass die Schaffung gesetzlicher Vorgaben für die Aufnahme einer Sachverständigentätigkeit in (Familien-)gerichtlichen Verfahren zuallererst einen Eingriff in die Entscheidungskompetenz der (Familien-)Richter darstellt. Es wird dieser Berufsgruppe ohne weitergehende Begründung sachimmanent unterstellt, die Qualifikation des beauftragten Sachverständigen nicht einschätzen zu können. Damit geht die häufig zu lesende Klage einher, dass entsprechend die Qualität des erstellten Gutachtens nicht eingeschätzt werden könne, obschon unzweifelhaft die Familienrichter eine solche Einschätzung faktisch vornehmen und einen Gutachter kein weiteres Mal beauftragen, wenn sie die Qualität seines zuletzt erstellten Gutachtens für mangelhaft halten. Ein Reformansatz für eine Verbesserung der Qualität von gerichtlichen Sachverständigengutachten muss daher sachlogisch zunächst die Urteilskompetenz von Familienrichtern stärken, inhaltliche und formale Mängel in Sachverständigengutachten zu erkennen.Würde den zuständigen Richtern diese Kompetenz(wieder) zugetraut, gäbe es vermutlich keinen Anlass mehr für eine lautstark geführte Diskussion über die Einführung von gesetzgeberische Vorgaben für die Qualifikation der beauftragten Sachverständigen.

 

Artikelnr.
1 Anfrage  


Rubrik: Qualität von Gutachten
Institut zur Förderung des Kindeswohls Dr. Oskar Klemmert - Gutachten, Mediation, Therapie, Beratung, Interaktionsbegleitung