【罗夏墨迹技术的近期发展与争论】 罗夏墨迹测验
发布时间:2020-03-03 来源: 人生感悟 点击:
摘 要:综合系统在罗夏墨迹技术(RIM)的标准化、客观化方面取得了很大的成功,但仍有一些批评者对它的信度、效度、常模与标准化等问题提出了质疑,作者们对这些争论的焦点问题进行了系统的回顾。总结有关的元分析和实验研究,发现RIM的多数核心变量都有较好的评分者信度和跨时间稳定性,只有心理状态变量的信度较低。以往的整体元分析和局部元分析都发现RIM不逊于其他测验。这些结果表明RIM在临床疾病诊断,外显行为预测方面都是有价值的。与其他测验一样,RIM也有其优势与不足,在应用中应与其他测验互补。
关键词:罗夏墨迹技术;效度;信度;常模与标准化
罗夏墨迹技术(R/M)是历史上争议最多的心理测验,直到今天仍然是应用最广的测验之一。RIM的支持者主要有Exner,Weiner,Meyer,Hiller,Bomstein等,他们一直在反驳批评者,捍卫RIM的价值,但他们对RIM的认识也更加中肯,认识到了RIM的长处与短处,而不像有些人那样不现实地鼓吹RIM(如认为RIM是最好的测验,是透视人格的x光)。批评者则主要有Wood,Nezworski,Garb,Lilienfeld,Florio等,他们坚持怀疑RIM的心理测量学性能,认为RIM仅仅具有很有限的用途,建议取消RIM。
我国除有少数学者尝试使用RIM外,多数人则持观望态度。那么在心理测量技术日益多样化,新的测量技术不断出现的今天,还有没有必要研究和推广RIM?RIM是否具有其他测量工具不具备的功能?使用RIM所带来的增值(incremental)效度是否大于使用成本?近10年来,国外RIM的支持者与反对者围绕RIM的信度、效度、常模与标准化等问题进行了多次辩论。学者们采用元分析研究、追踪研究、实验研究和相关研究等佐证了不同观点,这些辩论使人们对RIM的性能有了更清晰的认识。本文的目的就在于系统地回顾和介绍这些观点,使读者公正地评价这一测验,进而在是否使用这一测验上做出判断。
1 关于RIM的信度
关于RIM的信度研究很多,在PsycINFO中能找到大量的资料。近期Weiner所做的文献回顾显示,部位分、对称分、常见回答和z分的评分者信度高于90%,而决定因素和特殊分的评分者信度系数是85%左右。Exner发现13个核心变量的重测稳定系数不低于0.80。但是心理状态性变量的重测信度系数较低,例如,焦虑变量Y会随时间不同而发生波动。Exner的结果中还显示出儿童的重测结果会发生变化,但这些变化都可以根据发展心理学的理论进行解释。
但是批判者仍提出了很大的疑问,认为RIM不论在评分者信度还是重测信度上都存在问题。他们认为不同评分系统的施测者其测试结果不能做一致性分析,即使是采用同一个评分系统由于评分者主观性太强也容易造成评分者信度的差别。针对这种观点,2002年Gronnerod收集了PsyclNFO数据库中1921~2002年间所有关于时间稳定性的研究,并把方法上存在问题和记分标准不一致的研究全部删去,对符合要求的作了元分析。结果显示罗夏记分存在很好的跨时间稳定性,在3年以上时间间隔的重测中,重测稳定性系数在0.68~0.73之间。在消除各种中介变量的系统影响后,用回归方程预测重测信度,则三年以上时间间隔的理想值为0.77~0.97,5年以上的理想值为0.65~0,90。
当然并不是在所有情况下RIM的信度都令人满意。如果主试未受过训练或没有经验,那么评分者信度系数很低。对心理特征不稳定的被试,重测相关也低,如不同年龄发展阶段的儿童,有情绪障碍的病人,或不断变化的精神障碍患者。
2 关于RIM的效度
效度可以说是所有RIM争论的焦点。RIM的支持者对其效度的研究主要集中在临床诊断的准确性和预测性。第一个证明RIM有效性的研究是由Benjamin和Ebaugh发表的。在这个研究中的46个案例中,罗夏的解释与临床上的诊断完全一致的占84.7%。而Brussel和Hitch报告的案例中临床诊断和RIM的一致性高达98%。像这样的结果是特殊的,并且不能在任何时候都能被重复验证。在发表的研究中也有大样本(N=101)的案例,如Michael和Buhle研究中报告了临床诊断与RIM结果间的一致性达76%,在精神神经质组(psychoneurotic group)二者的一致性最高,在病态人格组(psychopathicpersonality)则一致性则非常低。
元分析方法是检验测验效度的有效方法,对RIM的元分析有整体元分析(即整体地检验所有记分的效度)和局部元分析(只检验RIM中单个量表或记分的效度)。有三个整体元分析影响非常大。如Aikinson的研究中显示RIM的平均效度是0.36,MMPI的平均效度是0.40。1988年Parker等人用元分析方法对RIM、MMPI和WAIS中的记分或分量表的效度进行了比较,得到的平均效度分别是0.37、0.43和0.57。但1998年Garb,Florio和Grove对Parker等人的元分析结果进行了再分析,得到RIM的效度是0.29,MMPI效度是0.48,他们发现当删除存在共同方法的研究和报告了X2的研究时RIM的效度是0.36,MMPI的效度是0.55。Garb等由此认为Parker等人夸大了RIM的效度,RIM的效度明显低于MMPI,因此他们主张废除RIM。
针对Garb等人的批评,Meyer与Archer搜集了1970~1981年间joumal of personality assessment和joumal ofclinical psychology中报告的效度系数,发现若对研究不加筛选,则RIM的平均效度系数为0.33,MMPI的平均效度系数是0.22,若删除共同方法的影响,则RIM的效度是0.27,MMPI的效度是0.25,WAIS的效度是0.36。又因为Hiller等对在1977~1997年间发表在任何杂志上的文章进行的元分析表明RIM的效度是0.29,MMPI的效度是0.30,因此Meyer与Archer认为RIM的效度不低于MMPI。回顾这些元分析研究,我们还发现RIM的效度比MMPI更为稳定。
1990~2000年间,许多研究对RIM与其他测验对相同效标的预测结果做了局部元分析(只检验单个记分或量表的效度)。如Bornstein的研究显示RIM的口唇依赖量表(Oral Dependence Scale)与外部行为表现的相关是0.37,而其他测验(如TAT依赖量表,Blacky图片测验口唇依赖量表,MMPI依赖量表,MCMI依赖量表,EPPS求助心态量表,IDI 依赖量表)与外部行为的相关在0.17~0.50之间,可见RIM的预测效度较高。
Meyer、Handler[12J3]和Meye对RIM测验与其它测验对治疗结果的预测效度进行了比较,结果显示RIM的PRS量表的预测效度是0.45,MMPI自我力量量表的预测效度是0.02,IQ的预测效度是0.15,RIM测验中PRS量表对IQ量表的增益效度是0.36。
Romne比较了RIM与其他几个相关测验对区分精神分裂症病人与控制组的效度,结果显示RIM的言语偏差量表的效度是0.22,Lovibond物体分类测验效度是0.23,所有非罗夏的思维过程测验的效度是0.23。
Bornstein的研究比较了几个测验对身体疾病的预测效度,罗夏口唇依赖量表的预测效度是0.72,主题故事方法的效度是0.29,DSM访谈的效度是0.09,自陈量表的效度是0.18。
Meyer与Archer收集了以往所有关于RIM、MMPI和WAIS中单个记分或量表的效度研究结果,并对其效度系数进行比较,发现RIM记分的效度在0.14~0.46之间,平均为0.34;MMP分量表的效度在0.02~0.78之间,平均为0.2835;IQ的效度在0.12~0.52之间,平均为0.31可见RIM单个记分的效度更高,而且更为稳定。但在服务于不同目的时,三个量表的有效性是不同的。如RIM中的X-%记分对精神病组和控制组的鉴别效度是0.461171,RIM中的PRS量表在IQ基础上对治疗效果的预测效度是0.36,RIM中的DEPI指数对抑郁症鉴别的效度是0.14。MMPI基础量表的效度是0.78,MMPI依赖量表对依赖行为的预测效度是0.20,MMPI自我力量量表对心理治疗效果的预测效度是0.02,WAIS中的IQ分对痴呆患者的鉴别效度是0.52,对工作表现的预测效度是0.25,IQ测验与交通事故的相关是0.12。
从以上资料可以看出RIM、MMPI和IQ的效度,随着预测标准的功能变化而变化。对某些目的来说RIM的效度优于其他测验。例如,SCZI能对精神病进行诊断等。这个道理对于其他测验也适用。例如MMPI善于从控制组中鉴别出精神病患者,而不善于预测犯人的胡作非为,IQ测验善于鉴别出痴呆而不能预测飞行员的成功。然而,任何一个测验都不可能在所有的方面都是有效的。
不论支持还是批判RIM的学者都承认测验中的一部分记分是有效的。即使对RIM持批判态度的心理学家也认为其结果能鉴别思维障碍者,并且通过思维障碍者的特征对不同精神障碍者加以鉴别,测量依赖性,预测治疗的结果。
可见否定RIM效度的说法没有根据。在很多时候RIM的效度高于其他心理测验。因此如果恰当地使用RIM,将会得到非常有价值的结果。
3 关于RIM的常模与标准化
从20世纪70年代至今,样本的标准化问题一直是RIM的一个争论点。在RIM的发展的历史中,Klopfer所倡导的RIM是以精神分析理论为导向的,并不关注测验的心理计量学特征并且拒绝标准化这个特征。而Beck和Rapaport所提倡的RIM系统中有标准化数据,但是他们的标准化样本很小且没有代表性。
与早期的这些系统相比较,综合系统因有标准化样本而在发展过程中越来越受到推崇。在20世纪70年代晚期,Exner建立了正常成人、儿童和不同种类精神病患者的标准化常模。样本是由700名不同层次的正常成年人,390名儿童和青少年,320名精神分裂症患者,315名住院的抑郁症患者,440名门诊患者,180名性格障碍患者组成。但是,综合系统的样本标准化也不断遭到Lilienfeld和Wood等人的质疑。他们对以下几点提出批评:很多正常成人和儿童,若根据CS的标准化样本,却被诊断为异常;正常人样本中有精神病患者;不同文化和民族间的标准化样本应该存在差异;病理特征的标准应随时间的不同而变化;不正确的施测导致了标准化样本的差异。
Exner认为CS中的正常人数据与Shaffer等的正常人数据之间存在着差异,部分是由于R的分布造成的,但x+%,X-%等重要记分的差异并不明显。Exner认为Wood等人所说的RIM的标准化样本误导了诊断信息是过于夸大的,造成这一点是由于他们对此测验和用法的错误理解造成的。Weiner认为,Exner标准化常模比其他大多数心理测验的常模标准化程度更高。但罗夏的常模也确实存在缺点,最主要问题是缺少对少数群体的研究。
4 RIM的应用
4.1 目前在国外的使用情况
RIM一直是临床心理学界用得最多的测验之一。如Piotrowski和Keller对413个心理门诊的调查发现80%以上的机构用RIM。Watkins等人对412名临床心理学家的调查也发现,82%以上的人说他们在评估中用RIM。使用率更多的方法是临床访谈(95%),WAIS(93%),MMPI(85%)和句子完成法(84%)。而且综合系统的测试标准是当今美国和西欧应用最多,也是在美国大学中被讲授最多的方法。1997年,美国心理学协会专业事务委员会授予Exner博士杰出专业贡献奖。这说明RIM得到美国心理学协会的公开承认。美国心理学协会专业事务董事会把RIM看作至今唯一一个最具实力的心理学测量工具(1998)。
在美国,罗夏墨迹测验除用于心理咨询与治疗领域外,在临床心理学的其他分支领域的应用也十分广泛。以司法心理学应用为例,据统计,在1945至1995这五十年间,有247起案件的审理引用了罗夏测验的结果,平均每年5起。在这247起案件的审理过程中,除有26起对测验的信度和效度提出疑问(占10.5%)外,其余案件均认可罗夏测验的结果可靠并且有效。
比如,诈病是司法鉴定中一个重要问题,Crawford的研究指出综合使用MMPI-2效度量表和RIM的戏剧性特殊分数(DSS是B1、Fi、Ex、Sx、MORO1AG的和)来评估诈病,比单独使用两种测验更加有效。研究对象为55名伪装患有抑郁或者背痛的临床心理学研究生(对照组),和经精神病测试程序诊断为抑郁和疼痛的44名诈病患者(目标组)。研究采用正报率和误报率(TPR&FPR)作为效度指标。联合使用MMPI-2的装坏量表(FBS)和RIM戏剧性特殊分数DSS,可以得出最精确的TPR和FPR,而且能够在逐步线性回归模型中解释40%的诈病分数变异。其它常规的MMPI-2效度指数,如F家族量表(F,FB,F(p)和其它RIM变量不能够预测诈病,或提供TPRIFPR可接受水平。
Bonieskie研究了儿童监护诉讼当事人与其他病人和非病人群的差异。结果表明儿童监护诉讼当事 人与正常人常模数据和大学样本比较,在罗夏Y,m,AG,COP,WSUM6和X+%变量上显著不同。这说明他们在决策和判断力上存在问题。他们采用非常规的观点看问题并且容易忽视一些重要信息,从而导致无效的问题解决。同时他们AG和COP分低,CDI阳性,表明他们在人际互动中的消极态度,及应对和社会交往能力的欠缺。这些特征极有可能使他们作为父母不能确定什么是他们的孩子最需要的,从而不能尽到监护人的责任。这一结果对法庭诉讼,及通过法庭对监护关系的干预都是重要的。
4.2 在心理疾病诊断和治疗中的作用
罗夏本人认为RIM的最基本和最重要的用途是心理异常的诊断。他认为RIM不仅是一个测验,还是实验可以依据的工具。这个工具能对智力迟缓者、精神分裂症者和其它具有典型特征的群体进行鉴别。后继的研究有很多支持了这一观点。如Archer和Gordon、Hilsenroth等利用RIM证明了精神病患者会在语言表达上有缺陷并且经常做出形状质量很差的反应。Hilsenroth等的研究还显示出RIM可以对分裂型人格障碍者进行诊断。Exner发现精神分裂症指标SCZI能够鉴别出80%被DSM标准诊断为精神分裂症的当事人,只有12%的来自其他心理障碍患者样组或是正常人样组的当事人被错误指认。自杀综合指标S-CON可以鉴别出83%的自杀者。如果把想自杀的当事人按照自杀意愿的强度进行分类,则S-CON可以鉴别出92%的自杀意愿强烈者,并且只错误地将12%的住院抑郁症患者和6%的精神分裂症患者识别为想自杀者,但没有一例正常的当事人被错误指认。
即使最尖锐的批评者Wood和Lilienfeld也承认罗夏记分不是随机的和没有意义的:“精神分裂症患者,双极障碍患者(bipolar disorders)、边缘性和分裂型人格障碍者在RIM中易于作出更多的不正常的语言反应,表现出差的形状回答,在“思维障碍指数”等几个与特殊分有关的指数上的得分将不同。
多数人认为,RIM的使用者如果具备非常的经验和技巧,就能从测验中得到大量信息,这些信息对疾病的诊断和治疗都有重要的意义。
4.3 在特殊儿童研究中的应用
4.3.1 在注意缺陷多动障碍(AD/HD)中的研究 RIM的研究能够在很大程度上揭示AD/HD儿童的认知和人格特征,帮助制订相应的干预措施。如Cotugno等发现AD/I-ID儿童在罗夏变量Lambda、Shading、X-%、Xu%、CDI、DEPI等显著性高于对照组;而SUMC、Afr、egocentricity index、COP、纯H、AG、常见回答P、Xo%、特殊分数Sum6、加权特殊分数WSUM6则显著低于对照组。揭示AD/HD儿童存在显著的应对缺陷和信息处理、自我和人际知觉、情感表达及思维能力的障碍[32]。Bartell发现AD/HD儿童有较少的人类运动回答M,低的经验平衡EB(关系到利用资源时的一种心理风格或偏好)和高的歪曲形状X-%。对立和非对立型AD/HD儿童中则存在人类回答频率的显著差异。Strickland的研究发现AD/HD男童在避免复杂性(高L),避免问题解决风格,缺乏应对技巧(CDI),低自尊(自我中心指数低),情感回避(低Afr)和人际知觉困难(较少的COP AG H,T),较差的现实知觉(PTI和P少),而且有抑郁情绪易感性(DEPI高)。一个未预料到的结果是有38%的显示出一种过分卷入的应对风格。
4.3.2 在儿童学习障碍中的应用
Acklin等研究了两类学习障碍(言语能力障碍和空间能力障碍)儿童的罗夏特点,发现学习障碍儿童表现出感知准确性差,信息处理和问题解决的低效率,逃避情感刺激,及自我知觉不准确等问题,表现在x+%、F+%、X-%、zd、DQ+、DQv/+、WSUM6、Aft及自我中心指数上有显著差异。Rodriquez,Sutil的研究也发现西班牙学习障碍儿童在感知精确性、自我概念等方面显著性低于对照组儿童。
4.3.3 天才与非天才儿童的比较研究
Wideman对比了来自5所公立小学4~5年级的30名天才儿童(IQ平均值为132,73)和30名非天才儿童(IQ在90~109之间,平均值为102.8)。结果发现天才组儿童认知卷入程度明显高于非天才儿童(即L值更低),天才组内向(表现为EB左边高于右边)人数显著高于非天才组,而中间型则显著少于非天才组,天才儿童的反应更复杂(表现为混合决定因素Blends更多)。两组的精神分裂症指数SCZI差异不明显。
4.3.4 在其他儿童心理障碍中的应用
罗夏测验在其他的儿童精神障碍的诊断和干预研究中也得到广泛应用。Holaday等的研究表明Asperger综合征儿童的合作性运动COP、纹理回答T、人类运动回答M、人类回答H、加权彩色回答WSUMC、现实经验EA等显著低于常模,而应对欠缺指数CDI和持续或综合错误的回答显著高于常模。从而支持了DSM-IV对于Asperger综合征的诊断,即人际交往的异常,贫乏的社交关系和社交无能,弱的情感表达及建立和保持亲密关系的缺失。
Weber发现品行障碍儿童的纹理回答T和纯人类内容H显著为低,而弥漫阴影回答得分高,显示品行障碍儿童具有低的人际依恋和对他人兴趣缺乏、高焦虑等人格特点。
5 对争论的评价
5.1 如何看待关于RIM的争论
从上文的论述可以发现,有很多研究证明RIM的心理测量学性能并不比其他心理测验低。但为什么还有那么多批评呢?我们认为其主要原因是批评者对RIM存在误解。RIM的总体效度并不优于其他测验,再加上其使用成本高,施测费时费力,解释不易避免主观性等原因,导致一些学者的坚决反对。除批评者的原因外,RIM本身也存在问题,主要有:
(1)RIM的应用价值被支持者不现实地夸大,进而被误用和滥用。RIM的临床效度是较好的,但不是每个记分都有效度。很多记分只有在一定条件下才有意义(比如有的记分只适用于特定的人群,有的记分只有在其他记分超出正常范围时才能代表某种特征)。RIM提供的信息量比普通的心理测验大得多(有100多个记分,还有内容分析等信息),使用者往往希望尽可能多地从测验结果中得出结论,却忽视了科学的原则。
(2)很多RIM的使用者并没有完全遵守综合系统的测试原则与标准,其他RIM系统的记分和解释标准仍然存在。这就使不同研究者的结论缺乏一致性,导致研究结论不能重复验证。从而招致反对者的批评。
(3)很多RIM的使用者并没有受过专业训练,实际上,很多研究者采用学生做主试,这些人根本掌握不了复杂的施测和解释技巧。Meyer和Wood 等一致认为:临床心理学家们没受过专业训练就使用RIM,那么结果是很危险的。任何需要复杂的施测、记分和解释原则的测验都是如此。当研究者没有充分地理解RIM和它的心理测量学原理及使用要求时,所得出的结论往往是片面的。
5.2 如何认识RIM的,bN测量学性能
RIM信度(包括评分者信度和重测信度)基本上是没有问题的。多数变量的信度系数符合心理测量学标准,只有少数与状态性人格特征有关的变量信度低于0.70。争论的焦点是其效度。RIM受到批评的主要原因是多数变量与效标的相关不高。造成这一问题的原因有:(1)效标本身可能并不可靠,即效标测量也存在信度和效度的问题。在临床诊断和人格评估中迄今还没有完全准确的效标。(2)RIM与其他心理评估工具测量的内容并不相同。多数效标来自口语报告,所描述的多数是外显行为的差异,而RIM主要测量内隐的和长效行为。(3)RIM记分通常不具有独立解释意义,只有与其他记分结合起来,才能代表某种心理特征。
另外,依据单个RIM常常容易得出错误的结论,对测试结果必须整体地、综合地分析。同时还要参照来自其他测验的信息,以及面谈、个人病史等资料。例如Parker等人通过元分析研究,发现如果使用RIM的综合指标,测验的临床效度可以达到0.46,甚至高于MMPI(其效度为0.41)。
5.3 如何看待RIM的使用价值
RIM是一个很复杂的测试,但为什么许多人还对此测验情有独钟呢?原因在于,RIM是一个非结构化的、非文字的心理测验,而且在一定程度上可以被当做投射测验。它能有效地避免意识的审查和伪装,从而能对人无意识中表现出的感知能力、思想过程、需要、动机和冲突进行评估,能对人的间接行为(被试对墨迹图的间接反应)给予解释,获得关于个体心理特征的丰富信息。而这些信息常常是其他测量工具所不能发现的。很多研究表明RIM在心理疾病诊断和外显行为预测方面有增值效度。
RIM能有效地测到被试的经验和世界观,自我及人际知觉。例如,两个被试在MMPI上的得分模式一样,都是2、4、8量表高分,但是被试A在RIM中的病理内容(MOR)和危险内容记分多,而被试B的记录中有2个镜像反应且攻击内容多,对这两个被试病因的分析和治疗措施的选择就有相当大的差异。被试A是一个具有抑郁和焦虑情感的人,过多知觉到现实世界中的危险,表明他有心理创伤或受过伤害。被试2则可能是病态自我中心的人格障碍或攻击性行为人格障碍。
RIM也能有效地检测出被试感知觉的精确性和现实性。一个被试可能在面谈和自陈式测验中表现良好,尤其在社会习俗方面,但他的思维和知觉障碍却可能在RIM中体现出来。在评估思维障碍的程度和内容上,RIM优于其它经常使用的评估工具,综合系统的特殊分能对不同思维问题进行分类。RIM在评估情感经验、情绪表达和控制、压力耐受和控制等方面也很有用。
RIM中包含了关于个体心理特征的丰富信息,虽然这些信息也能通过其它的外部行为来表现。例如,朋友或亲戚所观察到的行为,正式访谈所记录的行为,他人仔细观察或深入访谈所得到的外部行为,通常是很准确的。但是这些外部行为却不能体现其心理过程,而RIM的结果能体现这样的信息。这些信息往往是非常重要的。
5.4 使用RIM时应注意的问题
5.4.1 知道测验能做什么不能做什么
RIM并不能测试所有心理特征,在心理疾病诊断方面,有时它并不比其他心理测量工具更精确。与其他心理测验一样,RIM也有其长处与短处,应该与其他测验相互补充。RIM主要测量三方面内容:(1)内隐动机(如不能直接表达的需要状态);(2)认知、感知风格(如习惯用哪种方法感知和加工信息);(3)应对风格(耐压性和应对资源)。这三方面的信息不能通过口头报告、问卷法和访谈法而获得。因此许多临床学家认为把RIM与其他测验结合使用能更全面地了解人的心理功能。
5.4.2 RIM的优势在于测量内隐人格变量
用投射测验(如RIM和TAT)与自我报告(如访谈和问卷)测量同一种构念,测量结果间往往不会有高相关。原因是这两种方法测量了这种心理学构念的不同侧面。事实上投射法与自我报告法存在高相关,那么投射测验就不重要了,用访谈法就可以得到的为什么还用墨迹图来研究呢?McClelland,Koestner,Weinberger指出:内隐动机的测量结果(例如RIM和TAT)能对未知情境中的自发性行为加以预测,RIM方法比自我报告方法能提供动机和情绪方面的更直接信息,因为自我报告所提供的许多信息因为受到意识的审查和自我监控的影响而没有表达出来。
RIM中的其他记分如应对指数、感知或认知功能指数都具有这一特征。如研究者用口唇依赖量表(ROD)对心理的应激状态,自发寻求帮助的行为进行测量,发现ROD量表比自我报告法更能预测无意识过程的间接表现。就是说,如果我们要研究受内在动机驱动的行为或长期行为,则最好选用RIM、TAT类的投射测验。
5.4.3 主试必须接受专业训练,在严格指导下测试RIM
施测过程对任何一个测验都非常重要,对RIM来说更是重中之重,主试在施测中所做出的任何判断都会影响记分。RIM测试中主试的询问起着至关重要的作用。主试在测验中很可能忽略被试反应中的某些关键词,询问不充分,询问的问题过多或过少,问了些不合适的问题。口语记录也很关键,主试很可能忽略某些相关的信息,或者使信息进行了错误的重组等等。这些问题在记分中不能被更正过来就会影响许多记分。我们可以用一个例子来说明询问的重要性,Adriana Lis和她的同事在搜集意大利人的样本时,第一次没有用标准的询问程序,结果发现成年人(N=101)样本和青少年(N=51)样本记分都明显不同于Exner的标准化样本,修订时对主试进行了标准化训练,新样本资料才与Exner样本趋于一致。这说明对施测的质量和询问进行系统监测的重要性。
5.4.4 了解RIM的适用条件,合理设计研究
RIM是一种投射测验,在研究设计中要考虑这个测验本身的特点才能发现有用的结果。首先要选择合适的效标。当用RIM和其他测验对同一构念进行验证时,应采用多标准多方法。其次,在评估测验的结果时,应考虑RIM本身的局限性,而不是用RIM解决所有问题。再次,当把投射测验结果与自我报告的结果进行对比时,应多用实验的数据而不仅仅用相关的数据。
6 结论
从以上我们对不同时期元分析研究的总结,可以看出RIM的信度和效度并不低于其他心理测验。RIM与范围广泛的外显行为指标都有一定程度的相关性。但RIM的效度随效标的不同而有相当大的变化,如RIM对精神病的鉴别效度可达0.46,与依赖性行为的相关达0.37,而对抑郁症的鉴别效度只有0.12。这说明在不同条件下RIM的效度很不一致,但这不是RIM独有的问题,其他测验如MMPI、WAIS等也存在同样的问题。因此,至少从已发表的研究中能证明RIM是有效的。我们建议临床心理学工作者使用RIM。
在整个心理测验领域,投射测验所面临的批评要多于客观类人格测验,RIM也不例外。但RIM是标准化程度最高的投射技术,也受到了最严格的检验。投射技术是为了克服问卷法的缺点而提出的,RIM在这方面可以说取得了相当大程度的成功。即使它本身存在问题,这些问题还不足以否定它的价值。在更有效的测量工具开发出来以前,应继续倡导这一测验技术,去研究复杂的人类心理现象。应特别强调的是,RIM是一个复杂的测量技术,在使用时必须遵守科学的原则,但经验和技巧也起着非常重要的作用。
我国老一辈测量学家龚耀先先生在1980年代就对RIM进行了标准化工作,龚先生及其合作者发现精神分裂症患者有许多与思维障碍有关的特殊回答,感知精确性显著低于正常人,较少自我关注,因此使用RIM有助于精神分裂症的诊断和鉴别。以后又有学者研究精神病患者的攻击性反应和客体关系等,但与国外相比,国内的研究还很薄弱。在心理健康问题越来越受到重视的今天,心理学和精神医学工作者应该大力加强对包括RIM在内的投射技术的研究。
相关热词搜索:墨迹 争论 近期 罗夏墨迹技术的近期发展与争论 罗夏墨迹技术的构念效度 罗夏墨迹图及分析
热点文章阅读