2012年3月1日,星期四

行动计划101简介#12:使用IQ部件分数作为SLD和MR / ID 诊断中一般智力的指标

   
           历史上的概念 一般情报(g ), 由全球情报测试电池组负责 全尺寸 智商得分对于具有以下特征的个体的定义和分类至关重要 特殊学习障碍(SLD) 以及具有 智障(ID)。  最近,当代的定义和操作标准提高了智能测试能力 综合 要么 部分分数 在SLD的诊断和分类中扮演更重要的角色,而在ID中则更重要。
            In 的 case of SLD, 第三方法 一致性 定义在(a)识别 一致性 低成就与相关的认知能力或加工障碍之间的关系;(b)个人必须表现出相对的认知和成就优势的要求(请参见 菲拉内罗弗拉纳根& Ortiz, 2010 )。  在第三种方法SLD方法中,没有强调全局IQ分数。
            In contrast, 的 11 版本 协会智障:定义,分类和支持系统 手册(AAIDD,2010年)将通用情报和全球综合智商得分作为对以下方面的定义的核心 智力功能. 这并非没有挑战。 例如,AAIDD ID 定义具有 被批评 因为过分依赖通用情报的构建,而忽略了当代心理学计量学理论和实证研究,这些研究已经集中在多维的智力层次模型上(即, 卡特尔(Cattell-Horn-Carroll)或CHC理论 )。
潜在的限制“作为一般智能障碍的ID”定义是由 智障残疾人确定委员会,在 国家研究委员会 报告“智力低下: 确定获得社会保障福利的资格” (Reschly, Meyers & Hartel, 2001). 这个国家专家委员会的结论是“在接下来的十年中,可能会更进一步地调整智力测验以及从中得出的IQ分数以及Horn-Cattell和Carroll模型。 结果,未来几乎可以肯定会更多地依赖零件分数,例如 GC Gf ,以及传统的复合IQ。 也就是说,传统的综合智商可能不会下降,但是与过去相比,将会更加重视零件得分”(Reschly et al。,2002,p.94)。 委员会指出“每当质疑一个或多个部分分数(子测试,量表)的有效性时,检查员还必须质疑该测试是否’的总分适合指导诊断决策。 总考试成绩通常被认为是客户的最佳估计’的整体智力功能。 但是,在某些情况下,总的测试成绩可能并不能完全代表整体认知功能,这对于某些人以及对他们而言都是如此。” (p. 106-107).
           在SLD和ID诊断和分类中,对智能测试电池复合零件评分的日益重视引起了许多测量和概念问题(Reschly等,2002)。 例如,统计学上的显着差异是什么? 有什么有意义的区别? 当质疑整体智商时,哪些适当的认知能力应作为一般智力的代理? 总测验分数应为多少? 
适当的认知能力 只会是这里讨论的唯一问题。 这个问题解决 哪个组件或零件的分数与一般智力更相关(g)—也就是说,组成部分的分数很高 g装载机? 传统的共识是 GC (结晶的智力;理解知识) Gf (流体情报或推理) 是最高的 g负荷措施和构造,并且在诊断ID时最有可能成为身份提升的候选人(Reschly等,2002)。 尽管并非总是明确说明,但第三种方法一致性SLD定义指定个人必须证明“至少具有一般认知能力或智力的平均水平”(Flanagan et al。,2010,p.745),这是一个隐含地暗示认知能力和成分得分较高的陈述。 g-ness。
表1旨在为在SLD和ID的诊断和分类中使用零部件评分提供指导(单击图像放大并使用浏览器缩放功能) 查看;建议你 点击这里 来访问表格的PDF副本。并对其进行放大)。 表1总结了具有令人满意的心理测量特征(即国家规范样本,复合材料足够的信度和效度)的,全面的,国家规范的,单独管理的情报电池 g-得分了)用于ID和SLD的诊断。



综合 g-得分了 列列出了每个情报电池提供的全球一般情报得分。 这个分数是一个人的最佳估计的一般智力,目前与AAIDD的ID诊断最相关。  All 综合 g表1中列出的-scores满足 詹森s(1998) 心理测量误差 标准作为一般智力的有效估计。  As per 詹森s 测试次数 标准,所有智能电池 g-复合材料基于 最少九个 测试样本 至少三个 主要认知能力领域。  As per 詹森s 各种测试 标准(即各种心理操作的信息内容,技能和要求),从CHC理论的角度来看,电池在能力域覆盖范围上会有所不同四个(CAS,SB5),五个(KABC-II,WISC-IV,WAIS-IV),六个(DAS-II)和七个(WJ III)(奥尔蒂斯Flanagan& Alfonso, 2007; 基思& Reynolds, 2010 )。   根据詹森(Jensen,1998)的建议, 用于估计的特定测试集合 g 应该以尽可能少的测试数量尽可能接近地成为所有类型的心理测试的代表样本,并且应该尽可能平均地代表各种测试 (第85页)。 用户应咨询以下来源 Flanagan等。 (2007年)基思和雷诺兹,2010年) 确定每个智能电池如何近似詹森的最佳设计标准,测量的特定CHC域以及每个电池组合中CHC域的比例表示 g-得分了。
表1中还包括每个电池提供的组成部分的比例(例如,WAIS-IV语言理解指数,感知推理指数,工作记忆指数和处理速度指数),其后分别是 -电池 g-加载。[1]  Examination of 的 g现有电池的综合得分的高低(请参阅表1的最后三列)表明了传统的假设,即 Gf GC 是通用情报的最佳代理 掌握所有情报电池.[2] 
在SB5的情况下,所有五个复合零件得分在 g-装载(h2 = .72至.79)。 没有一个SB5复合零件得分比其他SB5得分更好地暗示了一般的一般智力(当不使用整体IQ得分时)。 另一个极端是WJ III,其中流体推理,理解知识,长期存储和检索聚类得分最高 g-WJ III中基于部分得分的解释的代理。 WJ III视觉处理和处理速度群集不是复合零件评分,应该强调其为一般智能的指标。 在所有包含处理速度组件分数的电池(DAS-II,WAIS-IV,WISC-IV,WJ III)中,各自的处理速度量表始终是通用情报的最薄弱的代表,因此不会被视为良好的智能产品。一般情报估计。 
           同样清楚的是,不能假设测得能力的相似名称的合成物应具有相似的相对 g-不同电池内的状态。  For example, 的 Gv 达斯-II(空间能力),SB5(视觉空间处理)中的(视觉空间或视觉处理)集群相对较强 g-在各自的电池中进行测量,但对于WJ III视觉处理集群则不能说相同的方法。 更有趣的是WAIS-IV和WISC-IV相对值的差异 g-加载类似听起来不错的索引分数。 
例如,工作记忆指数最高 gWAIS-IV中的加载组件分数(与感知推理指数并列),但在WISC-IV中仅排名第三(四分之三)。  工作内存索引由WAIS-IV中的数字跨度和算术子测试以及WISC-IV中的数字跨度和字母序号子测试组成。 据报道,算术子测试是阶乘复杂的测试,可能会利用流体智能( Gf -RQ—定量推理),定量知识( Gq ),工作记忆(GSM ),以及可能的处理速度( s ;基思& Reynolds, 2010; 菲尔普斯,麦格鲁,诺皮克& Ford, 2005 )。    算术子测试的阶乘复杂特性(实质上使它的功能像迷你算子一样,g 代理)将解释为什么WAIS-IV工作内存指数是一个很好的代理 g 在WAIS-IV中,但不在WISC-IV中。 WAIS-IV和WISC-IV工作记忆指数量表尽管命名相同,但是 测量相同的结构。

A 严重警告 是那个 g无法比较不同电池的负载。  g当分析中包含的各种措施的组合发生变化时,载荷可能会发生变化。 不同的“风味” g 可能导致(Carroll,1993; 詹森,1998)。比较的唯一方法 g电池的极性经过适当设计 交叉或联合电池 分析(例如,在普通样品中分析的WAIS-IV,SB5和WJ III)。
上面和下面的智能电池示例说明,那些使用组成部分分数作为人的估计的人’的一般智力必须了解其组成和心理测验 g-每个智能电池内组件的得分得分。 并非所有不同智能电池中的所有零部件得分都是相同的(关于 g-ness)。 同样,并非所有类似命名的基于因子的综合评分都可能测量相同的相同结构,并且电池内部的度数可能会有所不同 G- 内斯。 对于因子分析中的因子命名,以及基于因子的智力测验综合评分,这并不是一个新问题。 悬崖(1983) 描述了这个 名义上的谬误 用简单的语言—“如果我们命名某事,这并不意味着我们了解它” (p. 120). 




[1] 如表1的脚注所示,所有综合得分 g凯文·麦格鲁(Kevin McGrew)通过在每本智能电池技术手册(请注意WJ III的例外情况)中输入已发布的相关矩阵的最小数量(涵盖的最大年龄范围)来计算负载(以获得WJ III的例外) g负荷估算。 对于每个智能电池,可以为每个年龄区分的相关矩阵计算和报告这些值。 但是,此表的目的是提供尽可能最佳的 平均 在每个智能电池的整个寿命范围内的价值。 弗洛伊德(Floyd)和同事发表了年龄差异的文章 g达斯-II和WJ III的装载。 这些值未使用,因为它们基于 主要公因子 分析方法, 分析测试之间的可靠共享方差。 尽管主要因素和 主成分 通常,载荷将在相同的相对位置订购量度,主因数载荷通常会较低。 鉴于不完善的清单综合量表分数是在实践中使用的分数,因此也可以使计算 g表1中报告的载荷在这项工作中使用了主成分分析。同样的理由用于不使用较高阶的潜在因子负荷 g每个测试电池的SEM / 终审法院分析中的因素。 CFA分析得出的负荷代表了基础理论能力结构与 g 清除测量错误。 此外,电池技术手册(或独立的期刊文章)中报告的最终CFA解决方案通常会使测试变得相当复杂(加载多个潜在因子),这种测量模型与清单/观察实践中使用的综合评分。 高阶潜在因子加载 g因子通常会基于清单指标而与主成分负载有很大不同,无论是绝对大小还是相对大小(例如, 正在加载 g 在WJ III技术手册中,这与清单变量基于 表1中报告的负载) 
[2]h2 值是用于比较相对数量的值 g-每个智能电池中组成部分中存在的方差得分。

没意见: