显示带有标签的帖子 SB5. 显示所有帖子
显示带有标签的帖子 SB5. 显示所有帖子

2013年5月20日,星期一

斯坦福·比内特 5个发布资源:13-5-20

这是几年前发布的帖子的更新...带有新信息

斯坦福·比内特 5评估服务公告(信息来自 河滨出版网页)


2012年3月1日,星期四

行动计划101简介#12:使用IQ部件分数作为SLD和MR / ID诊断中一般智力的指标

   
           历史上的概念 一般情报(g), 由全球情报测试电池组负责 全尺寸 智商得分对于具有以下特征的个体的定义和分类至关重要 特殊学习障碍(SLD) 以及具有 智障(ID)。  最近,当代的定义和操作标准提高了智能测试能力 综合 要么 部分分数 在SLD的诊断和分类中扮演更重要的角色,而在ID中则更重要。
            In 的 case of SLD, 第三方法 一致性 定义在(a)识别 一致性 低成就与相关的认知能力或加工障碍之间的关系;(b)个人必须表现出相对的认知和成就优势的要求(请参见 菲拉内罗弗拉纳根& Ortiz, 2010)。 在第三种方法SLD方法中,没有强调全局IQ分数。
            In contrast, 的 11 版本 协会智障:定义,分类和支持系统 手册(AAIDD,2010年)将通用情报和全球综合智商得分作为对以下方面的定义的核心 智力功能. 这并非没有挑战。 例如,AAIDD ID定义具有 被批评 因为过分依赖通用情报的构建,而忽略了当代心理学计量学理论和实证研究,这些研究已经集中在多维的智力层次模型上(即, 卡特尔(Cattell-Horn-Carroll)或CHC理论)。
潜在的限制“作为一般智能障碍的ID”定义是由 智障残疾人确定委员会,在 国家研究委员会 报告“智力低下: 确定获得社会保障福利的资格” (Reschly, Meyers & Hartel, 2001). 这个国家专家委员会的结论是“during 的 next decade, even greater alignment of 情报 tests 和 的 智商分数 derived from 的m 和 的 喇叭-Cattell 和 Carroll 楷模 is likely. 结果,未来几乎可以肯定会更多地依赖零件分数,例如 GC Gf,以及传统的复合IQ。 也就是说,传统的综合智商可能不会下降,但是与过去相比,将会更加重视零件得分”(Reschly et al。,2002,p.94)。 委员会指出 “每当质疑一个或多个部分分数(子测试,量表)的有效性时,检查员还必须质疑该测试是否’的总分适合指导诊断决策。 总考试成绩通常被认为是客户的最佳估计’的整体智力功能。 但是,在某些情况下,总的测试成绩可能并不能完全代表整体认知功能,这对于某些人以及对他们而言都是如此。” (p. 106-107).
           在SLD和ID诊断和分类中,对智能测试电池复合零件分数的日益重视,提出了许多测量和概念问题(Reschly等,2002)。 例如,统计学上的显着差异是什么? 有什么有意义的区别? 当质疑整体智商时,哪些适当的认知能力应作为一般智力的代理? 总测验分数应为多少? 
适当的认知能力 只会是这里讨论的唯一问题。 这个问题解决 哪个组件或零件的分数与一般智力更相关(g)—也就是说,组成部分的分数很高 g装载机? 传统的共识是 GC (结晶的智力;理解知识)Gf (流体情报或推理) 是最高的 g负荷措施和构造,并且在诊断ID时最有可能成为身份提升的候选人(Reschly等,2002)。 尽管并非总是明确说明,但第三种方法一致性SLD定义指定个人必须证明“至少具有一般认知能力或智力的平均水平”(Flanagan et al。,2010,p.745),这是一个隐含地暗示认知能力和成分得分较高的陈述。 g-ness。
表1旨在为在SLD和ID的诊断和分类中使用零部件评分提供指导(单击图像放大并使用浏览器缩放功能) 查看;建议你 点击这里 来访问表格的PDF副本。并对其进行放大)。 表1总结了具有令人满意的心理测量特征(即国家规范样本,复合材料足够的信度和效度)的,全面的,国家规范的,单独管理的情报电池 g-得分)用于ID和SLD的诊断。



综合 g-得分 列列出了每个情报电池提供的全球一般情报得分。 这个分数是一个人的最佳估计的一般智力,目前与AAIDD的ID诊断最相关。  All 综合 g表1中列出的-scores满足 詹森s(1998) 心理测量误差 标准作为一般智力的有效估计。  As per 詹森s 测试次数 标准,所有智能电池 g-复合材料基于 最少九个 测试样本 至少三个 主要认知能力领域。  As per 詹森s 各种测试 标准(即各种心理操作的信息内容,技能和要求),从CHC理论的角度来看,电池在能力域覆盖范围上会有所不同四个(CAS,SB5),五个(KABC-II,WISC-IV,WAIS-IV),六个(DAS-II)和七个(WJ III)(奥尔蒂斯Flanagan& Alfonso, 2007; 基思& Reynolds, 2010)。  根据詹森(Jensen,1998)的建议, 用于估计的特定测试集合 g 应该以尽可能少的测试数量尽可能接近地成为所有类型的心理测试的代表样本,并且应该尽可能平均地代表各种测试 (第85页)。 用户应咨询以下来源 Flanagan等。 (2007年)基思和雷诺兹,2010年) 确定每个智能电池如何近似詹森的最佳设计标准,测量的特定CHC域以及每个电池组合中CHC域的比例表示 g-得分。
表1中还包括每个电池提供的组成部分的比例(例如,WAIS-IV口头理解指数,感知推理指数,工作记忆指数和处理速度指数),其后分别是它们 -电池 g-加载。[1]  Examination of 的 g现有电池的综合得分的高低(请参阅表1的最后三列)表明了传统的假设,即 GfGC 是通用情报的最佳代理 掌握所有情报电池.[2] 
在SB5的情况下,所有五个复合零件分数在 g-装载(h2 = .72至.79)。 没有一个SB5复合零件得分比其他SB5得分更好地暗示了一般的一般智力(当不使用整体IQ得分时)。 另一个极端是WJ III,其中流体推理,理解知识,长期存储和检索聚类得分最高 g-WJ III中基于部分得分的解释的代理。 WJ III视觉处理和处理速度群集不是复合零件评分,应该强调其为一般智能的指标。 在所有包含处理速度组件分数的电池(DAS-II,WAIS-IV,WISC-IV,WJ III)中,各自的处理速度量表始终是通用情报的最薄弱的代表,因此不会被视为良好的智能产品。一般情报估计。 
           同样清楚的是,不能假设测得能力的相似名称的合成物应具有相似的相对 g-不同电池内的状态。  例如, Gv 达斯-II(空间能力),SB5(视觉空间处理)中的(视觉空间或视觉处理)集群相对较强 g-在各自的电池中进行测量,但对于WJ III视觉处理集群则不能说相同的方法。 更有趣的是WAIS-IV和WISC-IV相对值的差异 g-加载类似听起来不错的索引分数。 
例如,工作记忆指数最高 gWAIS-IV中的加载组件分数(与感知推理指数并列),但在WISC-IV中仅排名第三(四分之三)。  工作内存索引由WAIS-IV中的数字跨度和算术子测试以及WISC-IV中的数字跨度和字母序号子测试组成。 据报道,算术子测试是阶乘复杂的测试,可能会利用流体智能(Gf-RQ—定量推理),定量知识(Gq),工作记忆(GSM),以及可能的处理速度(s;基思& Reynolds, 2010; 菲尔普斯,麦格鲁,诺皮克& Ford, 2005)。   算术子测试的阶乘复杂特性(实质上使它的功能像迷你算子一样,g 代理)将解释为什么WAIS-IV工作内存指数是一个很好的代理 g 在WAIS-IV中,但不在WISC-IV中。 WAIS-IV和WISC-IV工作记忆指数量表尽管命名相同,但是 测量相同的结构。

A 严重警告 是那个 g无法比较不同电池的负载。  g当分析中包含的各种措施的组合发生变化时,载荷可能会发生变化。 不同的“风味” g 可能导致(Carroll,1993; 詹森,1998)。比较的唯一方法 g电池的极性经过适当设计 交叉或联合电池 分析(例如,在普通样品中分析的WAIS-IV,SB5和WJ III)。
上面和下面的智能电池示例说明,那些使用组成部分分数作为人的估计的人’的一般智力必须了解其组成和心理测验 g-每个智能电池内组件的得分得分。 并非所有不同智能电池中的所有零部件得分都是相同的(关于 g-ness)。 同样,并非所有类似命名的基于因子的综合评分都可能测量相同的相同结构,并且电池内部的度数可能会有所不同 G-内斯。 对于因子分析中的因子命名,以及基于因子的智力测验综合评分,这并不是一个新问题。 悬崖(1983) 描述了这个 名义上的谬误 用简单的语言—“如果我们命名某事,这并不意味着我们了解它” (p. 120). 




[1] 如表1的脚注所示,所有综合得分 g凯文·麦格鲁(Kevin McGrew)通过在每本智能电池技术手册(请注意WJ III的例外情况)中输入已发布的相关矩阵的最小数量(涵盖的最大年龄范围)来计算负载(以获得WJ III的例外) g负荷估算。 对于每个智能电池,可以为每个年龄区分的相关矩阵计算和报告这些值。 但是,此表的目的是提供尽可能最佳的 平均 在每个智能电池的整个寿命范围内的价值。 弗洛伊德(Floyd)和同事发表了年龄差异的文章 g达斯-II和WJ III的装载。 这些值未使用,因为它们基于 主要公因子 分析方法, 分析测试之间的可靠共享方差。 尽管主要因素和 主成分 通常,载荷将在相同的相对位置订购量度,主因数载荷通常会较低。 鉴于不完善的清单综合量表分数是在实践中使用的分数,因此也可以使计算 g表1中报告的载荷在这项工作中使用了主成分分析。同样的理由用于不使用较高阶的潜在因子负荷 g每个测试电池的SEM / 终审法院分析中的因素。 CFA分析得出的负荷代表了基础理论能力结构与 g 清除测量错误。 此外,电池技术手册(或独立的期刊文章)中报告的最终CFA解决方案通常会使测试变得相当复杂(加载多个潜在因子),这种测量模型与清单/观察实践中使用的综合评分。 高阶潜在因子加载 g因子通常会基于清单指标而与主成分负载有很大不同,无论是绝对大小还是相对大小(例如, 正在加载 g 在WJ III技术手册中,这与清单变量基于 表1中报告的负载) 
[2]h2 值是用于比较相对数量的值 g-每个智能电池中组成部分中存在的方差得分。

2011年12月27日,星期二

使用CART预测SB5学龄前智商





大车方法的有趣应用,不幸的是在行为科学中并未得到足够的重视。有关这些出色探索方法的更多信息,请参见下面的链接。

http://en.wikipedia.org/wiki/Decision_tree_learning

http://www.salford-systems.com/



通过发布 DraftCraft应用

2011年12月14日,星期三

罗伯茨和利普涅维奇"多元智能综合":CHC模型和WJ III,WISC-IV集成,SB5,KABC-III





本章是上述参考书的一部分,可通过以下链接获得:

http://www.apa.org/pubs/books/4311503.aspx










通过发布 DraftCraft应用

2011年9月17日,星期六

学位论文:学龄前人群的WJ III和SB5 智商测试的CFA




具有学龄前儿童的伍德考克-约翰逊认知能力测验(第三版)和斯坦福-比内特智力量表(第五版)的联合验证性因子分析 张梅,博士,球州立大学,2011,126页; AAT 3466801

抽象

从立法,医学/临床或专业实践的角度来看,大量证据都表明进行认知能力的综合评估(特别是在幼儿中)的优势和必要性,以识别认知缺陷,进行准确的诊断并为发展奠定基础干预和推荐服务。跨电池评估方法为学校心理学家提供了一个有用的工具,可以通过采用和比较其他电池的子测验来增强他们偏爱的认知测验,从而对个人的认知状况进行全面,理论上合理的评估,从而提高测验解释的有效性。使用联合验证性因素分析,本研究探索了伍德考克-约翰逊认知能力测试,第三版(WJ-III COG)和斯坦福-比内特智力量表,第五版(SB5)的组合基础建构效度,并采用了独立样本学龄前儿童。检查了七个模型,结果表明,相对而言,两个测试的基础结构最好由三层替代CHC模型代表,其中删除了Gf因子和子测试。这表明并非两个测试共享的所有CHC构造都能在幼儿中可靠地识别。由于发展的影响,CHC理论的建构在学前认知能力上可能有所不同。尽管WJ-III的COG和SB5整体测试结果不能为交叉电池评估提供良好的结果,但是每个电池中的某些子测试(例如代表结晶智能的子测试)为个人广泛的能力因素提供了解释性价值,为学校的心理学家深入了解学龄前儿童的结晶知识。探索性因素分析使用来自WJ-III COG和SB5的子测试进行,这些子测试代表了四个共享的广泛因素(Gc,Gf,Gv和Gsm)。结果表明,四因素解决方案是更适合数据的模型。未来的研究包括招募残疾或有特殊需求的幼儿,以探索WJ-III COG和SB5组合的最佳代表性基础结构,以便进行跨电池评估



-使用Kevin McGrew的iPad的BlogPress进行iPost

2010年12月9日,星期四

研究方向:SB5和神经心理学测试电池的因子分析

和往常一样,当我做一个 研究字节/简要 帖子,如果有人想阅读原始文章,我可以通过电子邮件与他人分享,但前提是要提供该文章,以换取有关内容的简短来宾帖子。 :)(如果有兴趣,请通过[email protected]与我联系)。另外,如果帖子中包含图形/图像,通常可以通过单击图像将它们放大。



Doweling,N.M.,Hermann,B.,LaRue,A.和Sager,M.A.(2010)。用于临床前阿尔茨海默氏病研究的神经心理学测试电池的潜在结构和因子不变性。 神经心理学,24(6)742-756。

抽象

目的:检查目前用于纵向研究的无症状中年成年人的阿尔茨海默氏病(AD)父母史的测试电池的潜在结构,并测试由选定的人口统计学变量定义的亚组中因子解的不变性已知的AD遗传危险因素。方法:对选择的24种神经心理学指标进行了探索性因素分析(EFA)和一系列确认性因素分析(CFA),以提供对临床前AD中最可能受影响的认知能力的全面评估。一旦定义了潜在的潜在模型并通过模型比较确定了结构的有效性,就可以使用多组验证性因子分析模型来测试各组之间的因子不变性。结果:EFA解决方案揭示了一个由五种结构组成的因素结构:语言能力,视觉空间能力,速度和执行功能,工作记忆以及语言学习和记忆。 终审法院模型为假设的5因子结构提供了支持。结果表明在所有检查的组中模型的因式不变性。结论:总体而言,研究结果表明在临床样本中使用符合该人群特征的因子结构具有相对较强的心理学基础。这证实了不变因素结构在旨在检测类似中年人群临床前AD最早认知特征的研究中应被证明是有用的。


Williams T.H.,McIntosh D.E.,Dixon F.,Newton J.H.和Youman E.(2010)。带有高采样率的斯坦福-比内特智能量表(第五版)的确认因素分析。学校心理学,47(10),1071-1083。

抽象

斯坦福大学–Binet智力量表,第五版(SB5),是最近发布的基于Cattell的多维智力测度–Horn–卡洛尔(CHC)理论。测试的作者在支持仪器五因子结构的技术手册中提供了验证性因子分析的结果。其他作者使用标准化样本通过EFA检查了这种因子结构,但没有发现五因子模型的证据。本研究的目的是使用高水平学生的独立样本来检查SB5的内部结构有效性。参与者包括201位高功能的三年级学生,年龄从8岁4个月至10岁11个月不等。使用矩结构分析(AMOS)分析了SB5的五个模型。我们的发现表明,分层的四因素事后模型提供了最适合数据的模型。通常,对学校心理学家的影响包括更好地了解SB5的因子结构,尤其是与高成就儿童有关的结构。还讨论了未来研究的方向


-使用我的Kevin McGrew的iPad使用BlogPress的iPost



2010年4月19日,星期一

学位论文:CHC理论-SB5和本德尔格式塔因子研究的扩展

卡特尔·洪·卡罗尔跨电池方法的结构扩展,包括视觉-电机整合的度量 布鲁克斯(Brooks),珍妮尔·哈格罗夫(Janetll Hargrove)博士,佐治亚州立大学,2009年,117页; AAT 3401596

抽象

尽管在视觉评估中包括视觉运动整合测量的长期传统,但视觉运动能力并未纳入Cattell-Horn-Carroll(CHC)认知能力理论或其互补的跨电池方法中。评定。这项研究的目的是确定视觉运动整合流行测试和智力功能测试的共享结构,并研究如何在CHC模型中对视觉运动整合测试进行分类。 Bender视觉电机格式塔测试第二版(Bender-Gestalt II; Brannigan)由3,015名年龄在5至97岁之间的参与者组成的大型规范样本 &Decker,2003年)和Stanford-Binet情报量表,第五版(SB5; Roid,2003年)。相关分析表明,在Bender-Gestalt II复制量度和SB5非语言视觉空间处理子量表之间以及Bender-Gestalt II回忆量度与SB5非语言视觉空间处理量和非语言工作记忆子量表之间的各个年龄段之间存在正相关。探索性因素分析揭示了四个年龄组的三因素模型和一个年龄组的四因素模型,表明了代表结晶能力,流体推理和视觉运动能力的因素。这项研究的结果表明,本德尔-格式塔二号测量的能力不属于SB5。因此,Bender-Gestalt II将补充诸如SB5之类的智力测试,以形成CHC视觉处理(Gv)广泛的能力因素。这些发现还满足了进一步研究的需要,以验证通过广泛使用的认知能力测试的较新版本测量的结构。

Technorati标签: , , , , , , , , , , , , , , , , , , , , , , ,

2010年1月5日,星期二

类似于Wechsler的IQ子测验的量表评分标准:滥用,误解和对人生关键决策的影响的潜力-草拟报告以寻求反馈




以下是本指南的前三段(和关键数字) 草案 行动计划应用心理计量学101简要报告(#5)。  完整的报告可以通过以下方式以PDF格式下载: 点击这里. 完整报告的网页版本可以通过以下方式找到 点击这里 (注意-网页验证可能不会显示两个嵌入的图形...。可能需要查看PDF副本)

我正在向这份初稿报告提供表达我的意图,以征求有关我的分析和逻辑的准确性和合理性的反馈和意见。 我正在寻找重要的反馈意见来改进报告。 这是一份报告草稿,如果评论建议进行重大更改,将对其进行修订。 请本着 “抛出一些关键的想法” 进行反思性分析和反馈。 反馈可以直接发送给我([email protected]),也可以以列表服务线程讨论的形式提供给我。 国家航空航天局 和/或 CHC列表服务器.


我最近一直在浏览James Flynn的新书(什么是情报: 超越弗林效应),以便更好地理解 弗林效应。我(作为一名应用测量人员)特别感兴趣的是他对跨时间的各种Wechsler量表中各个子测验分数的分析。正如大多数心理学家所知,韦氏(Wechsler)子测验的量表分数(ss)是在平均值(M)= 10和标准差(SD)= 3的量表上。子测验ss的范围是1到19。 弗林在其书的附录1中指出 "it is customary to score subtests on a scale in which 的 SD is 3, as opposed to 智商分数 which are scaled with SD set 在 15. To convert to 智商, 只是 乘 subtest gains 通过 five, as was done to get 的 智商 gains in 的 last column." 乍一看,这种说法听起来好像子测试ss向IQ SS的转换很容易(“只是 乘….”;我的重点)和数学上可以接受的程序,没有问题。但是,仔细检查后,这种转换可能会将未知的错误源引入转换后的SS分数的精度中。 这篇简短的技术文章的目的是解释进行此ss-IQ SS转换时涉及的问题。

ss 1-19刻度在Wechsler电池中具有悠久的历史。例如,在 成人智力的测量 (Wechsler,1944年),Wechsler描述了将子测验原始分数转换为新ss指标的步骤。尽管随着时间的推移,计算ss 1-19值的方法和程序变得越来越复杂,但韦氏电池在每个新修订版中都延续了这一传统。  尽管用于开发Wechsler ss 1-19量表的方法可能已经变得更加复杂,但每个子测验的最终基础量表并没有…分数仍在1-19之间(M = 10; SD = 3)。 另外,最近 斯坦福·比内特—5th Edition (SB5; Roid,2003)和 考夫曼儿童评估电池第二版 (KABC-II)各自的子测试都采用了相同的1s到19分制。

当其他现代智能电池提供具有更好测量分辨率的子测试规模度量时,为什么在某些智能电池中仍使用这种相对粗略(将在下面定义)的度量标准? 例如, 达斯-II (Elliott,2007)在T量表(M = 50; SD = 10)上放置各个测试分数,分数范围为10-90。  的 WJ III (麦格鲁&伍德考克(Woodcock,2001)将所有考试和综合分数放在与满分和综合分数(M = 100; SD = 15)相关的标准分数(SS)指标上。  要问的关键问题是“保留历史ss 1-19刻度是否有优点或缺点,或者使用具有更佳测量分辨率的单独测试刻度(DAS-II; WJ III),它们的真正优点是什么?”

......继续............
(完整的报告可在此帖子第一段的链接中找到)

[双击图像放大]





Technorati标签: , ,, , , , , , , , , , , , , , , , , , , , , , , , , ,


2009年10月28日,星期三

遵循以下标准IQ测试指导的重要性:另一个Atkins 先生 / 智商决策

另一个 阿特金斯 先生 / 智商法院的判决围绕IQ分数问题,这次是 斯坦福·比内特 V. SB5测试作者提供的誓章。 可以听口头辩论。 该决定应提醒所有心理学家有关:在进行智力测验时遵循标准化测试程序的重要性。  更多 information 在 ICDP姐姐BLOG。

Technorati标签: , , , , , , , , , , , , , ,

2005年5月16日,星期一

斯坦福·比内特 5(SB5)发布后资源:13/5/20

这是几年前发布的帖子的更新...带有新信息

斯坦福·比内特 5评估服务公告(信息来自 河滨出版网页)