统计学习 | 正态分布、测量

赋予对象以数量,对理解对象有很大的价值,本节主要关键词是测量,内容是有关正态分布和测试的。

正态分布之美
  • 统计学里有三项奇妙神奇的工具:相关系数、中心极限定理、正态分布
  • 正态曲线示意如下图所示,平均数在中间,越偏离中心,分数空间越小; 正态分布一种可能的解释为:分数落入给定区域的可能性
  • 正态曲线是联系自然万物的普遍真理,它体现了平衡和变异的思想。
正态分布表格
  • 观察如下图所示表格。各列所代表的含义如下。
    • z列指的是z分数,z分数指的是用标准差表示与平均数的距离,z分数为1.04,描述的是距离平均是1.04个标准差的分数
    • 平均数和z分数之间的比例,在平均数和一个给定分数的空间内,存在某个比例的分数,也是随机数落入所限定区域的概率。
    • 大区域中分数的比例。任意给定z分数和z为4.0之间的区域。
  • 这张表不仅可用于分数,也可用于相关系数和比例
z分数
  • 原始分数(绝对值)包含的信息没有想象得多,但可以把原始分数转换成z分数来进行处理。z分数又称为标准分数,你的四六级成绩是标准分。
  • $z=\frac{原始分数-平均数}{标准差}$,z分数的值一般介于-3至+3之间
  • z分数的生效原理可被称为常模参照,即不确定测试分数的含义,但至少可以把分数和其他人情况做对比。
  • 另外一种是标准参照,这需要知道更多关于测量的特质或内容的信息。
T分数
  • z分数有一些自己的缺点,如可以是负值;0.00是平均分;预期最高分被限制(一般是3分),这限制了它的使用范围,因而引入了T分数。
  • T分数是对z的转换,$T=z(10)+50$
  • 其他标准分数如下图所示
  • z分数其实是平均数为0,标准差是1。如果我们希望使用自己分数的平均数和标准差,用z逆转换就行。
  • 设计计分系统并构建测试时,选择常模参照计分,驱动原理是理解任务表现,因此对比某人和其他人的表现水平。选择标准参照计分,驱动原理是基于一系列标准,如知识库、一套技能、教育目标和诊断特征。
如何正确提问
  • 包含3-5个选项,且保证每个选项的信度
  • 不将”以上所有选项“和“以上选项都不是”作为选项
  • 对选项进行逻辑排序或随机排序
  • 使题干长于选项,且题干和选项语法保持一致
  • 不要使用否定词
  • 使用整句表述题干
  • 学习水平有知识、理解、应用、分析、综合、评估,出题时应选择正确的认知水平。
建立信度
  • 信度保证测试分数受随机因素影响较小。大多数信度指标基于以下相关:对测试项目做出的反应的相关、一个测试的两个分数集之间的相关、一个测试两次计分的相关。
  • 有四种常见的信度类型用来确定一个测试产生的分数是否不包含太多随机变异
    • 内部信度。在同一个测试中不同项目间是否一致?对其测试,计算分半相关,即随机分成奇数和偶数,计算相关性。公式$\alpha=\frac{n}{n-1}(\frac{SD^2-\sum{SD_{i}^2}}{SD^2})$,n代表测试项目数,SD代表测试标准差,$SD_i$表示每个项目的标准差。系数值高于0.7时是必须的,只被用来设计做重要的测试。
    • 重测信度。执行同一测试两次,每个参试者的表现是否一致?用于经过一段时间后问卷的一致性。
    • 内部评分者信度。如果两个不同的人给测试平分,参试者表现是否一致?比如高考评卷
    • 平行信度。采取不同形式执行同一个测试,参试者表现是否一致?比如几次高考前模拟考试。
0%