您的当前位置:首页正文

心理统计学考研历年真题及答案

2020-11-10 来源:榕意旅游网
考研真题和强化习题详解

第一章 绪论

一、单选题

1 .三位研究者评价人们对四种速食面品牌的喜好程度。研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。研究者乙让评定者将四种品牌分别给予 l~5 的等级评定, ( l 表示非常不喜欢, 5 表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。研究者甲、乙、丙所使用的数据类型分别是: ( )

A .类目型 ― 顺序型 ― 计数型 B .顺序型 ― 等距型 ― 类目型 C .顺序型 ― 等距型 ― 顺序型 D .顺序型 ― 等比型 ― 计数型 2 .调查了n =200 个不同年龄组的被试对手表显示的偏好程度,如下: 年龄组 30 岁或以下 30 岁以上 数字显示 90 10 偏好程度 钟面显示 40 40 不确定 10 10 该题自变量与因变量的数据类型分别是: ( ) A .类目型―顺序型 B .计数型―等比型 C .顺序型―等距型 D .顺序型―命名型 3 . 这个数的上限是( )。

A . 157 . 75 B . 157 . 65 C . 157 . 55 D . 158 . 5 4 .随机现象的数量化表示称为( )。

A .自变量 B .随机变量 C .因变量 D .相关变量

5 .实验或研究对象的全体被称之为( )。

A .总体 B .样本点 C .个体 D .元素 6 .下列数据中,哪个数据是顺序变量? ( )

A .父亲的月工资为 1300 元 B .小明的语文成绩为 80 分 C .小强 100 米跑得第 2 名 D .小红某项技能测试得 5 分 7、比较时只能进行加减运算而不能使用乘除运算的数据是【 】。 A .称名数据 B .顺序数据 C .等距数据 D .比率数据 参考答案: 1 . B 2 . D 3 . C 4 . B 5 . A 6 . C 二、概念题

1.描述统计(吉林大学 2002 研)

答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。

2.推论统计(中国政法大学 2005 研,浙大 2000研)

答:推论统计又称推断统计,指研究如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等的统计方法。常用的统计方法有:假设检验的各种方法、总体参数特征值的估计方法(又称总体参数的估计)和各种非参数的统计方法等等。 3 .假设检验(浙大2002 研)

答:假设检验指在统计学中,通过样本统计量得出的差异作出一般性结论,判

断总体参数之间是否存在差异的推论过程。假设检验是推论统计中最重要的内容,它的基本任务就是事先对总体参数或总体分布形态做出一个假设,然后利用样本信息来判断原假设是否合理,从而决定是否接受原假设。检验的推理逻辑是一定概率保证下的反证法。一般包括四个步骤: ( l )根据问题要求提出原假设 H0 ; ( 2 )寻找检验统计量,用于提取样本中的用于推断的信息,要求在 H0 成立的条件下,统计量的分布已知且不包含任何未知参数; ( 3 )由统计量的分布,计算“概率值”或确定拒绝域与接受域; ( 4 )由具体样本值计算统计量的观测值,对统计假设作出判断。若 H0 的内容涉及到总体参数,称为参数假设检验,否则为非参数检验。

第二章 统计图表

一、单选题

1 .一批数据中各个不同数值出现的次数情况是( )

A.次数分布 B.概率密度函数 C.累积概率密度函数 D.概率 2 .以下各种图形中,表示连续性资料频数分布的是( )。 A .条形图 B .圆形图 C .直方图 D .散点图

3 .特别适用于描述具有百分比结构的分类数据的统计分析图是( )。 A .散点图 B .圆形图 C .条形图 D .线形图 4 .对有联系的两列变量可以用( )表示。 A.简单次数分布表 B.相对次数分布表 C.累加次数分布表 D.双列次数分布表

5.以下各种图形中,表示间断性资料频数分布的是( )。 A .圆形图 B .直方图 C .散点图 D .线形图

6.特别适用于描述具有相关结构的分类数据的统计分析图是( )。 A .散点图 B .圆形图 C .条形图 D .线形图

7 .适用于描述某种事物在时间上的变化趋势,及一种事物随另一种事物发展变化的趋势模式,还适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系的统计分析图是( )。

A .散点图 B .圆形图 C .条形图 D .线形图

8.以下各种图形中,以图形的面积表示连续性随机变量次数分布的是【 A .圆形图 B .条形图 C .散点图 D .直方图

参考答案: 1 . A 2 . C 3 . B 4 . D 5 . A 6 . A 7 . D 二、多选题:

1 .次数分布可分为()。

A .简单次数分布 B .分组次数分布 C .相对次数分布 D .累积次数分布

2 .以下各种图形中,表示连续性资料频数分布的是( )。 A .圆形图 B .直方图 C .直条图 D .线形图 3 .累加曲线的形状大约有以下几种()。

A.正偏态分布 B.负偏态分布 C. F 分布 D.正态分布 4 .统计图按形状划分为()。

A .直方图 B .曲线图 C .圆形图 D .散点图 参考答案: 1 . ABCD 2 . BD 3 . ABD 4 . ABCD 三、简答题

1 .简述条图、直方图、圆形图(饼图)、线图以及散点图的用途。

】。 答:这几种图是统计学中最常用的图形,条图和直方图都用于表示变量各取值结果的次数或相对次数,即次数分布图。不同的是前者用于离散或分类变量,后者用于连续变量(分组后)。圆形图用于表示离散变量的相对次数,即频率,整个圆面积为 1 ,各扇形块表示各类别的频率。线图用于表示连续变量在某个分类变量各水平上的均值,如各年级的考试成绩均分,常用于组间比较中。散点图用于两连续变量的相关分析,可将两变量成对数据的值作为横、纵坐标标于图上,根据散点的形状可以大致判断两变量是否存在相关以及相关的程度。 2 .简述条形图与直方图的区别。 答:参见本章复习笔记。

第三章 集中量数

一、单选题

1 .一位教授计算了全班 20 个同学考试成绩的均值、中数和众数,发现大部分同学的考试成绩集中于高分段。下面哪句话不可能是正确的? ( ) (北大 2001年研)

A .全班 65 %的同学的考试成绩高于均值。 B .全班 65 %的同学的考试成绩高于中数。 C .全班 65 %的同学的考试成绩高于众数。 D .全班同学的考试成绩是负偏态分布。

2 .一个 N = 10 的总体,ss= 200 。其离差的和∑(x-μ)是:

A. 14 . 14 B. 200 C.数据不足,无法计算 D.以上都不对。 3 .中数在一个分布中的百分等级是( )。 A . 50 B . 75 C . 25 D . 50~51

4 .平均数是一组数据的( )。

A .平均差 B .平均误 C .平均次数 D .平均值

5 .六名考生在作文题上的得分为 12,8,9,10,13,15,其中数为( )。 A . 12 B . 11 C . 10 D . 9 6 .下列描述数据集中情况的统计量是( )。

A . M Md B. Mo Md S C. s ω σ D. M Md Mg

7 .对于下列实验数据: 1 , 108 , 11 , 8 , 5 , 6 , 8 , 8 , 7 , 11 ,描述其集中趋势用 ( )最为适宜,其值是()。

A.平均数,14 . 4 B.中数,8 . 5 C.众数, 8 D.众数,11 8 .一个 n = 10 的样本其均值是 21 。在这个样本中增添了一个分数.得到的新样本均值是 25 ,这个增添的分数值为( )。 A . 40 B . 65 C . 25 D . 21

9 .有一组数据其均值是 20 ,对其中的每一个数据都加上 10 ,那么得到的这组新数据的均值是( )。

A . 20 B . 10 C . 15 D . 30

10 .有一组数据其均值是 25 ,对其中的每一个数据都乘以 2 ,那么得到的这组新数据的均值是( )。

A . 25 B . 50 C . 27 D . 2

11 .一个有 10 个数据的样本,它们中的每一个分别与 20 相减后所得的差相加是 100 , 那么这组数据的均值是( )。 A . 20 B . 10 C . 30 D . 50

12 .下列数列 4 , 6 , 7 , 8 , 11 , 12 的中数为( )。

A . 7 . 5 B . 15 C . 7 D . 8

13 .在偏态分布中,平均数、中数、众数三者之间的关系()。 A . M=Md=Mo B . Mo=3Md-2M C . M > Md > M D . M < Md < Mo 14 .下列易受极端数据影响的统计量是( )。

A .算术平均数 B .中数 C .众数 D .四分差

15. “75~”表示某次数分布表中某一分组区间,其组距为 5 ,则该组的组中值是()。

A . 77 B . 76 . 5 C . 77 . 5 D . 76

参考答案: 1 . B 2 . D 3 . A 4 . D 5 . B 6 . D 7 . C 8 . B

9 . D 10 . B 11 . C 12 . A 13. B 14 . A

二、多选题

1 .下面属于集中量数的有()。

A .算术平均数 B .中数 C .众数 D .几何平均数 2 .平均数的优点: ( )。

A .反应灵敏 B .不受极端数据的影响 C .较少受抽样变动的影响 D .计算严密 3 .中数的优点: ( )。

A.简明易懂 B.计算简单 C.反应灵敏 D.适合进一步作代数运算 4 .众数的缺点()。

A .概念简单,容易理解 B.易爱分组影响,易爱样本变动影响 C.不能进一步作代数运算 D.反应不够灵敏 参考答案: 1 . ABCD 2 . ACD 4. BCD

三、简答题

1 .简述算术平均数的使用特点(浙大2003研,苏州大学2002 研)

答:算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。 计算公式: XXiN

式中, N 为数据个数;Xi为每一个数据;∑为相加求和。

( l )算术平均数的优点是: ① 反应灵敏; ② 严密确定,简明易懂,计算方便; ③ 适合代数运算; ④ 受抽样变动的影响较小。

( 2 )除此之外,算术平均数还有几个特殊的优点: ① 只知一组观察值的总和及总频数就可以求出算术平均数。 ② 用加权法可以求出几个平均数的总平均数。 ③ 用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。 ④ 在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。

( 3 )算术平均数的缺点: ① 易受两极端数值(极大或极小)的影响。 ② 一组数据中某个数值的大小不够确切时就无法计算其算术平均数。

2 .算术平均数和几何平均数分别适用于什么情形?(南开大学 2004 研) 答: ( l )算术平均数 ① 算术平均数的概念

算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。 ② 算术平均数的优点 a .一般优点

第一,反应灵敏;第二,严密确定,简明易懂,计算方便;第三,适合代数运算;第四,受抽样变动的影响较小。

b .特殊优点第一,只知一组观察值的总和及总频数就可以求出算术平均数;第二,用加权法可以求出几个平均数的总平均数;第三,用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值;第四,在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。

③ 缺点 a .易受两极端数值(极大或极小)的影响;b .一组数据中某个数值的大小不够确切时就无法计算其算术平均数; ④ 适用情况

第一, 数据必须是同质的,即同一种测量工具所测量的某一特质; 第二, 数据取值必须明确; 第三, 数据离散不能太大。 ( 2 )几何平均数 ① 几何平均数的概念

几何平均数是指一种由 n 个正数之乘积的 n 次根表示的平均数。在计算学校经费的增加率、平均率,学生人学率,毕业生的增加率时常用。 ② 应用

第一, 求学习、记忆的平均进步率;

第二, 求学校经费平均增加率,学生平均人学率、平均增加率,平均人口出生

率。

第四章 差异量数

一、单选题

1 .欲比较同一团体不同观测值的离散程度,最合适的指标是( )。

A .全距 B .方差 C .四分位距 D .变异系数 2 .在比较两组平均数相差较大的数据的分散程度时,宜用( )。 A .全距 B .四分差 C .离中系数 D .标准差 3 .已知平均数μ=,s=,当X= 时,其相应的标准分数为()。 A . B. C . D .

4 .求数据 16 , 18 , 20 , 22 , 17 的平均差( )。 A . B . C . D . 5

5 .测得某班学生的物理成绩(平均 78 分)和英语成绩(平均 70 分),若要比较两者的离中趋势,应计算( )。

A .方差 B .标准差 C .四分差 D .差异系数

6.某学生某次数学测验的标准分为 ,这说明全班同学中成绩在他以下的人数百分比是( ) ,如果是 ,则全班同学中成绩在他以上的人数百分比是()。 A . 99 % , 99 % B . 99 % , l % C . 95 % , 99 % D . 95 % , 95 % 7.已知一组数据6 , 5 , 7 , 4 , 6 , 8 的标准差是 ,把这组中的每一个数据都加上 5 ,然后再乘以 2 ,那么得到的新数据组的标准差是( )。 A . 1 . 29 B . 6 . 29 C . 2 . 58 D . 12 . 58

8 .标准分数是以( )为单位表示一个分数在团体中所处位置的相对位置量数。 A .方差 B .标准差 C .百分位差 D .平均差 9 .在一组原始数据中,各个Z 分数的标准差为( )。 A . 1 B . 0 C .根据具体数据而定 D .无法确定

10 .已知某小学一年级学生的平均体重为 26kg ,体重的标准差是 ,平均身高 110cm ,标准差为 ,问体重与身高的离散程度哪个大( ) ?

A.体重离散程度大 B.身高离散程度大 C.离散程度一样 D.无法比较 1 1.已知一组数据服从正态分布,平均数为 80 ,标准差为10 。 Z 值为的原始数据是( )。

A . 99 . 6 B . 81 . 96 C . 60 . 4 D . 78 . 04

12 .某次英语考试的标准差为 分,考虑到这次考试的题目太难,评分时给每位应试者都加了 10 分,加分后成绩的标准差是( )。 A . 10 B . C . D .

13 .某城市调查 8 岁儿童的身高情况,所用单位为厘米,根据这批数据计算得出的差异系数( )。

A .单位是厘米 B .单位是米 C .单位是平方厘米 D .无单位 参考答案: 1 . D 2 . D 3 . B 4 . B 5 . D 6 . A 7 . C 8 . B 9. A

10 . A 11 . C 12 . D 13 . D

二、多选题

1 .平均差的优点()。

A .平均差意义明确,计算容易 B .较好的代表了数据分布的离散程度 C .反应灵敏 D .有利于进一步做统计分析 2 .常见的差异量数有()。

A .平均差 B .方差 C .百分位数 D .几何平均数 3 .标准分数的优点()。

A .可比性 B .可加性 C .明确性 D .稳定性 参考答案: 1 . ABC 2 . ABC 3 . ABCD

三、概念题

1 .差异系数(浙大 2003 研)

答:差异系数( coefficient of variation ) ,又称变异系数、相对标准差等,它是一种相对差异量,用 CV 来表示,为标准差与平均数的百分比。在对不同样本的观测结果的离散程度进行比较时,常常遇到下述情况:两个或多个样本所测的特质不同。如何比较其离散程度?即使使用的是同一种观测工具,但样本的水平相差较大时,如何比较它们的离散程度?这时需要运用相对差异量进行比较。差异系数的计算公式是:CV100%(S为某样本的标准差, M为该样本的平均数)。差异系数在心理与教育研究中常常应用于同一对象的不同领域或同一领域的不同对象。

2 .四分差(中科院 2004 研)

答:四分差又称四分位差,是差异量数的一种。计算公式: QDQ3Q1。Q3:2SV第三个四分位数,Q1:第一个四分位数。在次数分配上第一个四分位数与第三个四分位数之间包含着全体项数的一半。次数分配越集中,离中趋势越小,则这二者的距离也越小。根据这两个四分位数的关系,观测次数分配的离散程度也可以得到相当高的准确性。因此,四分差可以说明某系列数据中间部分的离散程度,并可避免两极端值的影响。四分差通常与中数联系起来共同应用,不适合进一步代数运算,反应不够灵敏。

3 .集中量数与差异量数(浙大2000研,苏州大学 2002 研)

答:集中量数与差异量数都是描述一组数据特征的统计量。集中量数是表现数据集中性质或集中程度的统计量,数据的集中情况指一组数据的中心位置;集中趋势的度量即确定一组数据的代表值,描述集中情况的度量包括:算术平均数、

中位数、众数、几何平均数、调和平均数和加权平均数等。差异量数是表现数据分散性质或分散程度的统计量,数据的差异性即为离中趋势;常见的差异量数有标准差或方差、全距、平均差、四分差和各种百分差等。 4 . T 分数(华中师大 2004 研)

答: T 分数指由正态分布上的标准分数转换而来的等距量表分数。 T 分数以 50 为平均数,以 10 为标准差。 T=50+10z。 T分数是z分数的变形,因为z分数有负值和小数,人们不习惯,所以采用这个公式处理。经过变换,所得的分数全是整数, 50分为普通, 50分以上越高越好, 50分以下越低越差。 T 分数的意义及其优点和标准分数相同,不同之处是消除了小数和分数。 5 .标准分数(华中师大 2006 研)

答:标准分数指以标准差为单位的一种差异量数,又称Z分数或基分数。它等于一数列中各原始分数与其平均数的差,再除以标准差所得的商,公式为:

Zxix/s,式中,Z为某原始数据的标准分数,Xi为原始数据的值,x为该组

数据的平均数, S为该组数据的标准差。标准分数的平均数为 0 ,标准差为 1 。标准分数是一种不受原始测量单位影响的数值,用来表示一个原始分数在团体中所处位置的相对位置量数。其作用除了能够表明原数据在其分布中的位置外,还能对未来不能直接比较的各种不同单位的数据进行比较。如比较各个学生的成绩在班级成绩中的位置或比较某个学生在两种或多种测验中所得分数的优劣。 四、计算题

1 .计算未分组数据: 18 , 18 , 20 , 21 , 19 , 25 , 24 , 27 , 22 , 25 , 26 的平均数、中位数和标准差。(首师大 2003 研)

2 .把下列分数转换成标准分数。 11 . 0 , 11 . 3 , 10 . 0 , 9 . 0 , 11 .

5 , 12 . 2 , 13 . 1 , 9 . 7 , 10 . 5 (华南师大 2003 研)

第五章 相关系数

一、单选题

1 .现有 8 名面试官对 25 名求职者的面试过程做等级评定,为了解这 8 位面试官的评价一致性程度,最适宜的统计方法是求(C)。 A . spearman相关系数 B.积差相关系数 C.肯德尔和谐系数 D.点二列相关系数 2 .下列哪个相关系数所反映的相关程度最大(D)。 A . r =+ B . r=-0. 69 C . r=+ D . r=+

3 . AB 两变量线性相关,变量A为符合正态分布的等距变量,变量B也符合正态分布且被人为划分为两个类别,计算它们的相关系数应采用( C )。 A .积差相关系数 B .点双列相关 C .二列相关 D .肯德尔和谐系数

4 .假设两变量线性相关,两变量是等距或等比的数据,但不呈正态分布,计算它们的相关系数时应选用( B )。

A. 积差相关 B.斯皮尔曼等级相关 C.二列相关 D .点二列相关

5 .假设两变量为线性关系,这两变量为等距或等比的数据且均为正态分布,计算它们的相关系数时应选用(A)。

A.积差相关 B.斯皮尔曼等级相关 C.二列相关 D.点二列相关 6 .r=的两变量与 r=+ 0 . 50 的两变量之间的关系程度(C)。

A.前者比后者更密切 B.后者比前者更密切 C.相同 D.不确定

7 .相关系数的取值范围是(C)。

A . r< 1 B . r≥0 C.r≤1 D . 0 8.确定变量之间是否存在相关关系及关系紧密程度的简单而又直观的方法是( D )。

A .直方图 B .圆形图 C .线性图 D .散点图

9 .积差相关是英国统计学家(B )于 20 世纪初提出的一种计算相关的方法。 A .斯皮尔曼 B .皮尔逊 C .高斯 D .高尔顿 10 .同一组学生的数学成绩与语文成绩的关系为(D)。

A .因果关系 B .共变关系 C .函数关系 D .相关关系 11 .假设两变量线性相关,一变量为正态、等距变量,另一变量为二分名义变

量,计算它们的相关系数时应选用(D)。

A .积差相关 B .二列相关 C .斯皮尔曼等级相关 D .点二列相关 12 .斯皮尔曼等级相关适用于两列具有( B )的测量数据,或总体为非正态的等距、等比数据。

A .类别 B .等级顺序 C .属性 D .等距

13 .在统计学上,相关系数 r=0 ,表示两个变量之间( A )。 A .零相关 B .正相关 C .负相关 D .无相关

14 .如果相互关联的两变量,一个增大另一个也增大,一个减小另一个也减小,变化方向一致,这叫做两变量之间有(B)。

A .负相关 B .正相关 C .完全相关 D .零相关

15 .有10名学生参加视反应时和听反应时的两项测试,经过数据的整理得到

2。 D45,这两项能力之间的等级相关系数是(A)

A . 0 . 73 B . 0 . 54 C . 0 . 65 D . 0 . 27

16 .两列正态变量,其中一列是等距或等比数据,另一列被人为地划分为多类,计算它们的相关系数应采用( B)。

A.积差相关 B.多列相关 C.斯皮尔曼等级相关 D.点二列相关 17 .下列相关系数中表示两列变量间的相关强度最小的是(B)。 A . B . C . D.

18 .一对n = 6的变量 X , Y 的方差分别为 8 和 18 ,离均差的乘积和是sp= 40,变量 X , Y 积差相关系数是( C)。

A . 0 . 05 B . 0 . 28 C . 0 . 56 D . 3 . 33

19 .有四个评委对八位歌手进行等级评价,要表示这些评价的相关程度,应选用(A)。

A .肯德尔W系数 B .肯德尔U系数 C .斯皮尔曼等级相关 D .点二列相关

20 .有四个评委对八位歌手两两配对进行等级比较,要表示这些评价的一致程度,应选用(B)。

A .肯德尔W系数 B .肯德尔U系数 C .斯皮尔曼等级相关 D .点二列相关

21 .两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型,这样的变量求相关应选用(D)。

A .肯德尔 W 系数 B .肯德尔 U 系数 C .斯皮尔曼等级相关 D .四分相关

22 .初学电脑打字时,随着练习次数增多,错误就越少,这属于(A)。

A .负相关 B.正相关 C .完全相关 D .零相关

23 .10名学生身高与体重的标准分数的乘积之和为 ,那么身高与体重的相关系数为 ( A)。

A . 0 . 82 B . 8 . 2 C . 0 . 41 D . 4 . 1

24 .有两列正态变量 X , Y ,其中sx=4,sy=2 , sx-y=3,求此两列变量的积差相关系数(B)。

A . 1 . 38 B . 0 . 69 C . 0 . 38 D . 0 . 75 25 .以下几个点二列相关系数的值,相关程度最高的是(C)。 A . B . C . D.

参考答案: 1 . C 2 . D 3 . C 4 . B 5 . A 6 . C 7 . C 8 . D 9 . B

10 . D 11 . D 13 . A 14 . B 15 . A 16 . B 17 . B 18 . C 19 . A 20 . B 21 . D 22 . A 23 . A 25 . C 二、多选题

1 .相关有以下几种(ABC)。

A .正相关 B .负相关 C .零相关 D .常相关 2 .利用离均差求积差相关系数的方法有(AB)。 A .减差法 B .加差法 C .乘差法 D .除差法 3 .相关系数的取值可以是(ABC)。 A . 0 B .-1 C . 1 D . 2 4 .计算积差相关需满足(ABCD)。

A .要求成对的数据 B .两列变量各自总体的分布都是正态

C .两相关变量都是连续变量 D .两变量之间的关系应是直线型的 5 .计算斯皮尔曼等级相关可用(BC)。

A .皮尔逊相关 B .等级差数法 C .等级序数法 D .等级评定法 6 .肯德尔 W 系数取值可以是(BCD)。 A .-1 B . 0 C . l D . 0 . 5 7 .质量相关包括(ABC)。

A .点二列相关 B .二列相关 C .多列相关 D .积差相关 8 .品质相关主要有(BCD)。

A .质量相关 B .四分相关 C .φ相关 D .列联相关 参考答案:1 . ABC 2 . AB 3 . ABC 4 . ABCD 5 . BC

6 . BCD 7 . ABC 8 . BCD

三、概念题

1 .相关系数(吉林大学 2002 研)

答:相关系数是两列变量间相关程度的指标。相关系数的取值在-1到+1 之间,常用小数表示,其正负号表示方向。如果相关系数为正,则表示正相关,两列变量的变化方向相同。如果相关系数为负值,则表示负相关,两列变量的变化方向相反。相关系数取值的大小表示相关的强弱程度。如果相关系数的绝对值在 1. 00 与 0 之间,则表示不同程度的相关。绝对值接近 端,一般为相关程度密切,接近0值端一般为关系不够密切。0相关表示两列变量无任何相关性。

2 .二列相关(中科院 2004研)

答:二列相关是两列变量质量相关的一种。适用的资料是两列变量均属于正

态分布,但其中一列变量是等距或等比的测量数据,另一列变量虽然也呈正态分布,但它被人为地划分为两类,例如:健康与不健康的划分。这种相关适用于对项目区分度指标的确定。 四、简答题

1 .简述使用积差相关系数的条件。(首师大 2004 研)

答:积差相关又较积矩相关,是求直线相关的基本方法。积差相关系数适合的情况如下:(l)两列数据都是测量数据,而且两列变量各自总体的分布是正态的,即正态双变量。为了判断计算相关的两列变量其总体是否为正态分布,一般要根据已有的研究资料进行查询。如果没有资料查询,研究者应取较大样本分别对两变量作正态性检验。这里只要求保证双变量总体为正态分布,而对要计算相关系数的两样本的观测数据并不一定要求正态分布。(2)两列变量之间的关系应是直线性的。如果是非直线性的双列变量,不能计算线性相关。判断两列变量之间的相关是否直线式,可以作相关散布图进行线性分析。相关散布图是以两列变量中的一列变量为横坐标,以另一变量为纵坐标,画散点图。如果呈椭圆形则说明两列变量是线性相关的,如果散点是弯月状(无论弯曲度大小或方向),说明两变量之间呈非线性关系。(3)实际测验中,计算信度涉及的积差相关时,分半的两部分测验须满足在平均数、标准差、分布形态、测题间相关、内容、形式和题数都相似的假设条件。另外,积差相关要求成对的数据,即若干个体中每个个体都有两种不同的观测值。任意两个个体之间的观测值不能求相关。每对数据与其他对数据相互独立。计算相关的成对数据的数目不少于 30 对,否则数据太少而缺乏代表性。

2 .哪些测量和统计的原因会导致两个变量之间的相关程度被低估。(北师大

2004 研)

答:影响两个变量之间的相关程度被低估的原因有:(1)测量原因:测量方法的选择、两个变量测验材料的选择和收集、测量工具的精确性、测量中出现的误差、测验中主试和被试效应、测量的信度和效度、测验分数的解释等。(2)统计原因:全距限制,指相关系数的计算要求每个变量内各个分数之间必须有足够大的差异,数值之间必须有显著的分布跨度或变异性,所以全距限制问题会导致低相关现象;没有满足计算相关系数的前提假设也会低估相关系数,比如用皮尔逊相关计算非线性关系的两个变量间的相关系数。

3 .如果你不知道两个变量概念之间的关系,只知道这两个变量的相关系数很高,请问你可能做出什么样的解释?(武汉大学 2004 研)

答: ( l )两个变量之间的相关系数很高说明两变量存在共变关系,还不能判断两个变量之间的具体关系。 (2)根据相关系数的性质,系数值的大小只是表示变量变化趋势(0≦r≦1)。如果相关系数为 0 ,则两个变量变化的方向没有关系;如果相关系数为正,则说明两个变量是同一个变化方向,比如:人的身高和体重就常常是一个变化方向,即身高增加,体重也增加;如果相关系数为负值,则说明两个变量变化方向相反,值的大小说明程度。比如:某研究中胆固醇水平与青少年青春期身高增长负相关,即胆固醇水平高的同时,青少年青春期身高增长反而在减慢。 (3)两个变量之间的相关性只是显示出变量的变化趋势,并不能显示出两个变量的因果关系。如果相关系数很高,还需要考察是正相关还是负相关,这样来说明两个变量究竟是向同一个方向还是相反方向变化。

4 .一个变量的两个水平间的相关很高,是否说明两水平的均数间没有差异呢?

为什么?举例说明。(中山大学 2004 研)

答:不能说明两水平的均数间没有差异。(l)相关关系是指两类现象在发展变化的方向与大小方面存在一定的关系,但不能确定两类现象之间哪个是因,哪个是果。相关的情况可以有三种:一种是两列变量变动方向相同,即一种变量变动时,另一种变量也同时发生或大或小与前一种变量同方向的变动,称为正相关。如身高与体重的关系。第二种相关情况是负相关,这时两列变量中若有一列变量变动时,另一列变量呈或大或小但与前一列变量指向相反的变动。例如初打字时练习次数越多,出现错误的量就越少。第三种相关是零相关,即两列变量之间无关系。比如学习成绩与身高的关系。(2)当一个变量的两个水平的相关很高时,需要考虑这种相关是正相关还是负相关,即考虑其变化发展的方向。(3)当一个自变量的两个水平的相关很高时,不能说明两个水平的均数之间没有差异。因为两组变量的相关系数大小只是表明两组的线性关系强弱。即使两组变量成完全正相关,即相关系数为+1 ,也不能说明两组变量的平均数没有差异。比如两组变量的对应关系为 ( 1 , 2 ) , ( 2 , 3 ) , ( 3 , 4 ) … … 。即 y =x + 1 。这时两组变量的相关系数为+1 ,而两组变量的均数是不同的。因为这是在同一个变量的不同水平,而且缺乏足够的信息分析。如果要知道这两个水平均数之间是否有差异,可以采用 t 检验等方法获得。 5 .简述积差相关系数和等级相关系数间的区别。

答:两种相关分析法都是常用的相关系数计算方法,区别是:(l)积差相关系数用于正态等距或等比数据,对数据的要求比较高,结果也比较精确。(2)当无法确定数据是否服从正态,或者数据是等级数据时,使用斯皮尔曼等级相关系数。因此斯皮尔曼等级相关系数的应用范围较广,但结果精确性相对低一

些。(3)等级相关中的肯德尔W系数可用于评定多列数据的相关性。 五、计算题

1 . 4名教师各自评阅相同的5篇作文,下表为每位教师给每篇作文的等级,试计算肯德尔 W 系数。(首师大 2003 研) 教师对学生作文的评分

评分者 作文 1 一 二 三 四 五 3 5 2 4 1 2i2 3 5 2 4 1 602866146,N=5,K=4

53 3 4 1 5 2 4 3 5 1 4 2 R解:由题,sRiNWs123KNN121460.91 160答:肯德尔和谐系数为 0 . 91 。

2 .五位教师对甲乙丙三篇作文分别排定名次如下表: 教师序号 1 2 3 甲 3 3 3 乙 1 2 1 名次 丙 2 1 2 4 5 1 1 3 3 2 2 请对上述数据进行相应的统计分析。(华东师大2003 研)

解:(l)一般把测验分数和评价看成正态分布,用Z分数转换。化评定结果为测量数据,需要查统计表。(2)由于是名次排列,属于评定等级,可以考虑用求等级相关分析的方法(非参数检验双向等级相关)。

Xr212R23nk1 因此,由题得 n=5,k=3 nkk1Xr212331111110109935310.4 5查附表: n = 5 Xr20.4对应P= ,其概率远远大于 0 . 05 ,所以三种情况的差异不显著。

(3)可以求一下老师评分之间的肯德尔ω系数

Ws123KNN12R sRii2N

因此,由题得 n = 3(被评定对象数目),k=5(评定对象的数目)(此处n,k的含义与双向方差分析不同)S= = 9 . 6

W9.6123533120.192,所以三位老师之间的评价没有一致性。

第六章 概率分布

一、单选题

1 .在人格测验上的分数形成正态分布μ=80,σ=12,一个随机样本n=16,其均值大于 85 的概率是( B )。

A . % B . 4 . 78 % C . 5 . 31 % D . 6 . 44 %

2 .让 64 位大学生品尝 A 、 B 两种品牌的可乐并选择一种自己比较喜欢的。如果这两种品牌的可乐味道实际没有任何区别,有 39 人或 39 人以上选择品牌 B 的概率是(不查表) ( B)。

A . 2 . 28 % B . 4 . 01 % C . 5 . 21 % D . 39 . 06 % 3 .某个单峰分布的众数为15,均值是10 ,这个分布应该是(C)。 A .正态分布 B .正偏态分布 C .负偏态分布 D .无法确定 4 .一个单项选择有 48 道题,每题有四个备选项,用α= 单侧检验标准,至少应对多少题成绩显著优于单凭猜测( B )。

A . 16 题 B . 17 题 C . 18 题 D . 19 题

5 .在一个二选一的实验中,被试在 12 次中挑对 10 次, Z 值等于(B )。 A . 4 . 05 B . 2 . 31 C . 1 . 33 D . 2 . 02

6 .某班 200 人的考试成绩呈正态分布,其平均数=12 , S=4 分,成绩在 8 分和 16分之间的人数占全部人数的( B )。

A . 34 . 13 % B . 68 . 26 % C . 90 % D . 95 %

7 .在一个二择一实验中,被试挑 12 次,结果他挑对10次,那么在 z=( X-M)/5 这个公式中 X 应为(B)。

A . 12 B . 10 C . D .

8 .在处理两类刺激实验结果时,在下列哪种情况下不可以用正态分布来表示二项分布的近似值? ( A)。

A . N < 10 B . N > = 10 C . N > 30 D . N > 10

9 . t 分布是关于平均值的对称的分布,当样本容量 n 趋于∞时,t分布为( B )。

A .二项分布 B 正态分布 C . F 分布 D .χ2分布

10 .概率和统计学中,把随机事件发生的可能性大小称作随机事件发生的(A )。 A .概率 B .频率 C .频数 D .相对频数

11 .在一次试验中,若事件 B 的发生不受事件 A 发生的影响,则称 AB 两事件为(D)。

A .不影响事件 B .相容事件 C .不相容事件 D .独立事件 12 .正态分布由(C)于 1733 年发现的。

A .高斯 B .拉普拉斯 C .莫弗 D .高赛特 13 .在正态分布下,平均数上下个标准差,包括总面积的(B)。 A . 68 . 26 % B . 95 % C . 99 % D . 34 . 13 %

14 .在次数分布中,曲线的右侧部分偏长,左侧偏短,这种分布形态可能是(B)。 A .正态分布 B .正偏态分布 C .负偏态分布 D .常态分布 15 .一个硬币掷 10 次,其中 5 次正面向上的概率是(A)。 A . 0 . 25 B . 0 . 5 C . 0 . 2 D . 0 . 4 16 . t 分布是由(D )推导出来的。

A .高斯 B .拉普拉斯 C .莫弗 D .高赛特

17 .一个硬币掷 3 次,出现两次或两次以上正面向上的概率为(B)。 A . 1/8 B . 1/2 C . 1/4 D . 3/8

18 .有十道正误题,答题者答对( D)题才能认为是真会? A . 5 B . 6 C . 7 D . 8

19 .有十道多项选择题,每题有 5 个答案,其中只有一个是正确的,那么答对(B ) 题才能说不是猜测的结果?

A . 4 B . 5 C . 6 D . 7 20 .正态分布的对称轴是过(A)点垂线。

A .平均数 B .众数 C .中数 D .无法确定 21 .在正态分布下 Z=1 以上的概率是(B)。

A . 0 . 34 B . 0 . 16 C . 0 . 68 D . 0 . 32 22 .在正态下 Z=到 Z=之间的概率为(B)。

A . 0 . 475 B . 0 . 95 C . 0 . 525 D . 0 . 05

23 .从 n=200 的学生样本中随机抽样,已知女生为 132 人,问每次抽取 1 人,抽到男生的概率是(B)。

A . 0 . 66 B . 0 . 34 C . 0 . 33 D . 0 . 17 24 .两个骰子掷一次,出现两个相同点数的概率是(A)。 A . B . C . D .

25 .如果由某一次数分布计算得SK > 0 ,则该次数分布为(D)。 A .高狭峰分布 B .低阔峰分布 C .负偏态分布 D .正偏态分布 26 .在正态总体中随机抽取样本,若总体方差σ2已知,则样本平均数的分布为(C)。

A . t 分布 B . F 分布 C .正态分布 D .χ2分布

27 .从正态总体中随机抽取样本,若总体方差σ2未知,则样本平均数的分布为(C)。

A .正态分布 B .χ2分布 C . t 分布 D . F 分布 28 .下面各组分布中,不因样本容量的变化而变化的分布是(A)。 A .正态分布 B . t分布 C .χ2分布 D . F 分布

29 . t 分布是关于平均值 0 对称的分布,当样本容量 n 趋于∞时,,分布为(A)。

A .正态分布 B . t 分布 C .χ2分布 D . F 分布

30 .总体呈正态分布,方差已知时,样本平均数分布的方差与总体方差间的关系为(A)。 A. 2X2n B. 2X2n2 C. Xn2 D. Xn

31 . F 分布是一个正偏态分布,其分布曲线的形式随分子、分母自由度的增加而(D)。

A.渐近χ2分布 B.渐近二项分布 C.渐近t分布 D.渐近正态分布 32 .设A、B为两个独立事件,则P(A·B)为(C)。

A . P ( A ) B . P ( B ) C . P (A)·P(B) D . P (A) + P(B) 33 .样本容量均影响分布曲线形态的是(B)。 A .正态分布和 F分布 B .F分布和 T 分布 C.正态分布和 T 分布 D .正态分布和χ2分布 34 .正态曲线与 x 轴所围成区域的面积为(C)。 A . 0 . 5 B . 0 . 99 C . 1 D . 0 . 95 35 .对随机现象的一次观察为一次(B)。 A .随机实验 B .随机试验 C .教育与心理实验 D .教育与心理试验

36 .如果由某一次数分布计算得 SK = 0 ,则该次数分布为(A)。 A .对称分布 B .正偏态分布 C .负偏态分布 D .低阔峰分布 37 . t 分布比标准正态分布(D)。

A.中心位置左移,但分布曲线相同 B.中心位置右移,但分布曲线相同 C.中心位置不变,但分布曲线峰高

D.中心位置不变,但分布曲线峰低,两侧较伸展 38 .一批数据中各个不同数值出现的次数情况是(D)。

A.次数分布 B.概率密度函数 C.累积概率密度函数 D.概率 参考答案: 1 . B 2 . B 3 . C 4 . B 5 . B 6 . B 7 . B 8 . A 9 . B 10 . A

11 . D 12 . C 13 . B 14 . B 15 . A 16 . D 17 . B 18 . D 19 . B 20 . A

21 . B 22 . B 23 . B 24 . A 25 . D 26 . C 27 . C 28 . A 29 . A 30 . A

31 . D 32 . C 33 . B 34 . C 35 . B 36 . A 37 . D 38 . D 二、多选题

1 .依分布函数的来源,可把概率分布划分为(CD)。

A .离散分布 B .连续分布 C .经验分布 D .理论分布 2 .使用正态分布表,可以进行的计算有(ABCD)。 A .根据 Z 分数求概率 B .根据概率求 Z 分数 C .根据概率求概率密度 D .根据 Z 值求概率密度 3 .检验次数分布是否正态的方法有(ABCD)。 A .皮尔逊偏态量数法 B .累加次数曲线法 C .峰度偏度检验法 D .直方图法

4 . 正态分布中,如果平均数相同,标准差不同,那么(AD)。

A .标准差大的正态曲线形式低阔 B .标准差大的正态曲线形式高狭 C .标准差小的正态曲线形式低阔 D .标准差小的正态曲线形式高狭 5 .正态分布曲线下,标准差与概率(面积)有一定的数量关系,即(BCD)。 A .平均数上下一个标准差包括总面积的34 . 13 % B .平均数上下 个标准差包括总面积的 95 % C .平均数上下 2 . 58 个标准差包括总面积的 99 % D .平均数上下 3 个标准差包括总面积的 99 . 99 % 6 .二项实验满足的条件有(ABD)。 A .任何一个实验恰好有两个结果

B ,共有 n 次实验,并且 n 是预先给定的任一整数 C .每次实验可以不独立 D .每次实验之间无相互影响

7 .下列关于二项分布正确的是( ACD )。 A .当 p=q 时图形是对称的

B . 二项分布不是离散分布,概率直方图是越阶式的 C .当 P≠q 时图形呈偏态 D .二项分布的极限分布为正态分布

8 .下列条件下的样本平均数的分布为正态分布的是( AB )。 A .总体分布为正态,总体方差已知

B . 总体分布非正态,总体方差已知,样本 n > 30 C .总体分布为正态,总体方差未知

D .总体分布非正态,总体方差未知,样本 n > 30 9 .下列条件下的样本平均数的分布为 t 分布的是(CD)。 A .总体分布为正态,总体方差已知

B .总体分布非正态,总体方差已知,样本 n > 30 C .总体分布为正态,总体方差未知

D .总体分布非正态,总体方差未知,样本 n > 30 10 .下列关于 t 分布正确的是(ABC)。 A . t 分布的平均数是 0

B . t 分布是以平均数0左右对称的分布

C .当样本容量趋于无穷大时 t 分布为正态分布,方差为 1 D . 当 n-1 > 30 以上时,t分布接近正态分布,方差小于 l 11 .下列不属于2分布特点的是(CD)。

A .2丫分布是一个正偏态分布,正态分布是其中的特例 B .2值都是正值

C .2分布具有可加性,但2分布的和不一定是2分布 D .如果 df > 2 ,这时2分布的方差为 df 12 .下面是 F 分布特点的是(ACD)。 A . F 分布是一个正偏态分布

B . F 分布具有可加性, F 分布的和也是 F 分布 C . F 总为正值

D.当组间自由度为1时, F检验与t检验的结果相同 13 .心理与教育研究中,最常用的统计分布类型有(ABCD)。

A .正态分布 B .t分布 C .2分布 D . F分布 14 .以下各分布中,因样本容量的变化而变化的分布是(BCD)。 A .正态分布 B . t 分布 C .2分布 D . F 分布 参考答案: 1 . CD 2 . ABCD 3 . ABCD 4 . AD 5 . BCD 6 . ABD 7 . ACD 8 . AB 9 . CD 10 . ABC 11 . CD 12 . ACD 14 . BCD 三、概念题

1 .古典概率(中科院 2004 研)

答:古典概率也叫先验概率,是指在特殊情况下直接计算的比值。计算方法是事件 A 发生的概率等于 A 包含的基本事件数 M 与基本事件总数 N 之比。古典概率是最简单的随机现象的概率计算,建立在这样几个特定条件上的,即:事件的互斥性、事件的等概率性以及事件组的完备性。 2 .抽样分布(中科院 2005 研)

答:抽样分布又称取样分布指某种统计量的概率分布,它是根据样本(X1, X2, …… Xn)的所有可能的样本观察值计算出来的某个统计量的分布。抽样分布指样本统计量的分布,它是统计推论的重要依据。在科学研究中,一般是通过一个样本进行分析,只有知道了样本统计量的分布规律,才能依据样本对总体进行推论,也才能确定推论正确或错误的概率是多少。常用的样本分布有平均数及方差的分布。 四、简答题

1 .二项试验应满足哪些条件?(中科院 2004 研) 答:二项试验又叫贝努里实验。它需要满足的条件有: (l)任何一次试验恰好有两个结果,成功与失败,或 A与A 。

(2)共有 n 次试验,并且 n 是预先给定的任一正整数。

(3)各次试验相互独立,即各次试验之间无相互影响。例如投掷硬币的实验属于二项试验,每次只有两个可能结果;正面向上或反面向上。如果一个硬币投掷 10 次,或 10 个硬币投掷一次,这时独立试验的次数n = 10 。再如选择题组成的测验,选答不是对就是错,只有两种可能结果,也属于二项试验。但在一般的心理和教育试验中,很难保证第一次的结果完全对第二次结果无影响。比如,前面的题目的选答可能对后面的题目的回答有一定的启发或抑制作用,这时只能将它假设为近似满足不相互影响。

(4)任何一次试验中成功或失败的概率保持相同,即成功的概率在第一次为P(A) ,在第 n 次试验中也是 P (A) ,但成功与失败的概率可以相等也可以不相等。这一点同第三点一样,有时较难保证,实验中需要认真分析,必要时仍可假设相等。例如,某射击手的命中率为 ,但由于身体状态、心理状态的变化,在每一次射击时,命中率并不能保证都准确地是 ,但为了计算,只可假设其相等。凡是符合上述要求的实验称为二项试验。

2 .正态分布的特征是什么,统计检验中为什么经常要将正态分布转化成标准正态分布?(北师大2003 研,上海师大2002 研)

答:正态分布也称常态分布或常态分配。是连续随机变量概率分布的一种。描述正态分布曲线的一般方程为: y1e2x222

式中,π是圆周率;e是自然对数的底; x为随机变量取值一∞< x<+∞;μ为理论平均数;σ为理论方差; y为概率密度,即正态分布的纵坐标。 (l)正态分布的特征

① 正态分布的形式是对称的,它的对称轴是经过平均数点的垂线,正态分布

中,平均数、中数、众数三者相等,此点 y 值最大()。左右不同间距的 y 值不同,各相当间距的面积相等, y 值也相等。

② 正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负 1 个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交。

③ 正态曲线下的面积为 l ,由于它在平均数处左右对称,故过平均数点的垂线将正态曲线下的面积划分为相等的两部分,即各为 。正态曲线下各对应的横坐标(即标准差)处与平均数之间的面积可用积分公式计算。因正态曲线下每一横坐标所对应的面积与总面积(总面积为 l )之比其值等于该部分面积值,故正态曲线下的面积可视为概率,即值为每一横坐标值(x加减一定标准差)的随机变量出现的概率。

④ 正态分布是一族分布。依据随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。如果平均数相同,标准差不同,这时标准差大的正态分布曲线形式低阔;如果标准差小,则正态曲线的形式高狭。 ⑤ 正态分布下,标准差与概率有一定数量关系。

X1SD 包含所有数据的 % X1.96SD 包含所有数据的95% X2.58SD 包含所有数据的99%

( 2 )统计检验中经常将正态分布转化为标准正态分布是因为标准正态分布的 Z 分数不仅能表明原始分数在分布中的地位,而且能在不同分布的各个原始分数之间进行比较,同时,还能用代数方法处理,因此,它被教育统计学家称为“多学科表示量数”,有着广泛的用途。

① 用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。 Z 分数可以表明各个原始数据在该组数据分布中的相对位置,它无实际单位,可对不同的观测值进行比较。这里所说的数据分布中相对位置包括两个意思,一个是表示某原始数据以平均数为中心以标准差为单位所处距离的远近与方向;另一个意思是表示某原始数据在该组数据分布中的位置,即在该数据以下或以上的数据各有多少。如果在一个正态分布(或至少是一个对称分布)中,这两个意思可合二为一。但在一个偏态分布中,这两个意思就不能统一。在实际的教育与心理研究中,经常会遇到属于几种不同质的观测值,此时,不能对它们进行直接比较,但若知道各自数据分布的平均数与标准差,就可分别求出 Z 分数进行比较。一个原始分数被转换为 Z 分数后,就可知道它在平均数以上或以下几个标准差的位置,从而知道它在分布中的相对地位。当原始分数的分布是正态分布时,只要求出分布中某一原始分数的 Z 分数,就可以通过查正态分布表得知此原始分数的百分等级,从而知道在它之下的分数个数占全部分数个数的百分之几,进一步明确此分数的相对地位。

② 计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。 不同质的原始观测值因不等距,也没有一致的参照点,因此不能简单地相加或相减。计算平均数时要求数据必须同质,否则会使平均数没有意义。但是,当研究要求合成不同质的数据时,如果已知这些不同质的观测值的次数分布为正态,这时可采用 Z 分数来计算不同质的观测值的总和或平均值。 ③ 表示标准测验分数。

经过标准化的教育和心理测验,如果其常模分数分布接近其正态分布,为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常是将其转换

成正态标准分数。转换公式为: Z ' = a·Z+b 式中, Z’为经过转换后的标准正态分数。a,b 为常数; ZXX,指转换前的标准分数,σ为测验常模

的标准差。标准分数经过这样的线性转换后,仍然保持着原始分数的分布形态,同时仍具有原来标准分数的一切优点。例如,早期的智力测验中是运用比率智商(IQ)作为智力测查的指标。

3 .正态分布的标准差有何统计意义,在统计检验中为什么会用到标准差?(北师大 2 003 研)

答: ( l )正态分布的标准差的统计意义

① 标准差可以表示数据的分散程度,标准差大表示分散,标准差小表示相对集中。 a .若一个班的分数之标准差大,说明该班学习成绩不齐,好的好,差的差。此时标准差小好,说明成绩整齐。 b .若一个老师所出的试卷,学生考完后标准差大,说明这张试卷出得好,把不同学生的水平区分开了。此时标准差小不好。 c .同一测量的标准差大,说明误差较大。 ② 在正态分布的情况下标准差与平均数之间有一定关系。

X1SD 包含所有数据的 % X1.96SD 包含所有数据的95% X2.58SD 包含所有数据的99%

③ 在正态分布中,用标准差可以表示不同观测值在原有数据团体中的相对位置。

④ 一般三个标准差以外的认为是异常值,作为取舍依据。 ( 2 )在统计检验中会用到标准差是因为标准差是一个良好的差异量数并且适合与进一步的统计运算。其优点如下: ① 反应灵敏,随任何一个数据的变化而表示; ② 一

组数据的标准差有确定的值; ③ 计算简单;适合代数计算,不仅求标准差的过程中可以进行代数运算,而且可以将几个标准差综合成一个总的标准差; ④ 用样本数据推断总体差异量时,标准差是最好的估计量。 4 .简述正态分布的主要应用。

答:正态分布的应用主要牵涉到通过查标准正态分布表进行 Z 分数和概率之间的转换。其主要应用可以分为已知录取率求解分数线问题及其反问题,即已知原始分数或根据特定界限求解录取率或考生人数。分数线问题主要是根据录取率确定合适的查表概率(中央概率) , 查得 Z 分数并转换为原始分数;后者则主要是通过将原始分数或界限标准化,查表得到概率然后求解录取率或考生人数。此外,这种关系在测量中等级分数或难度的等距化,测验分数的标准化等程序中也有应用。

第七章 参数估计

单选题

1 .某内外向量表分数范围在 1 到 10 之间。随机抽取一个n=25 的样本,其分布接近正态分布。该样本均值的标准误应当最接近下面哪一个数值( D )。 A . B . 0 . 5 C . D .数据不足,无法估算 2 .样本平均数的可靠性和样本的大小(D)。

A .没有一定关系 B .成反比 C .没有关系 D .成正比 3. ( D)表明了从样本得到的结果相比于真正总体的变异量。 A.信度 B .效度 C .置信区间 D .取样误差 4 .区间估计依据的原理是(B)。

A .概率论 B .样本分布理论 C .小概率事件 D .假设检验

5 .总体分布正态,总体方差2未知时,从总体中随机抽取容量为 25 的小样本,用样本平均数估计总体平均数的置信区间为(D )。 A .XZ2nXZ2n B .Xt2nXt2n

n1C . XZ2n1XZ2n1 D . Xt2n1Xt2

6 .已知某次高考的数学成绩服从正态分布,从这个总体中随机抽取 n=36 的样本,并计算得其平均分为 79 ,标准差为 9 ,那么下列成绩不在这次考试中全体考生成绩均值的的置信区间之内的有(D)。 A . 77 B . 79 C . 81 D . 83

7 .总体方差未知时,可以用( C )作为总体方差的估计值,实现对总体平均数的估计。

2A . s B . s2 c . sn1 D . sn-1

8 .有一随机样本 n = 31 , sn-1=5 ,那么该样本的总体标准差的 置信区间内的分散程度可能包括以下值(B )。 A , 3 B . 5 C . 7 D . 9

9 .已知两样本,其中 n1=10,方差为 8 , n2=15,方差为 9 ,问该两样本的方差是否相等? ( A)

A . 1222 B . 1222 C . 1222 D .无法确定 10 .一个好的估计量应具备的特点是( B)。 A ,充分性、必要性、无偏性、一致性 B .充分性、无偏性、一致性、有效性 C .必要性、无偏性、一致性、有效性

D .必要性、充分性、无偏性、有效性

11 .从某正态总体中随机抽取一个样本,其中 n=10,s=6 ,其样本平均数分布的标准差为(D)。

A . 1 . 7 B . 1 . 9 C . 2 . 1 D . 2 . 0

12 .用从总体抽取的一个样本统计量作为总体参数的估计值称为(B)。 A .样本估计 B .点估计 C .区间估计 D .总体估计

13 .总体分布正态,总体方差2已知时,从总体中随机抽取容量为 25 的小样本,用样本平均数估计总体平均数的置信区间为(A)。 A .XZ2nXZ2n B .Xt2nXt2n

n1C . XZ2n1XZ2n1 D . Xt2n1Xt2

14. 有一个 64 名学生的班级,语文历年考试成绩的=5, 又知今年期中考试平均成绩是 85 分,如果按 95 %的概率推测,那么该班语文学习的真实成绩可能为(B)。

A . 83 B . 86 C . 87 D . 88

15. 有一个 64 名学生的班级,数学历年考试成绩的=5, 又知今年期中考试平均成绩是 80 分,如果按 99 %的概率推测,那么下列成绩中比该班数学学习的真实成绩高的可能为( D ).

A . 79 B . 80 C . 81 D . 82

参考答案: 1 . D 2 . D 3 . D 4 . B 5 . D 6 . D 7 . C 8 . B

9 . A 10 . B 11 . D 12 . B 13 . A 14 . B 15 . D

二、多选题

1 .一个良好的估计量具备的特征(ABCD)。 A .无偏性 B .一致性 C .有效性 D .充分性

2 .有一个 64 名学生的班级,语文历年考试成绩的=5, 又知今年期中考试语文平均成绩是 80 分,如果按 99 %的概率推测,那么该班语文学习的真实成绩可能为( BCD ).

A . 78 B . 79 C . 80 D . 81

3 .已知某次物理考试非正态分布,=8 ,从这个总体中随机抽取 n = 64 的样本,并计算得其平均分为 71 ,那么下列成绩在这次考试中全体考生成绩均值的 0 . 95 的置信区间之内的有(BC)。 A . 69 B . 70 C . 71 D . 72

4 .假设未知,总体正态分布,有一样本 n=10 , X78 ,s2=64 ,那么下列数据属于其总体参数的 0 . 95 置信区间之内的有(BC)。 A . 7 1 B . 82 C . 84 D . 85

5 .有一随机样本 n=31 ,sn-1= 5 ,那么该样本的总体标准差的 0 . 99 置信区间可能包括( ABC ) A . 4 B . 5

6.计算积差相关系数的置信区间,可能会用到以下公式()。 A . rt2rrt2r B . rZ2rZ2r C. rZ2SSSSZ2rt2 D. rt2 n1n1n1n1参考答案: 1 . ABCD 2 . BCD 3 . BC 4 . BC 5 . ABC 三、概念题

1 .无偏估计(中科院 2004 研)

2 .标准误差(中科院2005研,南开大学2006研) 四、简答题

1. 简述点估计和区间估计。(首师大2003研)

2. 在心理学研究中,以样本对总体判断的数理理论依据。(首师大2003研) 3 .为什么要做区间估计?怎样对平均数作区间估计?(北师大 2003 研) 4 .证明义Sn21是总体方差的无偏估计。(浙大 2004 研)

第八章 假设检验

一、单选题

1 .理论预期实验处理能提高某种实验的成绩。一位研究者对某一研究样本进行了该种实验处理,结果未发现处理显著的改变实验结果,下列哪一种说法是正确的? (D )

A .本次实验中发生了I 类错误 B .本次实验中发生了Ⅱ类错误 C .需要多次重复实验,严格设定统计决策的标准,以减少 I 类错误发生的机会

D .需要改进实验设计,提高统计效力,以减少Ⅱ类错误发生的机会 2 .以下关于假设检验的命题,哪一个是正确的? ( A )

A .如果 H0 在= 的单侧检验中被接受,那么 H0在= 的双侧检验中一定会被接受

B .如果 t 的观测值大于t的临界值,一定可以拒绝 H0

C .如果 H0 在=的水平上被拒绝,那么 H0在=的水平上一定会被拒绝 D .在某一次实验中,如果实验者甲用=的标准,实验者乙用= 的标准,实验者甲犯Ⅱ类错误的概率一定会大于实验者乙

3 .假设检验中的第二类错误是(C)。

A .原假设为真而被接受 B .原假设为真而被拒绝 C .原假设为假而被接受 D .原假设为假而被拒绝

4 .实际工作中,两均数作差别的统计检验时要求数据近似正态分布,以及( C)。 A .两样本均数相差不太大 B .两组例数不能相差太多 C .两样本方差相近 D .两组数据标准误相近

5 .在假设检验中, 取值越大,称此假设检验的显著性水平( B )。 A .越高 B .越低 C .越明显 D .越不明显 6 .假设检验中两类错误的关系是(D)。

A  B.  C . 1/2 D . 不一定等于 1 7 .单侧检验与双侧检验的区别不包括(C)。 A .问题的提法不同 B .建立假设的形式不同 C .结论不同 D .否定域不同

8 .在统计假设检验中,同时减少和错误的最好办法是( C )。 A .控制水平,使其尽量小 B .控制值,使其尽量小 C .适当加大样本容量 D .完全随机取样 9 .统计学中称(D)为统计检验力。

A .  B . C . l-  D . l-  10 .假设检验一般有两个相互对立的假设,即( C )。 A .虚无假设与无差假设 B .备择假设与对立假设 C .虚无假设与备择假设 D .虚无假设与零假设 11 .统计假设检验的理论依据是( B )。

A .抽样分布理论 B .概率理论 C .方差分析理论 D .回归理论 12 .虚无假设 H0 本来不正确但却接受了H0 ,这类错误称为(D)。 A .弃真 B .弃伪 C .取真 D .取伪

13 .某地区六年级小学生计算能力测试的平均成绩为 85 分,从某校随机抽取的 28 名学生的测验成绩为 , S=10 ,问该校学生计算能力成绩与全地区是否有显著性差异? ( C )。

A .差异显著 B .该校学生计算能力高于全区 C .差异不显著 D .该校学生计算能力低于全区

14 .已知 X 和 Y 的相关系数 r1是 0 . 38 ,在 0 . 05 的水平上显著, A 与 B 的相关系数r2是 0 . 18 ,在 的水平上不显著,那么( C )。(北大 2002 年研)

A . r1与r2在 0 . 05 水平上差异显著 B . r1与r2在在统计上肯定有显著差异 C .无法推知r1与r2在统计上差异是否显著 D . r1与r2在统计上不存在显著差异

15 .一位研究者调查了n = 100 的大学生每周用于体育锻炼的时间和医生对其健康状况的总体评价,得到积差相关系数r= ,由此可以推知以下哪个结论? ( D )

A .随机抽取另外100个健康状况低于这次调查平均值的大学生,调查其每周用于体育锻炼的时间,会得到接近r=0 . 43 的积差相关系数

B .用大学生每周用于体育锻炼的时间来预测其健康状况的评价准确率为43 %

C .大学生用于体育锻炼的时间长短影响其健康状况

D .以上都不对,因为不知道r=0 . 43 与r=0 是否有显著差异

16 .在心理实验中,有时安排同一组被试在不同的条件下做实验,获得的两组数据是A

A .相关的 B .不相关的 C .不一定 D .一半相关,一半不相关 17 .两个 N = 20 的不相关样本的平均数之差 D = 2 . 55 ,其自由度为( B)。

A . 39 B . 38 C . 18 D . 19

18 .在大样本平均数差异的显著性检验中,当 z>= 时,说明(D)。 A . P < 0 . 05 B .P<0 . 01 C .P>0 . 01 D . P≤0 . 01 19 .教育与心理统计中,假设检验的两类假设称为(A)。 A .虚无假设和备择假设 B .真假设和假假设 C . I型假设和Ⅱ型假设 D . α假设和β假设 20 .统计推论的出发点是( A )。

A .虚无假设 B .对立假设 C .备择假设 D .假设检验 21 .假设检验的第一类错误是(A)。

A .弃真 B .弃伪 C .取真 D .取伪 22 .下列哪些方法对提高统计效力没有帮助(B)。

A .增加样本容量 B .将α水平从 0 . 05 变为 0 . 01 C .使用单尾检验 D .以上方法均可提高统计效力

23 .在癌症检查中,虚无假设几为“该病人没有患癌症”。下面哪一种情况是最为危险的(A)。

A . H0是虚假的,但是被接受了 B . H0 是虚假的,并且被拒绝了

C . H0是真实的,并且被接受了 D . H0是真实的,但是被拒绝了 参考答案: 1 . D 2 . A 3 . C 4 . C 5 . B 6 . D 7 . C 8 . C 9 . D 10 . C

11 . B 12 . D 13 . C 14 . C 15 . D 16 . A 17 . B 18 . D 19 . A 20 . A

21 . A 22 . B 23 . A 二、多选题

1 .在假设检验中,H0又可以称作(BC)。

A .虚无假设 B .备择假设 C .对立假设 D .无差假设 2 .统计学中将拒绝 H0 时所犯的错误称为(AC)。

A . I 类错误 B . Ⅱ类错误 C .α型错误 D .β型错误 3 .以下关于假设检验的命题, (CD )是正确的?

A .如果H0在α=0 . 05 的单侧检验中被接受,那么H0在α= 的双侧检验中一定会被接受

B .如果 t 的观测值大于 t 的临界值,一定可以拒绝H0

C .如果H0在 α= 的水平上被拒绝,那么风在α=的水平上一定会被拒绝 D .在某一次实验中,如果实验者甲用α= 的标准,实验者乙用α=的标准,实验者甲犯Ⅱ类错误的概率一定会小于实验者乙 4 .假设检验中两类错误的关系是( BC)。

A .仅α+β=1 B . α+β不一定等于1 C . α与β可能同时减小 D . α+β不可能同时增大 5 .单侧检验与双侧检验的区别包括(ABD)。

A .问题的提法不同 B .建立假设的形式不同 C .结论不同 D .否定域不同

6.在假设检验中,【 AD】总是作为直接被检验的假设。 A.虚无假设 B.备择假设 C.对立假设 D.无差假设 参考答案: 1 . BC 2 . AC 3 . CD 4 . BC 5 . ABD 三、概念题

1 .统计检验力(浙大 2000 研)

答:统计检验力又称假设检验的效力是指假设检验能够正确侦察到真实的处理效应的能力,也指假设检验能够正确地拒绝一个错误的虚无假设的概率,因此效力可以表示为 1 一月。检验的效力越高,侦察能力越强。影响统计检验力的因素有: ① 处理效应大小,处理效应越明显,越容易被侦查到,假设检验的效力也就越大。 ② 显著性水平 a , a 越大,假设检验的效力也就越大。 ③ 检验的方向性,单侧检验侦察处理效应的能力高于双侧检验。 ④ 样本容量,样本容量越大,标准误越小,样本均值分布越集中,统计效力越高。 2 .检验的显著性水平(南开大学 2004 研)

答:检验的显著性水平指在假设检验中,虚无假设正确时而拒绝虚无假设所犯错误的概率。在假设检验中有可能会犯错误,如果虚无假设正确却把它当成错误的加以拒绝,犯这类错误的概率用。表示, a 就是假设检验中的显著性水平。通常选择 a 二 0 . 05 作为检验的显著性水平。也就是说每当实验结果发生的概率小于或等于 0 . 05 的时候,就拒绝虚无假设。 四、简答题

1 .简述 I 型错误与 n 型错误的关系,并附图加以说明。(首师大2004 研)

答: ( 1 ) I 型错误,指在否定虚无假设接受备择假设时所犯的错误,即将属于没有差异的总体推论为有差异的总体时所犯的错误。这类错误的概率以 a 表示,故又常常称 a 型错误。 n 错误,指在接受虚无假设为真时所犯的错误,即接受虚无假设并不等于说二者 100 % 地没有差异,同样有犯错误的可能性,不能由此得出没有差异的结论。这类错误的概率以月表示,故又常常称刀型错误。 ( 2 )两类错误的关系① 两类错误相加不一定等于 1 两类错误是在两个前提下的概率。如图 8 一 3 所示,。是拒绝 H0 时犯错误的概率(这时前提是“凡为真” ) ;刀是接受坑时犯错误的概率(这时“ H0 为假”是前提),所以 a +月不一定等于 l 。如图 8 一 3 所示: ② 在其他条件不变的条件下, a 和刀不可能同时增大或减小 a 增大,刀就减小; a 减小,刀就增大。当临界点 X 。向右移时, a 减小,但此时刀就增大;反之 X 。向左移,则 a 增大刀减少。 X 、刀拭)为真时又的分布 H .为真时不的分布召一戈 图 8 一 3

2 .在进行差异的显著性检验时,若将相关样本误作独立样本处理,对差异的显著性有何影响,为什么?(北师大 2003 研)

答: ( l )在进行差异的显著性检验时,首先需要考虑样本是否服从正态分布,如果服从正态分布,还需要考虑总体方差是否已知,然后看样本是否是独立样本。若将相关样本误作独立样本处理,则忽视了样本数据之间的一致性,导致错误地运用计算公式,差异的显著性也会受到误估,使本来可能有显著差异变成无显著差异。 ( 2 )因为相关样本与独立样本不同,会运用不同的计算方法计算显著性。相关样本与独立样本是根据两个样本是否来自同一个总体来划分的。 ① 如果是独立样本,其和(或差)的方差等于各自方差的和,即武,士, )

= ,互+,孚在进行差异的显著性检验中采用以下公式: sEn 、=点德 ( X ,一瓜)一(拜,一拜 2 ) D *一拜奸 sE 奸 sE ' ② 相关样本之间存在着一一的对应关系。如果是相关样本,前后两次结果则相互影响,而不独立。当两个变量之间相关系数为 r 时,两变量差的方差为: , { ;一,)二二二一 2 二 x 。,+。圣在进行差异的显著性检验中采用以下公式: sE 孟; = sE 蚤. + sE 蚤 2 一 ZrSE ; , SE 几几一而。{石

sED * =傅 2 『 2 , 十 ― 一艺 r _ D ; Z 二二士匕万石 D 牙由计算公式可以看出,独立样本和相关样本在进行差异的显著性检验时,使用了不同讨算公式,相关样本的标准误可能会比独立样本的标准误小,使得计算出的 Z 值大,从而更容易达到显著性水平,所以如果将相关样本误作独立样本处理,会使本来可能有显著差异变成无显著差异。

3 .有人说:\" t检验适用于样本容t小于30的情况。Z 检验适用于大样本检验”,谈谈你对此的看法。(北师大 2004 研)

答:我认为这种说法是正确的。 t 检验、 Z 检验都是均值检验的方法,都有各自适用的范围。 ( 1 ) t 检验是比较两组均数差别最常用的方法。当样本容量小于 30 时,样本的差异平均数与差数的总体平均数的离差统计量呈 t 分布,这时应该采用 t 检验。理论上,即使样本量很小时,也可以进行 t 检验。只要每组中变量呈正态分布,两组方差不会明显不同。当 n > so 时, t 分布趋向于正态,这时如果样本容量接近 30 还可以采用 t 检验,但也可以用:检验近似处理。 ( 2 ) Z 检验法适用于大样本(样本容量小于 30 )的两平均数之间差异显著性检验的方法。它是通过计算两个平均数之间差的 Z 分数来与规定的理论 Z 值相比较,看是否大于规定的理论 Z 值,从而判定两平均数的差

异是否显著的一种差异显著性检验方法。根据数理统计的理论,当样本的容量增大时,样本平均数的抽样分布属于正态分布,这就为大样本的统计检验奠定了基础。当 n > 30 时, t 分布接近正态分布,根据显著性水平假设,这时需要用 Z 检验。 Z 检验一般用于大样本( n >二 30 )实验的差异程度的检验。 ( 3 )在平均数的显著性检验中,分两种情况,其一是关于样本平均数与总体平均数差异的显著性检验,在总体服从正态分布,总体方差已知的情况下,用 Z 检验;总体方差未知的情况下,用 t 检验。其二是平均数差异的显著性检验,在两个总体都服从正态分布,总体方差均已知的情况下,用 Z 检验(相关样本和独立样本所用统计量不同);在两个总体都服从正态分布,但是总体方差未知时,用 t 检验(所用检验统计量方法与两个总体是否独立以及方差是否相等有关)。所以,有时 t 检验与 Z 检验没有绝对界限。

4 .选择统计检验程序的方法时要考虑哪些条件,才能正确应用统计检验方法分析问题。(北师大 20 (科研)

答:选择统计检验程序的方法时需考虑以下条件: ( l )看总体分布是否已知。如果已知,看是不是正态分布。如果已知样本分布为常态分布就可以选择参数检验法,如果总体分布未知就用非参数检验法。 ( 2 )在参数检验中,如果总体分布为正态,总体方差已知,两样本独立或相关都可以采用 Z 检验;如果总体方差未知,根据样本方差,采取不同的 t 检验。如果总体分布非正态,总体方差已知,根据样本独立或相关采取 Z ’检验;如果总体方差未知,根据独立和相关采取不同的 Z ‘检验。 ( 3 )根据题目考虑用单侧还是双侧检验。 ( 4 )在非参数检验中,按照两个样本相关和不相关、精度与容量等,可以采用符号检验、秩和检验等方法。

5 .独立样本和相关样本之间的差别是什么?(中山大学 2004 研) 答:相关样本是指两个样本的数据之间存在一一对应的关系。而独立样本是指两个样本数据相互独立,不存在一一对应关系。在显著性检验中,相关样本的 t 检验一般不需要事先进行方差齐性检验。因为相关样本是成对数据,即两组数据存在对应关系,这样可以求出对应数据的差,使对两组数据均值差的显著性检验转化为对 d 的显著性检验。而独立样本的数据不是成对的,即使两组数据的样本数相同,两组数据也不存在一一对应关系,因而不可能有对应值的差 d ,只能以两个样本方差共同对总体方差进行估计(即求联合方差),必须以两组数据的方差相等为前提。统计分析中,在考虑是参数还是非参数检验后,需要考虑是独立样本还是相关样本。这样涉及选择不同的检验方法。 6 .简述 T 检验和方差分析法在进行组间比较上的区别和联系。

答: T 检验和方差分析法的联系是:它们都是推断统计的主要方法,都可以用于检验组间差异,即通过比较自变量(性质变量)的各水平在因变量上的差异对自变量的效应进行判断。它们的区别是: T 检验主要是基于 T 分布理论,只能用于检验两组之间的差异,即其分析的自变量只能有两个水平;而方差分析则主要用于多组比较。另一方面, T 检验还可以对单个总体参数的显著性进行检验,而方差分析法作为一般线性模型,可以同时处理多个自变量在多个因变量上的效应检验问题。 四、计算题

1 .随机从某总体选取 10 名被试,分别实施两次数学测验,两次测验的成绩见表 8 一 5 , 问被试在两次测验的平均数是否有显著差异?试对结果进行解释(。= 0 . 05 , df = 9 , t = 2 · 262 ; df = 18 , t = 2 · 552 )。

(首师大 2003 研,浙大 2006 研)表 8 一 510 名被试两次测验的成绩 被试 l 2 3 4 5 6 7 8 9 l0 测验一 65 48 63 52 6l 53 63 70 65 66 测验二 6l 42 66 52 47 58 65 62 64 69

解: ( l )由于总体方差未知,两个是相关样本,所以采用 t 检验。具体分析过程如下: ① 提出假设 H0 :拜 1 二拼 2 即被试在两次测验的平均数没有显著差异。 H 。:拜。笋拜 2 即被试在两次测验的平均数有显著差异。 ② 选择检验的统计量并计算其值 Xl 一凡

11 ,其中 xl = 60 . 6 , xZ = 55 . 6 , s 二二 32 , n = 10

df = 9 ③ 确定显著性水平及临界值当 a = 0 . 05 时, to . , ( 9 ) = 2 . 262 ④ 作出统计决断因为 t < t005 ( 9 ) ,所以接受 H0 即被试在两次测验的平均数没有显著差异。 ⑤ 报告结果根据假设检验的结果,被试在两次测验的平均数没有显著差异, t = 1 . 11 , p > 0 . 05 (双侧检验)。 ( 2 )根据假设检验的结果,被试在两次测验的平均数没有差异,既可能是因为两次测验测量的内容是相近的,也可能是因为样本抽样过小,测量内容之间的差异没有显示出来。

2 .有容 t 分别为 nl = 10 和 n : = 16 的独立随机样本得到下述观测结果( X 、 Y 为观测值,了为频数) : X 12 . 3 12 . 5 12 。 8 13 . 0 13 . 5 Y 12 . 2 12 . 3 13 . 0 f 1 2 4 2 1 f 6 82 现已知变 tX 、 Y 的总体均呈正态分布。请问在 0 . 05 的显著性水平下,可否认为这两个总体属同一分布?(浙大 2003 研)

提示: F0 。 5 ( 9 , 15 )二 2 . 59 , FO 。, ( 10 , 16 ) = 2 . 49 , t 。二/ 2 ( 24 ) = 2 . 064 , to 。 5 / 2 ( 25 ) = 2 . 060 , t 。。 5 ( 24 )

= 1 . 7 11 , t 。。( 25 ) = 1 . 708 ? 解: ( l )对原始数据进行描述统计 X : n , = 10 , x ,二 12 . 5 , s 卜 0 . 1 Y : nZ = 16 , XZ = 12 . 35 , s 至= 0 . 0625 ( 2 )由于两总体的方差未知,因此需要先进行方差齐性检验。 ① 提出假设 H0 : , { = ,圣即两总体方差齐性 H , :武旁武即两总体方差不齐性 ② 选择检验的统计量并计算其值。 s 岌 0 . 1 r =万=丁蔽亏= 1 一叽子= 10 一 1 = 9 ,叽母= 16 一 1 =巧 ③ 确定显著性水平及临界值当 a 二 0 . 05 时, F 。。 5 ( 9 , 15 ) = 2 · 59 ④ 作出统计决断因为 F < F0 。 5 ( 9 , . 5 ) ,所以接受 H0 即两总体方差齐性。 ( 3 )两总体方差齐性因此按照两总体方差齐性的独立样本平均数差异检验进行。 ① 提出假设风:拜,=脚即两个总体属于同一分布。 Hl :拜,笋拼。即两个总体不属于同一分布。 ② 选择检验的统计量并计算其值 10 xo . l + 16 xo . 0625 10 + 16 一 2 10 + 16 10 X 16 = 0 . 1 16 Z , . . . . .、、 X df = nl + n :一 2 = 10 + 16 一 2 = 24

③ 确定显著性水平及临界值当 a = 0 . 05 时, t0 。( 24 ) = 2 . 046 ④ 作

出统计决断因为 t > t005 ( 24 ) ,所以拒绝 H0 ,接受 H ,即两个总体不属于同一分布。 ⑤ 报告结果根据假设检验的结果,两个总体不属于同一分布, t = 3 . 879 , df 二 24 , p < 0 . 05 (双侧检验)。

第九章 方差分析

一、单选题

1 .方差分析的主要任务是检验(A)。

A .综合虚无假设 B .部分虚无假设 C .组间虚无假设 D .组内虚无假设

2 .某实验选取三个独立样本,其容量分别为 n , = 4 , n :二 5 , n3 二 6 ,用方差分析法检验平均数之间的显著性差异时,其组间自由度为(A)。 A . 2 B . 5 C . 12 D . 14

3 .某项调查选取三个独立样本,其容量分别为 nl = ro , n : = 12 , n3 二巧,用方差分析法检验平均数之间的显著性差异时,其组内自由度为(D)。 A . 2 B . 5 C . 36 D . 34

4 .某年级三个班的人数分别为 50 , 38 , 42 人,若用方差分析方法检验某次考试平均分之间有无显著性差异,那么组间自由度为(C)。 A . 127 B . 129 C . 2 D . 5

5.完全随机设计的方差分析适用于(A)。

A .三个及其以上独立样本平均数差异的显著性检验 B .方差齐性检验

C .三个及其以上相关样本平均数差异的显著性检验 D .两个样本平均数差异的显著性检验 6 .随机区组设计的方差分析适用于(C)。

A .三个及其以上独立样本平均数差异的显著性检验 B .方差齐性检验 C .三个及其以上相关样本平均数差异的显著性检验 D .两个样本平均数差异的显著性检验

7 .随机化区组实验设计对区组划分的基本要求是(C)。

A .区组内和区组间均要有同质性 B .区组内可以有异质性,区组间要有同质性C .区组内要有同质性,区组间可以有异质性 D .区组内和区组间均可以有异质性

8 .方差分析中, F ( 2 , 24 ) = 0 . 90 。 F 检验的结果(D)。 A .不显著 B .显著 C .查表才能确定 D .此结果是不可能的

9 .如果用方差分析检验一个双组设计的平均数差异,将会得到一个与(B)同样的结果。 A . F 检验 B . ,检验 C .犷 D .不能确定

10.在随机区组实验设计中,由于被试之间性质不同导致产生的差异称为(D)。 A .因素效应 B .误差效应 C .系统效应 D .区组效应 n . 11.组间效应也被称为(A)。

A .因素效应 B .误差效应 C .系统效应 D .区组效应 12 .组内效应也被称为(B)。

A .因素效应 B .误差效应 C .系统效应 D .区组效应 13 .实验设计的不同效应模型影响方差分析的(C)。

A .交互作用的均方 B .误差项的均方 C . F 值计算的分母项 D . F 值计算的分子项

14 .以下关于事后检验的陈述,哪一项是不正确的? ( B)

A .事后检验是我们能够比较各组,发现差异发生在什么地方 B .多数事后检验设计中都控制了实验导致误差 C .事后检验中的每一个比较都是相互独立的假设检验 D . Scheffe 检验是一种比较保守的事后检验,特别适用于各组 n 不等的情况巧.

15. 某研究选取容量均为 5 的三个独立样本,进行方差分析,其总自由度为(B)。 A . 15 B . 12 C . 2 D . 14

16 .当一个实验(B)时,我们才能得到交互作用。

A .因变量多于 1 个 B .自变量多于 1 个 C .因变量多于 1 个的水平 D .自

变量多于 2 个的水平

17 .假设 80 个被试被分配到 5 个不同的实验条件组,那么要考虑各组被试在某症状测量上的差异, F 比率的 df 各为(D)。 A . 5 , 79 B . 5 , 78 C . 4 , 79 D . 4 , 75

参考答案: 1 . A 2 . A 3 . D 4 . C 5 . A 6 . C 7 . C 8 . D , . B 10 。 D 11 . A 12 . B 13 . C 14 。 B 15 . B 16 . B 17 . D 二、多选题

1 .方差分析的前提条件是(BD)。

A .总体正态且相关 B .总体正态且相互独立 C .总体正态且样本容量相等 D .各实验处理内的方差要一致 2 .完全随机设计又称为(AC)。

A .独立组设计 B .相关组设计 C .被试间设计 D .被试内设计 3 .随机区组设计又称为(BD)。

A .独立组设计 B .相关组设计 C .被试间设计 D .被试内设计 4 .在方差分析型实验设计中,最常用的类型有(ABD)。 A .组间设计 B .组内设计 C .混合设计 D .拉丁方设计 5 .在随机区组实验设计中,总平方和可以被分解为(ACD)。

A .被试间平方和 B .被试内平方和区组平方和 C .误差项平方和 D .区组平方和

6 .事后检验常用的方法有(BC )。

A . F 检验 B . N 一 K 法 C .月侣刀法 D . t 检验 参考答案: 1 . BD 2 . AC 3 . BD 4 . ABD 5 . ACD 6 . BC

三、简答题

1 .方差分析的适用条件是什么?主要用来检验什么?(东北师大 2006 研)答:进行方差分析时有一定的条件限制,数据必须满足以下几个基本假定条件,否则由它得出的结论将会产生错误。方差分析的适用条件如下: ( 1 )总体正态分布方差分析同 Z 检验及 t 检验一样,也要求样本必须来自正态分布的总体。在心理与教育研究领域中,大多数变量是可以假定其总体服从正态分布,一般进行方差分析时并不需要去检验总体分布的正态性。当有证据表明总体分布不是正态时,可以将数据做正态转化,或采用非参数检验方法。 ( 2 )变异的相互独立性总变异可以分解成几个不同来源的部分,这几个部分变异的来源在意义上必须明确,而且彼此要相互独立。 ( 3 )各处理内的方差一致在方差分析中用 MS ,作为总体组内方差的估计值,求组内均方 MS ,时,相当于将各个处理中的样本方差合成,它必须满足的一个前提条件就是,各实验处理内的方差彼此无显著差异。这一假定若不能满足,原则上是不能进行方差分析的。方差分析主要用来检验两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。 2 .简述方差分析法的步骤。

答:方差分析法的步骤是: ( l )和一般的假设检验一样设立零假设和研究假设; ( 2 )根据实验设计的类型确定各变异源,进行相应的平方和分解,即有几个变异源就从总平方和中分解出几个平方和; ( 3 )根据平方和分解得到各变异源对应的自由度,即进行总自由度的分解; ( 4 )根据研究的目的和实验设计考虑要检验什么效应,从而将其对应的平方和比上相应的自由度得到该效应的均方,其中误差均方必须计算; ( 5 )将各待检验效应的均方比上误差的

均方,计算各 F 统计量; ( 6 )将计算来的各 F 统计量值和 F 检验的临界值进行比较得出统计结论,其中临界值的分子自由度和分母自由度分别是待检验效应的自由度和误差自由度; ( 7 ) (可不答)如果效应检验结果显著,可以进人事后检验,即对多水平的自变量进行多重比较考察各水平间的具体差异,如果是多因素方差分析,交互作用效应检验显著,也可以进入简单效应检验具体考察交互作用的情况。 四、计算题

1 .对于智力落后的儿童,如果工作步调的安排比他们自定的步调慢一些,则他们工作成绩要好一些。这样的安排对于心智落后者的教育工作很为适用。下列是受试者在三种不同的辨别工作条件下的错误分数 《 1 )自定步调; ( 2 )下一辨别项目出现前间隔 2s 的步调; ( 3 ) 下一项目出现前间隔 4s 的步调。这些数据支持“总体平均错误分数至少在两个步调水平上有所不同”的研究假设吗?如有不同,在哪两个步调上不同( dfl = 2 , dfz = 10 , F = 4 . 1 ,。= 0 . 05 ; dfl = 3 , dfz 二 13 , F = 3 . 41 ,。= 0 . 05 ; r = 2 , df = 10 , q = 3 . 15 ,。= 0 . 05 ; r = 2 , df = 2 , q = 6 . 08 ,。= 0 . 05 )。(首师大 2 (刃 4 研) 2 . 4 5 . 0 4 . 0 1 . 8 1 . 2 0 . 8 4 1 . 8 3 . 2 1 . 7 调一定 55 步一自 24

解: ( l )根据题意需要进行方差分析, ① 提出假设受试者 3 4 . 8 3 . 2 0 . 5 过程如下: H0 :拜,=拜:=拜。(总体错误平均数在所有水平上相同。) H . :井‘尹肠至少有一对成立(总体错误数至少在两个步调水平上有所不同。)(其中 i 尹 j , i , j = l , 2 , 3 ) ② 计算平方和原始数据与计算的中间结果如表 9 一 6 所示表,一 6 原始数据与中间结果表剔味下不十一橇一一青

一二一业

3 . 2 1 . 7 6 . 7 勺山气曰一亡」飞口 0 一{匕口 〔 O 己一乙 U , 1 nl 11 4 . 0 l2

艺 r } 乏艺 X = 31 . 1 艺艺 X , = 102 . 47 28 . 88 33 . 53 16 . 37 洲下惠 SST = 55 。=艺艺尸-(艺艺 x ) ' N 、 102 . 47 一 74 . 4 = 28 . 07 二(艺 x ) ' 二一万「一-(艺艺 x ) ' N 二 91 . 01 74 . 4 = 16 . 612 55 砰= 55 ;一 55 , = 1 1 . 458 ③ 计算自由度 13K = 3 = N 一 l = 12 = K 一 1 二 2 N = dfrdfs

第十章 卡方检验

一、单选题

1 .检验一个因素多项分类的实际观察数与某理论次数是否接近,这种了检验是(A)。

A .配合度检验 B .独立性检验 C .同质性检验 D .符号检验

2 .检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题,这种 x ,检验是(B)。

A .配合度检验 B .独立性检验 C .同质性检验 D .符号检验

3 .在相关样本四格表的检验中,如果期望次数小于 5 时,可用(D)检验法。 A .犷检验 B . z 检验 C . t 检验 D .费舍精确概率 参考答案: 1 . A 2 . B 3 . D 二、多选题

1 .运用犷检验时,当单元格的人数过少时,处理的方法有(ABCD ) o A .单元格合并法 B .增加样本数 C .去除样本法 D .使用校正公式

2 .根据研究问题不同犷检验可以分为(ABC)。

A .配合度检验 B .独立性检验 C .同质性检验 D .符号检验 3 .下列关于配合度检验方法中的自由度的说法,正确的是(ABD)。 A .配合度检验的自由度与实验或调查中分类的项数有关 B .通常情况下,配合度检验的自由度一般为分类的项数减 1 C .配合度检验的自由度一般为理论次数减 1 D .在正态拟合检验时,自由度为分组项目减 3 参考答案: 1 . ABcD 2 . ABc 3 . ABD 三、简答题

1 . t 检验、 F 检验、卡方各自适用于什么情况?(北师大 2003 研) 答: ( 1 ) l 检验运用于总体分布已知的参数检验法中。需要满足总体正态分布,总体方差未知的情况下的显著性、差异性检验。比较适合于小样本( n < 30 )。这时需要数据符合:分布。当样本含量 n 小时,若观察值:符合正态分布,则用:检验(因此时样本均数符合,分布)。常见的 l 检验形式有:样本均数与总体均数比较的 t 检验;配对设计的 t 检验;成组设计两样本均数比较的 t 检验。两个小样本均数比较的‘检验有以下应用条件: ① 两样本来自的总体均符合正态分布, ② 两样本来自的总体方差齐性。因此在进行两小样本均数比较的 t 检验之前,要用方差齐性检验来推断两样本代表的总体方差是否相等,方差齐性检验的方法使用 F 检验,其原理是看较大样本方差与较小样本方差的商是否接近, ' l ”。若接近“ 1 \" ,则可认为两样本代表的总体方差齐。判断两样本来自的总体是否符合正态分布,可用正态性检验的方法。若两样本来自的总体方差不齐,也不符合正态分布,对符合对数正态分布的资料可用其几何均数进行 t 检验,对其他资料可用:‘检验或秩和检验进行分析。

( 2 ) F 检验常常用于方差的显著性检验中。要检验两组数据的离散程度是否有显著不同,需要对两组数据的方差进行差异检验。这时数据符合 F 分布。在平均数差异检验时,如果不是相关样本,需要进行方差齐性检验。单因素方差分析( F 检验)常用来检验一个变异因素对试验结果的显著性。作为参数检验法的一种,单因素方差分析通常需要假设数据为服从正态分布的随机样本和方差齐性。方差分析的基本条件是:总体正态分布;变异的可加性;各处理内的方差一致。 ( 3 )卡方运用于非参数检验。适用于样本是频数分布的情况。其数据是属于点计而来的离散变量;总体分布未知;不是对总体参数的检验,而是对总体分布的假设检验。计数资料的统计检验主要用卡方检验,可以用来同时检验一个因素两项或多项分类的实际观测数据,与某理论次数分布是否相一致的问题,或有无显著差异的问题;还可用于检验两个或两个以上因素各有多项分类之间,是否有关联或是否具有独立性的问题。卡方检验用于计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,又是一种非参数检验的方法。

2 .判断某个变 tX 的样本是否符合卡方分布的方法是什么?(中山大学 2004 研)

答:判断某个变量 X 的样本是否符合卡方分布可以根据卡方分布适用的条件来考虑。卡方分布的适用条件参见本章简答题第 1 题( 3 ) 3 .简述卡方配合度检验和卡方独立性检验的区别。

答:卡方配合度检验主要用于检验单个名义型变量多个分类上的实计数和某个理论次数分布(如均匀分布)之间的差异显著性,因此可以将之理解成多组之间次数比较的方法;卡方独立性检验主要用于检验两个名义型变量各项分类上

的次数之间是否存在显著关联,是考察名义型变量间相关性的方法。 四、计算题

1 .一研究者随机调查了 8 名看过 A 和 B 这两部电影的受访者,问他们更喜欢哪部电影。 6 名受访者喜欢电影 A , 2 名受访者喜欢电影 B 。他就此得出结论:电影 A 更为观众所喜欢。但实际上也有可能这两部电影为观众同等程度地所喜欢而使得这个结论是错误的,发生这个错误的概率是多少?(计算结果可以用分数表示)(南开大学 21 刃 4 研)

解:根据题意,采用犷检验喜欢电影 A 和电影 B 的人数之间是否有显著差异。具体检验过程如下所示:此题若两部电影为观众同等程度地喜欢,则喜欢每部电影的人数为 4 人,由于期望值小于 5 ,所以采用矫正公式进行计算:犷=艺 ( } fo 一川一 1 / 2 ) ' 关 ( 16 一 4 }一 0 . 5 4 125 , p = 0 . 26 +二逗丝止鱼止_ 4 一 125 查攀二 1 时犷值表得犷= o 125 所以发生错误的概率是 0 . . 26 。答:发生这个错误的概率是 0 . 26 。

2 . 5 名接受预防注射的实验组中, 2 名在规定时间患感冒,而在 15 名的控制组中,却有,名患感冒。问:预防注射是否有用( x 轰 0s = 3 . 841x 孟。: = 6 . 635df = 1 ) ? (首师大 2004 研)

解:根据题目得知应用卡方检验,且可以应用四格缩减公式。患未患实验控制 2 ( 2 . 75 ) 3 ( 2 . 25 ) 9 ( 8 . 25 ) 6 ( 6 . 75 ) A 十 B = 5 C 年刀匕 15 A + (卜 1 IB +刀匕 9 由于其中 fe < 5 所以应用四格校正公式。提出假设: H0 :预防无效果。 H , :预防有效果。计算犷值:押泛 20N ' , AD 一 BC 卜登) 2 一( A +侧( C + D ) ( A + C ) ( B + D ) 。 n 二了}。,,。. 20 ' U 入 l { ' XO 一 JX , i 一 ― 二一一工扁一一-一.一二兰

5 x 15 X 11 xg . 0 . 04 <端。二 3 . 841 所以接受 H0 ,即预防是没有效果的。答:预防注射没有用。

因篇幅问题不能全部显示,请点此查看更多更全内容