您的当前位置:首页正文

统计学复习资料

2021-03-09 来源:爱站旅游
导读统计学复习资料
统计学复习资料

简答题

第一章

1、 什么是描述统计?什么是推断统计?试举例说明?

答:描述统计是指如何从已知的观察资料,搜集,整理,分析,研究并提供统计资料的理论和方法,用以说明研究现象的情况和特征,而不必深入一层地去试图推论数据本身以外的任何事情。推断统计则是凭样本资料已推断总体特征的技术和方法。举例略。

第二章

1、 什么是统计调查?统计调查有哪几种组织形式?

答:A:统计调查就是对统计资料的搜集,它是根据研究的目的和要求,有组织、有计划地向调查对象搜集原始资料和次级资料的过程。

B:统计调查按照搜集资料的组织方式不同,分为专门调查和统计报表。专门调查包括普查、重点调查、抽样调查和典型调查。

2、 普查、典型调查、重点调查和抽样调查各有什么特点和区别?

答:A:普查--是专门组织的一次性全面调查。对资料的准确性要求高,普查面广量大,要求有更多的集中领导和统一行动。普查中应注意:规定统一的标准时点;确定统一的普查年限;规定普查的项目和指标。B:重点调查---是指只在调查对象中选择一部分重点单位进行调查,借以了解总体基本情况的一种非全面调查。它可用于经常性调查,也可用于一次性调查,组织重点调查的重要问题是确定重点单位。C抽样调查---是指根据随机原则从调查总体中抽取部分单位进行观察并根据其结果推断总体数量特征的一种非全面调查方法。D典型调查---就是根据调查的目的和要求,再对研究对象进行全面分析的基础上,有意识地选择部分有代表性的单位进行调查,它也是一种非全面调查。其选点方式有解剖麻雀(情况差异较少时)和划类选点(各单位之间差异较大)。

第三章

1、 试述平均数在统计分析中的作用。

答:可以用来反映标志值的典型水平和标志值分布的中心位置或集中趋势。

2、平均数有哪几种?应用最广泛的是哪一种?他们在统计应用中各有什么用途? 答:A:平均数有算术平均数(应用最广泛)、调和平均数、几何平均数、中位数和众数。 B:平均数可以用来反映标志值的典型水平和标志值分布的中心位置或集中趋势。

3、常用的标志变异指标有哪些?各种指标的作用和局限性怎样?

答:A:常用的标志变异指标有极差、四分位差、平均差、方差和标准差、离散系数、偏度和峰度。

B:1》极差--是测定标志变动程度的一种粗略方法,它计算简便、易于理解。但只受

极端值的影响,测定的结果往往不能反映数据的实际离散程度。2》四分位差--是对极差的一种改进,它不受极值的影响,在反映数据离散程度方面比极差准确,有较高的稳定性。同时对于存在开口的组距数列,不能计算极差,但可以计算四分位差。但它不能充分利用数列的全部信息,也无法反映标志值得一般变动。3》平均差---对离差采用绝对值,避免了正负离差求和时互相抵消的问题,但绝对值不便于代数运算。而方差和标准差可弥补这一不足。4》离散系数---可以消除不同总体之间在计量单位和平均水平方面的不可比因素。

4、为什么要计算离散系数?常用的离散系数有哪几种?

答:在统计研究中,为了对不同的总体的标志变异度进行对比分析,往往还需要有测定总体中各单位标志值变异的相对量指标即离散系数,以消除不同总体之间在计量单位和平均水平方面的不可比因素。常见的有平均差系数和标准差系数。

第四章

1、相对指标的概念及分类。

答:1 .分类:根据相对指标的性质和实际工作需要,相对指标主要有以下六种

(1)计划完成相对数:也称计划完成百分数,是将实际完成量与计划指标进行对比,对比结果一般用百分数表示。

(2)结构相对数:计算各部分在总体终所占的比重,这样的相对数,就说结构相对数。它是总体构成部分的数值对总体数值之比,也就是部分与全体之比。

(3)比较相对数:比较相对数,是指同一时期不同地区、不同单位之间同类指标之比,用以反映事物发展不平衡的相对差异程度。

(4)动态相对数:动态相对数,是表明同一现象不同时期的2个指标之比,又称为发展速度。通常用来作为比较指标所属的时期叫做基期,与基期对比的时期叫做报告期。

(5)强度相对数:强度相对数是说明现象发展的强度、密度或普遍程度。它是由两个性质不同但又有联系的总量指标进行对比,用来反映社会现象之间的相互关系。 (6)比例相对数:比例相对数,是同一总体中两个部分之比。

2、指数的分类。

答:指数按照划分标准的不同可以分为以下几类: (1)按所反映现象的特征不同,可分为数量指数和质量指数:数量指数反映现象的总规模、水平或工作总量的变化;质量指数反映工作质量的变化情况。 (2)按计算指数时所用的基期不同,可分为定基指数和环比指数。定基指数的基期是固定不变的,环比指数的基期是随着报告期的变化而变化的,一般是以上一年的同期作为基期。 (3)按所反映现象的范围不同,可分为个体指数和总指数。个体指数是说明单个事物或

现象在不同时期上的变动程度,总指数是说明多种事物或现象在不同时期上的 综合变动程度。 3、综合指数的编制:①同度量因素与指数化因素相乘后必须是有实际经济意义的总量指标;②数量指标指数一般以质量指标为同度量因素,质量指标指数一般以数量指标为同度量因素;③同度量因素的固定时期必须以指数的经济意义为依据。

第七章

1、 什么是抽样?抽样的主要特点有哪些?抽样在工商管理领域中有哪些应用?P157

答:A:抽样就是从所研究的对象中随机地取出其中一部分来观察,由此而获得有关总体的信息。B:1》遵守随机原则;2》推断被调查对象的总体特征;3》计算推断的准确性和可靠性。C:1》当某些现象不可能采用全面调查时,可以利用抽样作出推断。2》当某些现象没有必要采用全面调查时,可利用抽样做出推断。3》抽样调查和全面调查相结合,可以互相补充,也可以对全面资料起到检验和对的作用。4》对于某些总体的假设需要依靠抽样法进行假设检验。5》它可用于现代化工业大批量生产过程中的产品质量控制。 2、 简述样本统计量和总体参数、随机抽样和判断抽样、非抽样误差和抽样误差的概念。P158 答:A:样本统计量--当集中趋势指标和离散趋势指标用来描述样本的特征时。B:总体参数---。。。用来描述总体特征时。C:随机抽样--按照随机原则,即按概率规律抽取样本,在总体中所有单位被抽中的机会是均等的。D:判断抽样--是一种非随机抽样,它是根据个人或集体的设想或经验,从总体中有目的地抽取样本。E:非抽样误差--是指在调查登记过程中发生的误差和由于主观因素破坏了随机原则而产生的系统性的偏差。 F:抽样误差--是指由于抽样的随机性而带来的偶然的代表性误差,不包括登记性误差和不遵守随机原则造成的误差。

3、 什么是纯随机抽样?什么是等距抽样 ?什么是类型抽样?什么是整群抽样?什么是多阶段抽样?他们的特点和适用条件是什么?P160

答:A:纯随机抽样--是对总体的所有容量不作任何分类和排队,完全按照随机原则逐个抽取样本容量。B:等距抽样--也称机械抽样或系统抽样,它是先将总体各单位按某一有关标志排队,然后相等距离或相等间隔抽取样本单位。C:类型抽样---又称分类抽样或分层抽样,它是先将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽样或等距抽样方式,抽取一定数目的调查单位构成所需的样本。适宜于总体情况比较复杂,各类型或层次之间的差异较大,而总体单位又较多的情形。D:整群抽样--是在全及总体中以群为单位,按纯随机抽样方式或等距抽样方式,抽取若干群,然后对所抽中的各群中的全部单位一一进行调查。 E:多阶段抽样--将整个抽样程序分成若干阶段,然后逐阶段进行抽样,以完成整个抽样过程的抽样方式。

4、什么是抽样分布?举例说明样本平均数的抽样分布。P164 答:假如从一个总体中随机抽出容量相同的各种样本,则从这些样本计算出的某些统计量所有可能值的分布,称为这个统计量的抽样分布。

5、 试述中心极限定理的基本内容。P168

答:内容为:给出一个具有任意函数形式的总体,其平均值和方差有限。在对该总体进行抽样时,随着样本容量的增加,由这些样本算出的样本平均数的抽样分布将近似服从平均数为 和方差为 的正态分布。简言之,若统计量Z= 。。。。,则Z近似标准正态分布。

6、试述两个样本平均数之差抽样分布的基本原理。P172 答:若果有两个正态总体,那么从两个正态总体中抽取的容量分别为n1和n2两个独立样本的平均数之差也一定服从正态分布。

第八章

1、什么是点估计?什么是区间估计?两者各有什么优缺点?

点估计是根据样本数据计算的一个估计值,但不能表明估计的可靠程度。区间估计是通过样本来估计总体参数可能位于的区间。点估计的优点在于它能够明确地估计总体参数,但一般该值不会等于总体参数的真值。它与真值的误差以及估计可靠性怎样,我们无法知道。而区间估计则可弥补这种不足之处。

2、判断一个估计量好坏的标准有哪些? 无偏性,一致性,有效性

第九章

1、什么是假设检验?它试图解决什么问题?

假设检验就是对总体参数所做的假设开始,然后搜集样本数据,计算出样本统计量,进而运用这些数据测定假设的总体参数在多大程度上市可靠的,并作出承认还是拒绝该假设的判断。假设检验是研究如何运用样本得到的统计量来检验事先对总体参数所做的假设是否作出确,是否具有某种性质或数量特征。

2、试述第Ⅰ类错误与第Ⅱ类错误的关系。 两类错误的表示:

犯第一类错误的概率,用α来表示 犯第二类错误的概率,用β来表示 两类错误的关系:

若α减小,则β必增大 若β减小,则α必增大

第十章

1、非参数统计的概念和特点 概念:所谓非参数统计,就是对总体分布的具体形式不必做任何限制性假定和不以总体参数具体数值估计为目的的推断统计。这种统计主要对某种判断或假设进行检验,故亦称为非参数检验。 特点:

非参数统计与传统的参数统计相比,有以下优点:

1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。

2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。 3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。 4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。

5、当推论多达3个以上时,非参数统计方法尤具优越性。 非参数统计方法也有以下缺点:

1、由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误的概率β要大些。

2、对于大样本,如不采用适当的近似,计算可能变得十分复杂。

第十一章

1. 相关关系的概念及分类 (1)相关关系的概念

变量之间的依存关系可以分为函数关系和相关关系两种。函数关系是指变量之间保持着严格的依存关系,呈现一一对应的特征。而相关关系是指变量之间保持着不确定的依存关系。 (2)相关关系的分类

变量间的相关关系可以按照不同的标志进行分类:

①按相关的程度可分为完全相关、不完全相关和不相关三种

当一个变量的变化完全由另一个变量所决定时,称变量间的这种关系为完全相关;当变量之间存在不严格的依存关系时,称为不完全相关;当两个变量的变化相互独立、互不影响时,称两个变量不相关(或零相关);

②按相关的方向可分为正相关和负相关 当一个变量随着另一个变量的增加(减少)而增加(减少),即两者同向变化时,称为正相关;当一个变量随着另一个变量的增加(减少)而减少(增加),即两者反向变化,称为负相关。 ③按相关的形式可分为线性相关和非线性相关两种

当变量间的依存关系大致呈现线性形式,即当一个变量变动一个单位时,另一个变量也按一个大致固定的增(减)量变动,就称之为线性相关;当变量间的关系不按固定比例变化时,就称之为非线性相关。

④按研究变量的多少可分为单相关、偏向关和复相关三种

两个变量之间的相关,称为单相关;一个变量与两个或两个以上其他变量之间的相关,称为复相关;在多个变量的相关研究中,假定其他变量不变,专门研究其中两个变量之间的相关关系时就称其为偏相关。

2. 回归分析概述 (1)回归分析的概念

在相关分析确定了变量之间相关关系的基础上,采用一定的计算方法,建立起变量间变动关系的公式,并根据一个变量的变化来估计或预测另一个变量发展变化的研究方法,就是回归分析。

回归分析和相关关系之间的区别与联系:

回归分析和相关分析都是对变量之间不严格依存关系的分析,在理论基础和方法上具有一致性。只有存在相关关系的变量才能进行回归分析,相关程度越高,回归分析结果越可靠。但是两者之间也存在差别:

第一,相关分析研究的是变量之间的依存关系,这些变量地位对等,不区分为主从因素或因果关系。回归分析却是在控制或给定一个(或多个)变量条件下来观察对应的某一变量的变化,给定的变量为自变量,不是随机变量,被观察的变量称为因变量,是随机变量,因此回归分析中必须根据研究的目的来确定自变量和因变量。

第二,相关关系主要测定的是变量之间关系的密切程度。回归分析则着重于变量之间的具体变动关系,通过建立回归模型,控制或给定自变量对因变量及进行估计和预测。

计算题

一、 平均数

n1、算数平均数

XA简单算术平均数: X1X2X3Xni1iX

NN

n

Xifi B加权算数平均数:

Xi1n

fi i1

X(或X)——标志值 i 式中:

Xi(或X) fi(或f)——标志值 出现的次数或权数

n——组数

n Xifi(或Xfi1

2、调和平均数

A简单调和平均数:

B加权调和平均数:

3、 几何平均数:

A简单几何平均数:

B加权几何平均数:

)——标志总量

Hn11x1x21xnn1i1xinnim1m2mni1Hnmnm1m2mix1x2xni1ximGnx1x2xnnxi1niGi1nfixxf1f212xfnnfii1nfixii1nm1二、 中位数 2McLif m

Mc——中位数

L——中位数所在组的下限

fm——中位数所在组的次数

f——总次数即各组次数总和

fSSm1——小于中位数组的各组次数之和 ——中位数所在组的组距

d三、众数 M0L1id1d2

四、 四分位数 公式见P48-49

例: 10个家庭的人均月收入数据

排序: 660 750 780 850 960 1080 1250 1500 1630 2000 位置: 1 2 3 4 5 6 7 8 9 10

i

五、 离散系数

A.D.1、平均差离散系数: V100%A.D.X

2、标准差离散系数: V100%

X

六、P73拉氏指数及帕氏指数公式。 (1)帕氏价格指数为 p1q1IP

p0q1

p1q1 帕氏数量指数公式 Iq p1q0

拉氏价格指数公式 p1q0IP

p0q0

p1q1 拉氏销售量指数为: Iqp1q0

七、参数估计

A 总体平均数的区间估计

1样本取自总体方差已知的正态分布

设总体X~N(μ,σ2),置信度为1-α,且方差σ2已知,则总体均值μ的置信区间为



Xz, Xz/2/2 nn2总体方差未知且小样本

设总体X~N(μ,σ2),置信度为1-α,但方差σ2未知,则总体均值μ的置信区间为

ss Xt(n1), Xt(n1)/2/2nn

3总体方差已未知且大样本

, XzXznn22

4总体方差未知且大样本

ssXz, Xznn22 

B 总体比率的区间估计

当样本容量n很大(np>5,n(1-p)>5)时,则总体比例π的置信区间为

p(1p)p(1p) pz, pznn 22

C 总体方差的区间估计

设总体X~N(μ,σ2),置信度为1-α,则总体方差σ2的置信区间为 (n1)s2(n1)s2,22 (n1)1/2(n1)/2

D 样本容量的确定

1、以样本均值,估计总体均值μ时

2、以样本比例P估计总体参数π时

八、假设检验

A 总体均值的检验

1、正态总体且方差已知 X0Z~N(0,1) /n

2、正态总体但方差未知 X0t~t(n1) S/n

3、非正态总体但有大样本

X0 Z(方差已知) ~N(0,1)/n

X0 Z'(方差未知) ~N(0,1)S/n

B 总体比例的检验 np≥5,n(1-p)≥5

p~N(0,1) Z(1)

n

C 总体方差的检验 2(n1)S22 ~(n1)20

因篇幅问题不能全部显示,请点此查看更多更全内容