袁方社会学 袁方 社会学研究方法教程
量的关系应当消失。因此,根据理论或经验选定可能成为外在变量的变量作为检验因素,使用分表法将检验因素控制,就可以判断一个关系是否虚假。引入外在变量的最重要贡献是能够防止做出错误的解释。
举例:1845-1945年医学统计表明,在过去一个世纪中,精神病患者的比例大为增加。对于这一关系,不难做出下述解释:在过去一个世纪中,生活环境的迅速改变造成了严重的社会紧张,可能是这种社会紧张导致了精神病患者的增加。
但是,引入年龄这一变量加以检验,发现二者虚假相关。进一步的解释:年纪大的人中老年性痴呆症增加,这种病是生理衰退而不是精神紧张造成的。医学进步使得人的寿命延长,也增加了老年人在人口中的比重,因此产生大量老年性痴呆患者。
上述例子说明,一个看起来精密的理论架构,就因为没有考虑到外在变量,事实上却是错误的。
引入外在变量的做法,能增进研究者对于这两变量间具有内在关系的信心,但不能完全断定这一关系是真的。因为它也许还受其他外在变量的影响。
(2)变量关系的具体化:社会学常常有些极为笼统的命题,它们的涵盖能力很大,但却无助于增进对问题的了解。为了使变量间这种笼统的关系具体化,找出一个复杂且涵括极广的自变量中对因变量起主要作用的因素,往往采用引入检验因素的办法。
作为检验因素的就是自变量中被理论或经验推测为对因变量器主要作用的那个因素。能使变量件关系具体化的变量称为内含变量。 举例:杜尔克姆研究婚姻中哪个因素影响自杀率,包括性的满足、夫妻感情、不孤独等影响已婚者的自杀率。在这种情形中,两变量的关系是建立在涵括的概念上,但实际上这一关系确是由概念所包含的某个因素引起的,是总体“代表”了局部。用图示表示
B??就是:?C?X??→Y。与此相反,还有另外一种情形存在,即关系是由某个因素引起的,但实际起作用的却是涵盖这个因素的
更宽的概念,是局部代表总体。
(3)追寻关系产生的原因:在实际中常常碰到这样一种情况:变量X与Y之间的关系是另一变量A的“媒介”作用的结果,即X导致A,而A又导致Y,X通过A的作用产生与Y的关系,用图表示就是:X→A→Y。变量A对X与Y之间关系的建立
X确经A影响Y,就可以说:X与Y关系之所以如此,是因为A的作用的结果。因此,将中介变量作为检验因素引入到两变量之间这一检验模式,可以说明自变量是如何影响Y的,即对变量关系发生的过程进行注释。指出中介变量有助于更进一步了解两个变量间的关系,如果不考虑这种中介因素,我们就会止于事实,而缺乏完整深入的了解。
(4)寻找因果次序:前导变量的引入可以说是源于社会学研究中对因果次序的探寻。
变量。前导变量的引入步实施自变量与因变量之间的关系消失,而是使它得到澄清。
举例:父亲的教育水平影响儿子的教育水平从而影响投票率。
检验一个变量是否为前导变量的具体做法是:注意检验这个变量能否满足下述三个统计上的条件,若能满足,则是前导变量,否则不是:<1>三个变量:前导变量、自变量、因变量,必须两两相关。
<2>控制前导变量后,自变量与因变量的关系应不消失。
<3>控制自变量后,前导变量与因变量间的关系应当消失。
(5)防止将真关系误判为假关系:两变量间真实关系不能表现是由于第三个变量的闯入抑制、取消或削弱了这一真实关系。这
举例:年龄抑制工人会龄与种族态度的关系。控制年龄后,会龄与种族态度的相关性表现出来。
一个抑制性变量在某种意义上是与外在变量相对应的。后者用于检验假设是否被当作真,他从假设两变量具有真相关开始,继而引入检验因素,此因素对原来的两个变量来说是外在的,假如发现原来的关系消失了,则称原关系是虚假的。而前者则用于检验镇是否被当作假,它从两个变量间无关系开始,然后引入检验因素,这个因素对原来的两个变量来说也是外在的,假如在每一个分表中出现了关系,则称原来的无相关是虚假的。
正像外在变量可以判断关系为假而无法断言关系为真一样,抑制变量可以判断关系为真却不能断定关系为假。但是外在变量虽不能判断两关系为真,却可以通过对多个外在变量的检验,加强它是真关系的信心。同样,抑制变量虽然不能判断两变量关系为假,但却可以通过对多个抑制变量的检验,加强它是假关系得信心。
(6)恢复变量间关系的真貌甚至完全改变一个关系的真实方向。因此,对歪曲变量的检验,能够将两变量间真是关系袒露出来,从而使研究者避免抛弃正确的假设或接受错误的假设。
第 41 页 共 49 页 41 A→X→Y,这里,A因素就是前导
123、 条件关系的分析:在利用分表发对分表中的关系与原关系进行比较时,我们发现这些分表中的关系或减弱、消失;或维持原状;或从无相关到有相关、弱相关到强相关;或与原关系的下相关方向相反。在这些情形中,我们假定所有分表中关系的大小与方向是相似的。
但是,在有些情况下,各分表中的关系可能并不一致,即有的分标关系强、有的弱,有的分表是正相关,有的是负相关。在前一种情况下,由于所有分表中自变量与因变量的关系都相同(或相似),因此可以说这一关系是普遍的、无
里所说的条件,可以是检验因素的不同分类、不同层次、不同阶段,以及任何具有分类意义的东西。
条件关系在社会学分析研究中作用很大,不仅可以帮助解释,对理论的建立做出贡献,还能说明、澄清两变量间的关系,促进对事物的了解;而且他对科学的主要目标之一:预测,也有重要贡献;它使得调查资料的分析更丰富、更深入、更正确。
(1)帮助解释:<1>促进修正原解释或发现新解释。<2>支持或强化原解释。<3>帮助选择正确的解释。对同一个现象,人们常常做出各种不同的解释,这些解释似乎都同样令人信服,都同样切合结果,使人难辨真伪。
条件关系的检验往往能帮助分析者摆脱这种困境,选择恰当、合理的解释。<4>帮助发现隐而不彰的事实。在虚假无关中,由于各个分表中的关系方向相反,因而可以用两种方式进行解释。
第一,分别解释,也就是对正关系与负关系各自做出解释。第二,整合的解释,即将两种对立的发现融合起来,只给出一个搞抽象层次的解释。<6>帮助了解事物发展趋势或过程。具体做法就是将时间作为检验因素。在横剖研究中调查资料大多是于某一时点或某一段时间收集到的,将他们用于社会动态研究颇受限制,但如果善于运用条件关系,就能在相当程度上解决这一困难。
(2)对关系进行说明、澄清及描述:所谓说明一个关系,就是将分表里具有特殊意义的关系指出来,并且指明这种特殊的意义。
<1>清除原关系中的干扰因素。<2>明确指出加强或抑制原关系的一些条件。<3>可以说明两变量关系成立的必要条件。一般说来,所有的关系都是条件关系,即每一种关系都是在某种条件之下才成立。
但通常研究中并不特别指出关系成立所应具备的条件,因为一般情况下他们的存在是内含的、公认的。然而在某些情况下,若能说明一个关系的同时,指出这种关系成立所必需的条件,则会增加人们对研究对象的深入了解,也使分析更加完整,条件关系可以完成这一使命。
<4>条件关系可澄清自变量与因变量的本质。为进行实证的社会研究,必须将概念操作化,变成具体的指标或指数,然而这些指数与指标往往并不能精确代表概念,因此在解释指标时,常常超过或达不到这个指数或指标的范围,从而做出错误的解释。
条件关系有时可以帮助分析者澄清调查资料所表现的指数的意义。<5>条件关系还可以使描述性的说明更精确。
124、 联合作用的检查:将第三个变量作为一个自变量,以了解它与原来的自变量以怎样的互动方式对因变量产生作用。
(1)独立作用:如果将两个变量X与Y间的不对称关系用X Y表示,引入第三个变量A,将其视为自变量并假设A与Y也存在着非对称关系,则变量间的关系就变成X
X与A对Y的作用可分为: <1>两个自变量在不受对方作用的下对Y的独立作用。<2>X与A对Y的共同作用。<3>X与A形成新的变量后对Y的作用。
独立作用又分为两种情况:第一,两自变量之间彼此无关,各自独立的对因变量起作用。 第二,两自变量彼此密切相关地对因变量发生作用,每一自变量在一定程度上反映着另一自变量。
(2)相对作用:假定每个自变量军对因变量有独立的影响,那么何者大?这就是所谓相对作用的问题。相对作用研究在社会学研究中有着极为重要的作用,许多理论问题可以从检验相对作用的大小获得解决。如:是教育还是经济对个人的生育行为影响大?
(3)累积作用:是指两个自变量对因变量Y的共同作用,这种共同作用并不一定是两个自变量各自影响力的单纯相加,决定其强度的因素很多,但其中以两自变量间的相关程度为最重要。累积作用的大小主要决定因素是两自变量间的相关程度。
(4)类型作用:有时两个自变量或其中某一自变量与因变量并不相关,然后当它们融合在一起时,却能够产生另外独特的作用,这种情形相当于两个自变量融合之后形成一个新的自变量,它是超于组成它的两个单个自变量之上一个新的实体为与原自变量区别,我们称这种变量为“类型”。
“类型”与各个自变量的关系就像整体与部分的关系部分组成整体,但整体性质不等于个部分之和。 按自变量的融合方式,“类型”可分为四种:<1>特殊类型:指新生成的自变量的涵意不同于原来两个自变量的涵意。
<2>修正类型:指新合成的自变量修改了原自变量的本质与特性。<3>一致---不一致类型:指新自变量由两个性质一致或两个性质不一致的自变量合成。<4>相对的类型:指通过两个自变量相互地位的比较所产生的新变量。
由以上介绍可见,详析过程式统计分析与理论分析密切结合的过程研究者不仅要运用缜密的逻辑推理,而且要运用理论的洞察力和想象力对调查资料中所反映的客观事实或现象间关系做出理论解释。因此,在现代社会调查中调查研究人员不仅要努力掌握先进的统计技术,而且更重要的是要掌握科学的思维方式和推理方法,提高对社会现象的分析能力和洞察力。
第 42 页 共 49 页 42
125、 调查分析的策略:(1)详析的程序: <1>确定两变量间关系的类型。若两者相关关系较显著就要进一步分析它们之间的是对称关系、还是相互关系或因果关系,如果是相互关系,我们则要进一步检查其相互影响,比较两者谁是更具持久性和固定性的变量,以尽可能决定影响的主要方向。
如果是因果关系,则要确定谁是自变量,谁是因变量。<2>确定关系的真伪。分两种情况:(A)两变量统计相关:应考虑这种关系是否有内在的或有意义的关系是否受到某外在变量影响的结果。
(B)两变量统计无关或相关不显著:要看其关系是否被抑制变量所抑制,特别是在理论和实际观察都表明他们有可能有关系时。当量变量间的原关系的方向与我们所了解的和理论所提供的方向相反时,就要考虑是否歪曲变量在起作用。
<3>将量变量间的关系具体化。确定两变量关系为真之后,则可检查内含变量,以使这一关系更具体。<4>寻找变量间的因果链。进行中介变量的检验,目的是对
<5>检查是否存在条件关系。许多有价值的资料都是由这一步骤获得的。 <6>进行联合作用的考察。进一步考察两两个变量是否存在独立作用。如果两变量彼此独立起作用时,就要进一步考察两者何者为大,此外还要考察累积作用。最后可检查两自变量是否可以建立一个新的变量类型。
需要特别指出的是:在调查分析中,两变量关系只是代表分析的开始,而非结束。实际上在详析的过程中,每一部的分析都会得到一些结果,这些结果会产生一些新的问题,需要进行进一步的分析。分析是一个不断探寻的过程,每一步分析都会产生一个新的问题,而须检验新的资料,进行新的分析,新的资料又产生其他问题,如此循环反复就使得我们对于调查资料的利用更加充分并进而导致对社会现象的认识不断深化。
(2)假设检验与概念追踪:在调查研究中,虽然假设检验具有极大的价值,但它并不是唯一的,有时甚至不是最主要的一种方法。这是因为即使假设是由理论抽离出来的,也能获得资料的支持,但资料并不能证明理论,资料只能给理论以支持,虽然研究的发现与假设所根据的理论一致,但这些发现也可能与其他理论一致。
实际上,经验研究远远超出了检验理论的被动功能,它不仅仅是证实或反驳假设。如果能适当的运用其他一些分析的策略与技巧,经验研究在创造、改进、反思和澄清理论上也能发挥积极的作用。许多调查分析采用一种所谓
的分析方法,它是一个理论与资料动态地交互作用的复杂过程。概念追踪与纯粹假设检验模型不同。假设检验是由理论起,理论发展出假设,收集相关资料,然后检验假设一决定其是否获得支持或否定。概念追踪则是在理论与资料间进行互动,它由资料出发,资料常迫使理论家进一步对其加以解释,而这些解释与理论又指引适当的资料以进一步验证理论或使理论更为周密。
(3)偶然重大发现的利用:科学的历史充满了未曾假设的意外发现。实际研究中,这种以偶然或智慧获得发现极为重要,因此对于这种偶然性发现的警觉是研究策略的关键要素。这种意外地发现可以促使产生新的理论或对原有理论作出修正。有时意外发现的贡献不一定是突破性的,但对于资料的意外可能性保持高度警觉,研究这就能够更充分的利用这些资料,并增进对社会学理论与知识的贡献。
(4)证据的分析:任何科学的目的是达到概括论断,即由具体的事物得到一般的原则或模式。概括论断可分为两类:经验的与理论的,前者是指根据一些个案所得到的结果概推到较普遍的总体。而后者是指从各种不同情况中得出一般原则,在这种概括论断中,具体的变量被看作是较抽象的概念的一个指标。
由经验得到概括论断,应进一步加以确证,以增加他的可信度和解释力。对于经验型概括一般是通过复验进行证实的, 复验的主要方法有: <1>将资料与来自同一或可比总体的其他样本作比较。<2>在不同的总体中作相同的经验性概括论断。<3>配对比较方法。
证实理论性概括论断的基本方法是选择代表同一概念的不同指标。杜尔克姆对自杀的分析提供了整理证据的卓越例子,他将许多经验性概推整合成单一的理论性概推,即高度的社会整合与低自杀率相关。将相同命题的证据累积起来就使其论点特别有说服力。
需要指出的是,在验证理论性概推时,对于同一个研究与理论命题相关的一切资料都需要加以检查,而不能任意进行选择。 证据分析对于理论性概推的主要贡献主要有以下几点:<1>可以支持对结果的解释,由此可以产生更强有力和更有包容力的理论概推。
<2>可以对某一理论的解释提出问题,从而使我们注意寻找更符合事实的其他解释。<3>可使在对原有结果的不同解释间作出正确的解释。<4>可在同一研究中进行验证,经验的概推除“配对比较”外,不可能在同一研究中对自身的结果进行验证。<5>有时能使我们对理论概推比经验概推在统计上更有信心。
(5)事后解释:(人大09论述)是先有资料,然后再找符合它的解释。因此事后解释只是一种可信性的解释,而无法达到“证据确凿”的解释(高度肯定),即这种解释知识与一套资料相符而已。
事后解释的三大缺陷:<1>伸缩性过大,即对一种调查结果,可有多种解释。<2>不能将其完全抛弃。<3>无法以来外在的确证。事后解释因为是有了资料后才加以解释的因此无法肯定这一解释的正确性我们无法再检查资料以获得确证。
对于上述三大缺点,我们可以通过详析程序和证据分析程序部分加以克服。这两个程序都是由解释抽取出推论,然后将其付诸验证。因此,事后解释并非分析的结束而只是它的开始。社会调查研究中不得不使用事后解释,但在使用这种方法时,必须注意他
第 43 页 共 49 页 43 这一关系做出说明。有时,我们可以进一步通过追寻前导变量来扩大因果链条。
所具有的局限性,必须运用上述的程序对他们进行处理。
第十七章:多元分析概论
126、 多元分析的一般概念:(1)详析模式与多元分析:控制多个变量的方法与控制一个变量的方法一样,也可采用分表法,只是分表的层次更多而已。实际上,当变量数目超过4个时,由于表的层次过多、过大,使用这一方法是很困难的,特别是当要从一组因素去确定一定数目的变量,而且希望分析这些变量之间的关系时,困难就更大。
为解决这一困难,所用办法是将上述的逻辑程序倒转过来,即“不摸索着去推断数据的结构性质”,而是先提出某一结构的假设,然后考察这个结构是否真正符合数据。
(2)多元分析的类型和应用:<1>类型:(A)美国库利和柯尼斯按变量的组数和群体数分为下述四类:因素分析,复相关、偏相关和典型相关;多因方差分析;判别分析和聚类分析。(B)英国统计学家根据研究目的将多元分析方法分为两大类:相依性分
共同特点是分析所涉及的变量是不平等的,即有自变量与因变量之分。
相依分析的目的变量是平等的,分析的目的是变量之间的相互关系,以简化这种相互关系。因素分析、聚类分析等均属于互相依性分析。
每一种多元分析方法都是建立在一些列假设前提的基础之上的,这些假设既包括这一方法所涉及的变量的测量层次,而且也包括这些变量间相互关系的性质,以及资料的不同来源等。因此,在选择一种多元分析方法时,应首先考察这一方法所要求的前提条件是否得到满足,若某些条件未获得满足,就要想办法进行某种统计处理,例如定类变量,可先将其变为虚拟变量后再引入回归模型。
<2>优点和局限:多元分析较之于单变量和双变量分析能更真实反映复杂的社会现象之间相互联系与相互依存的关系,但其局限是:(A)大多数多元分析方法都是在分析前先形成一个假设,然后再探寻与资料的符合程度,因此多元分析大多是与事先的理论研究密切联系在一起的,这就要求研究者具备很好的专业训练。此外,选择何种理论假设模型是由研究者决定的,这就是它很难避免研究者主观因素的影响。
(B)多元分析是一种高级分析手段,一般要求变量具有较高的测量层次,在社会研究中这种要求往往很难达到。为此研究人员利用许多统计手段将这些低层次变量转化为定距变量处理,从而使多元分析的影哟国内范围得到一定程度的扩大
(C)多元分析一般要求每一项记录来自同一时点和同一单位,这在大规模的社会调查研究中也是难于保证的,这就为进行同一时点上地区差异的分析和同一单位的历史变化的分析带来了困难。
(D)多元分析包括了高深的数学问题并涉及大量的数字处理与运算,随着计算机技术的发展和统计软件包的问世,这方面的困难有了很大克服。但当变量的数目太多,或设备缺乏以及受过专业训练的统计人员不足时多元分析方法实际应用仍受到很大限制。
(E)多元分析常碰到一个问题是对于结果的解释。由于分析中变量的选择,使用的分析方法是因研究者而异的,而且由于多个变量间相互作用的复杂性等,使得对于分析结果的解释要较之于双变量和单变量分析更为困难。
127、 相依性分析:
(1)多元相关分析:<1>偏相关:是指用一个统计值来测量当控制了其他变量的影响后,某一变量与另一变量间关系的有无和大小。根据控制的变量的数目,可以将相关分为:一阶段相关、二阶段相关、三阶段相关等等。 偏相关分析的要求:
-1到 1。偏相关系数用符号rXX在r下标点前面的是欲测偏相关的两个变量的名称,点后面是控制变量的个数与名称。例如,rXY
与Y的偏相关。为了简便起见,我们常把变量编号表示成如x1、x2、x3
的顺序号表示即可,例如用r12
一阶相关的偏相关系数:r123345表示控制XXX表示,Z表示控制变量Z后,变量X的形式,这是偏相关系数中的变量符号仅用变量x3
、x4、x5后,变量x1与x2的偏相关。 ,式中的r12、r13、r23分别表示两个变量x1与x
2、x1与x3、x2与x3=人大09名)。实际上它是偏相关系数的一个特例,即控制变量