0 v- o/ Q& h& X6 C n c 这要看,你问的是智商这个词,还是智商这个词所代表的意义。
6 a6 M/ `, U' J" W& b8 E
如果你问的是智商这个词,也就是我们常说的那个缩写“IQ”,那么一句话就能解答,是由德国心理学家威廉·斯特恩(William Stern, 1871~1938),在其著作《智力测验的心理学方法》(The Psychological Methods of Testing Intelligence)中,基于德语单词 Intelliligenzquotient所提出的。
( {7 h* v( J, t7 F* ]! n& T- U
如果你问的是智商这个词所代表的意义,那解释起来就麻烦了。
`- p! I, V2 ]% V$ k7 m6 ^) ?: Z 先驱者高尔顿
. m" R1 c( |0 m4 Q/ u# b5 `
“智商”这个概念的出现是为了定量评估人类智力,无论有没有“智商”这个概念的出现,人的智力都是天然存在的,智商只是通过一种定量方式将人类的这种能力表述出来。
2 W* r9 H/ x" P# t; p
有记录的最早对人类智力进行测量的是英国学者弗朗西斯·高尔顿(Francis Galton, 1822~1911)。
2 | `, j* s7 `2 w0 [. }
弗朗西斯·高尔顿(Francis Galton, 1822~1911)他是达尔文的表弟,智商爆表,传说1岁能认所有的字母,不到3岁就能阅读,4岁能写诗,6岁熟读荷马史诗,7岁开始学习博物学,17岁进入国王学院学习医学、生理学、植物学和化学,他的研究领域包括植物学、动物学、人类学、地理学、数学、力学、气象学、心理学、统计学等领域,且哪个拿出来都很能打。
3 a6 i. x2 a& o9 n: E8 J. t 不仅如此,这哥们儿是个分类狂,7岁开始学习博物的时候就开始按照各种特征给各种矿物啊、植物啊什么的进行分类。
8 j( F- E2 |) Y! ?3 b7 {5 U
要把分类做的更好,精准测量各种特征是第一步。
4 T3 k# N z: w+ A4 z) C- ] 只要有可能,他都想量一量,量身高,量指纹,量人的眼睛的颜色……
# J8 `+ |$ T: P& Q! Q 1884年,高尔顿的人体测量实验室用于统计人眼颜色的工具,于伦敦科学博物馆 量着量着,一不小心就发现了一个向平均值回归的定律,就成了现代统计学的先驱之一。
; }$ J* K; a4 t* M2 Y" n 后来,他开始对人类不可见的智力下手了,他开始尝试各种手段,例如头部大小、反应速度等可见特征对人的智力进行定量描述。
, t: n' U7 H/ X2 K" w1 K3 S( u0 L
以我们今天的视角,这个试验显然不可能成功。
. c* E) [2 I; y 结果也确实如此,后来他放弃了,转而对人种进行测量和分类,创立了一门学问叫做“优生学(eugenics)”。
' x9 w8 K. D" p; i3 h
他的同胞和后继们本着这种严谨细致的精神一路走下去,又是一不小心就走向了另一条邪路。
& p: v$ o- l7 d9 W3 n
纳粹用于测量和区分人种的工具你猜,二战时,纳粹定义什么是雅利安人、犹太人等人种的方法,最早的源头是哪里?
; E: G s2 ?: I; ]0 V; |
回来,继续说智商的测量。
1 L5 u6 `6 ]% B: b5 l$ H, H) R
高尔顿定量描述智力的尝试没有成功,是因为他的假设有问题——智力跟人类可见特征的关系,并没有明确的关系。
' M) s! N9 `, C$ ^2 _
第一个成功者,比奈
- l, r% v& k: m/ N. d3 R- B
最早在测量智商领域挑战成功的,是法国人阿尔弗雷德·比奈(Alfred Binet, 1857~1911)。
7 b$ L$ g! q$ k' I% e 阿尔弗雷德·比奈(Alfred Binet, 1857~1911)他采用了比较线段长短、重复数字、语言等这些显然与认知能力有关的行为结果作为测量对象,作为智力的表征。
- Q+ A4 Z t, P) {) {( d, [
不过这时的智力测验与我们现在通常理解的智商测验还不一样,编制它最初的目的是为了诊断幼儿的智力缺陷,从而为这类儿童提供特殊的教育。
, {4 Z+ w. `) x! _2 {, h( p
他成功了,这个测验很快得到推广和应用。
$ b& I! }( q; I1 H2 d! L3 x 再后来,在他的学生泰奥多尔·西蒙(Théodore Simon, 1873~1961)的协助下,比奈开始对自己的量表进行修订,使其不仅能应用于特殊儿童群体,也可以测量正常儿童的智力水平,这套量表,叫做“比奈-西蒙智力测试(Binet-Simon intelligence test)”。
B9 k% T. Q7 b5 f6 m% h8 H0 a+ e
智力测验的广泛应用
0 c- e5 D4 N9 J
历史总是惊人的相似,法国人逆袭德国人成功,总得有点儿美国人的影子。
. L! s0 l, e6 s( D9 h3 e 20世纪10年代,比奈-西蒙量表被引入美国,斯坦福大学心理学家刘易斯·特曼(Lewis Terman, 1877~1956)对比奈-西蒙量表进行了修订改编,使其不再局限于测量孩子的智商,也能测量成人的智力水平,并能在美国进行大范围应用。
- ~ g6 g3 g; J 刘易斯·特曼(Lewis Terman, 1877~1956)同时,这项工作也是为了他哪项雄心勃勃的,人类心理学历史上最早也是持续时间最长的研究“特曼资质研究”做准备。这项研究同时也开创了心理学研究中一个垂直细分领域,极端人才的心理学研究(Psychology of Extreme Talent)。
w/ D$ H( R! o2 ]$ c6 b% M6 t
特曼研究所针对的人群与比奈最初的研究方向恰好相反,它瞄准了人类幼崽中最有天赋的那个群体,将其鉴定出来,进行观察或进行特殊培养,以其能创造普通人无法做到的突破和奇迹。
) Q1 [/ p7 c2 d; V) E 有关这个实验的故事我写在这里:
2 N" N) T7 {" B; C- ]7 Y/ w
( c5 f' X+ s1 E6 x! r
! }/ Y; D& p* ^- |4 S6 k6 n
这项研究在二战和后来的冷战时达到高峰,美苏皆有类似的计划,走火入魔时,他们甚至开展了不少针对特异功能人士的研究。这是另一个故事,这里我们主要讨论特曼为这些研究所开发的测验。
2 v: `6 e- |. d) o$ y, D$ Y
1916年,特曼出版了“比奈-西蒙量表的斯坦福威力加强版以及其使用说明和指南(An Explanation of and a Complete Guide for the Use of the Stanford Revision and Extension of the Binet-Simon Intelligence Scale)”
8 l; N1 s. ?/ h" Q 这套智力测验叫做“斯坦福-比奈量表(Stanford–Binet Intelligence Scales)”。
4 @, v9 j! d$ _: c( v 特曼非常大度,他没有把自己的名字写在量表名字里,而是用了自己学校的名字。至于原始量表的第二作者泰奥多尔·西蒙,大概是因为特曼觉得名字里一下塞三个名字有些浮夸,也就帮西蒙大度了一下,直接去掉了。
& b* W) \: `$ Q& y# B" L 好,到这里先总结一下,这里有很多细节,别看我写的时候很简单一笔带过。你细细品鉴一下,会发现其中细节非常复杂。
- p4 d" ^$ }; d, Q8 v- a3 B+ q! h
例如,从检测智力缺陷儿童到所有儿童均可以使用。
6 m" ^; N9 N( T, I3 g
对前一个“检测智力缺陷”这个目标,我只需要确定一条“正常水平线”,然后找到那些偏离正常水平太多的人群,定义出“智力缺陷人群”,任务就完成了。
8 P' A* b- f. e3 L. t! @* T
后一个“检测所有儿童”就麻烦多了,不仅要向下界定智力缺陷,还要向上确定智力优秀群体,而且不仅要定性,还要定量看出优秀的程度。
1 W' N3 t @. T
还有一个麻烦的问题,孩子的认知和思维发育是极快的,一套智力测验测30岁的人和20岁的人不会有太大问题,可能给一个3岁孩子做的测试,很有可能在2岁的孩子眼里完全不知所云。
2 t* G# N2 S7 ]+ P$ B# l8 Y* {
比奈的方式是,每个年龄阶段设置一套题目,每个年龄段用各自的测试,测出来的结果叫做“智力年龄(mental age)”,简称志玲。
+ h; q4 D; R! @! [* N2 m 例如一个5岁孩子完全做完了5岁的题目,叫做5岁生理年龄(chronological age)5岁智龄,如果做完了6岁的题目,就是5岁年龄6岁智龄。
) y( i, a2 B8 F I u 这表述方式,实在太让人难以理解了。
' G7 ]2 C: F. I; ~+ Z1 b g 于是本文最开头那位,德国心理学家威廉·斯特恩说,要不我们把心理年龄和生理年龄除一下吧,不就拉成同一个参照系了吗?
9 k; k# V8 n& h$ Q; ~+ l
于是乎,你看,操作方式是心理年龄除以生理年龄,除法,得到的结果叫做商,于是智商这个概念就诞生了。
9 y/ [* F# U0 O, ^2 x 由此,5岁年龄5岁智龄,智商就是1;5岁年龄6岁智龄,智商就是1.2,是不是就能很方便的比出优劣了?
d2 _! B9 j! e 后来特曼在修订斯坦福-比奈量表的时候,又觉得这样比总是带个小数,看上去很是麻烦。于是他说要不咱就保留两位小数再乘以个100吧。
6 i! R# l( J/ V9 |4 p6 `
智龄智商的计算公式5岁年龄5岁智龄,智商就是100;5岁年龄6岁智龄,智商就是120,你看,咱们今天常见到的智商的形式不就诞生了?
) q2 E+ O2 Z D3 x j2 H; S
别急,这套方法操作虽然是标准字面意义上的智商,展现形式也和我们今天看到的智商分数水平很是相似,但还不是我们今天普遍意义上的智商概念。
! `, P9 m4 N, I4 w, k
不知是否有小伙伴发现,我前文中一直都在用“智力水平”这个名词,直到这里才用上“智商”这个概念,是因为严格意义上讲,智力水平的表示方法也只有在此时能被称为智商。
% @: h$ E' V& l, h7 f6 o/ _
而且,“标准的”智商概念,也就适用于这十几年间,在其后,虽然智商这个叫法被延续下来,实际上,已经完全没有那个商的概念了。
2 e* X- K, i" a5 ^9 n6 [; u/ Y' b “离差智商” 一统江湖
/ ^ Y. E4 z7 F
继续沿着斯坦福-比奈量表的故事往下讲。
* D# T8 f Q" ?! P" G% ?" O; Z8 D$ u8 R 1937年,特曼针对自己开发的斯坦福-比奈量表又进行了一次大规模修订,这次修订的幅度基本上相当于完全重构了一遍代码,除了名字还一样,其中的内容已经找不到太多初版的元素。
" ~ g+ X. e& i$ R0 c0 z% |; m
重构这种工作,不到迫不得已,基本没人愿意做,而且要做,通常原因是底层逻辑出了问题。
) q3 e" i& J3 Q0 g7 `' ]+ W# q
事实也确实如此,斯坦福-比奈量表无论怎么修订,都无法绕开最初开发它的目的“区分智力缺陷儿童”这个紧箍咒。
) b# `1 O6 k3 s/ K2 m) y 哪怕进行了重构级别的修订,这一版量表仍然受到了学界的质疑。
# B$ U) l* n* E: Y$ D
其中音量最大的,是一位名为大卫·韦克斯勒(David Wechsler, 1896~1981)的罗马尼亚裔美国心理学家。
& R1 u+ X% F7 T& J3 d5 Y0 q6 n
大卫·韦克斯勒(David Wechsler, 1896~1981)他提出的问题包括但不限于:
比奈量表的开发针对的是儿童,其对于成人智力测量的有效性,是非常值得怀疑的。(这个前文中我已反复讲到) 计算智商时所用的“智龄”这个概念,完全是一个人为制造的概念,它的定义,也是非常值得推敲的。例如,智龄以什么间隔区分合适呢?1岁?半岁?一个月?20岁和30岁的成人智力水平不会有太大差异,那么这个智龄应该算20岁还是30岁呢? 比奈量表用了一个综合的总分界定了人的智力水平,这一个单一总分能否完整解释一个人综合的智力情况呢? 在进行测量时,比奈量表的操作涉及不少需要语言理解的任务,例如让孩子补充没有说完的句子等,那对于语言的理解水平是否会影响被测者的智力水平测量的表现呢?是否应该讲关于语言的智力和“一般智力因素”进行区分呢? 提出这些疑问的学者,韦克斯勒绝对不是第一个,可几十年来比奈量表仍在智力测验中占据绝对权威的地位,是因为这些问题大家都知道,却没人有太好的办法解决。
; R7 `2 ^( O# a8 N y4 { 韦克斯勒倒是头铁,撸袖子就上了,他没有像前人那样围绕着比奈体系进行修修补补,而是从hello world开始重建了一套测量体系。
t3 y- D, i1 c v 1939年,他发表了一套新的智力测量体系,韦克斯勒-贝尔维尤智力量表(WAIS),也就是我们常说的“韦氏量表”。
8 {& q. i/ d+ f/ C& {/ ^# t 咱实打实的说,韦克斯勒喷比奈量表的那些问题,其实他自己也并没有完全解决。
6 \, Q8 I6 d7 E# p: | 比如说,韦氏量表仍然无法实现针对所有人群使用同一个测量体系,最终结果也仍然有那个综合总分等等。
; b/ _. d2 a5 D4 U 不过,韦氏量表在心理测量学发展历史上的地位是毋庸置疑的,其重要性主要表现在以下三个方面:
4 m% V+ Y! P' P$ q: N 首先,这套量表彻底摆脱了比奈体系最初以临床目的构建这个桎梏。
0 h0 r3 A; u* t1 B
然后呢,在这套量表中,韦克斯勒引入非语言类测试,也就是我们今天常见的那类“智商测试”题目的形式。
; R! M' T4 V, {0 @, F# T- n" }
# M+ {* K) W1 q U- Z' F
' e" x4 v" T" @8 `8 N8 j- F 韦氏量表非语言测试的题目类型这类题目,不需要被测者具有语言能力,跨语种依然适用,比起比奈体系,操作也简单了不止一个量级。
, I$ y7 N& A; n6 r4 |5 E 有一些智力测验专门以这种非语言测试为主,例如著名的瑞文推理测验(Ravens Progressive Matrices)。
8 q! Y1 ^2 i {$ s+ I. z+ i' c
经过几次改版后,它迅速流行开来,成为现在世界上流行程度最高的智力测量体系。
% @) D* }5 ?. y9 U 当前最新的韦氏智力量表为WAIS-IV(相应的儿童智力量表现在是第五版WISC-V,本文不展开讨论),由10个核心分量表和5个补充分量表组成。
8 B) S3 h k' \4 H% x2 E 其结果包含四个主要智力指数,分别为:
语言理解指数(VCI) 知觉推理指数(PRI) 工作记忆指数 (WMI) 处理速度指数 (PSI) 也可以得出两个综合分数,分别为:
全量表智商:Full Scale IQ (FSIQ),即10个核心分量表分数的综合。 一般能力指数(GAI):即仅计算VCI和PRI两个指数所包含的6个分量表的分数综合。 与今天这个话题关系最密切的,是韦氏量表所采用的“离差智商(deviation IQ)”的计分方式。
4 ^/ J% C$ Z5 d6 l7 J 这个是个什么意思呢?
, W @! C) k- C6 \( x8 A9 H: x
我们知道,人类智力水平是符合正态分布的,符合正态分布,就能用平准数+标准差的方式标记出被测者处于人群中的位置。
5 o0 _/ Y2 v% x8 Y9 \% V6 M% I. ]% U. |
例如,得分高于平均水平一个标准差,就可以说被测者得分在人群中处于84.1%的水平。
7 `4 w# r8 a5 u0 a 直接以平均数±标准差来表示,心理测量学里面叫做“z分数(z-score)”,也叫“标准分(standard score)”
- Q6 w. X' U N5 P, \/ k, J0 q( J 正态分布与标准分如果以100分为平均分,15分为标准差,就是韦氏量表分数的计量体系了。
# H: B( j; B* J0 j( B4 v3 [- @' d z分数、IQ分数与百分位的关系那个“离差智商”中离差二字,你可以理解为“偏离平均分多少个标准差为计量依据”的缩写。
7 L! `5 _" ]8 s. U: Z4 V. N: j6 I. x+ k9 H) N 再顺带提一嘴,如今我们非常熟悉的标准差这个统计学概念的诞生,本文开头提到的那位先驱者高尔顿也是功不可没。
2 V. U6 [* C% v 讲到这里,你会发现,这“离差智商”只是一套分数解释体系,而非一种全新的测量方法,理论上,它可以适用于所有的智商测验。
, y R& h# Y0 U$ s" ~
比起比奈体系那种分年龄段进行解释的框架,离差智商具有连续、精确、适用性广、解释方便、不需要引入“智龄”这种人工概念等等诸多优点。
0 A; e# K0 }: U9 J" A 于是理所当然的,离差智商成为了今天几乎所有智商测验的通用解释依据,其中也包括最新版本的斯坦福-比奈量表第五版。
# |5 B) r7 v& d* }5 Q" U- Z( Y$ \ 斯坦福-比奈量表这个故事最终的结局,是离差智商这个解释体系最终一统江湖。
$ w" R- \9 r* l9 N4 J; k1 _8 s 关于什么是智商,智商应该包含哪些方面的争论从未平息,各种测量智商的方法和手段更是层出不穷,唯一可以确定的是,最后它们差不多都要用这套标准来对自己的分数进行定义。
% v/ l' t, i8 D( G0 P* P8 W
同时,由于不再需要引入智龄的概念,智商这个词中“商”这个概念,也就名存实亡了,至今我们还这么叫,完全是因为叫习惯了,也就没必要再改。
+ y# h. W2 b. A+ P8 U8 x$ c3 J8 U) J
就像马路虽然叫马路,但你也没看到上面跑马,不是么。
( `% x0 N/ ]' G5 }* `1 I* u