r+r*t*t与-1的关系
Key:
我想的办法只能是尝试:
原式=r(1+t*t)恒小于零
1)r-1,t0则原式-1
2)r-1,t-1则原式-2
3)r0,t0则原式0
例如:
r=-0.9t=-1/3时,原式=-1,若此时-0.9-1.
11:
有长方形4feet*8feet,长宽各截去x inch,长宽比2:
5,
解答:
列出方程:
(4*12-x)/(8*12-x)=2/5
=>x=16
概率论部分
1.排列(permutation):
从N个东东(有区别)中不重复(即取完后不再取)取出M个并作排列,共有几种方法:
P(M,N)=N!
/(N-M)!
例如:
从1-5中取出3个数不重复,问能组成几个三位数?
解答:
P(3,5)=5!
/(5-3)!
=5!
/2!
=5*4*3*2*1/(2*1)=5*4*3=60
也可以这样想从五个数中取出三个放三个固定位置
那么第一个位置可以放五个数中任一一个,所以有5种可能选法,那么第二个位置余下四个数中任一个,....4.....,那么第三个位置……3……
所以总共的排列为5*4*3=60
同理可知如果可以重复选(即取完后可再取),总共的排列是5*5*5=125
2.组合(combination):
从N个东东(可以无区别)中不重复(即取完后不再取)取出M个(不作排列,即不管取得次序先后),共有几种方法
C(M,N)=P(M,N)/P(M,M)=N!
/(M-N)!
/M!
C(3,5)=P(3,5)/P(3,3)=5!
/2!
/3!
=5*4*3/(1*2*3)=10
可以这样理解:
组合与排列的区别就在于取出的M个作不作排列-即M的全排列P(M,M)=M!
,
那末他们之间关系就有先做组合再作M的全排列就得到了排列
所以C(M,N)*P(M,M)=P(M,N),由此可得组合公式
性质:
C(M,N)=C((N-M),N)
即C(3,5)=C((5-2),5)=C(2,5)=5!
/3!
/2!
=10
3.概率
概率的定义:
P=满足某个条件的所有可能情况数量/所有可能情况数量
概率的性质:
0<=P<=1
1)不相容事件的概率:
a,b为两两不兼容的事件(即发生了a,就不会发生b)
P(a或b)=P(a)+P(b)
P(a且b)=P(a)+P(b)=0(A,B不能同时发生)
2)对立事件的概率:
对立事件就是a+b就是全部情况,所以不是发生a,就是b发生,但是,有一点a,b不能同时发生.例如:
a:
一件事不发生
b:
一件事发生,则A,B是对立事件
显然:
P(一件事发生的概率或一件事不发生的概率)=1(必然事件的概率为1)
则一件事发生的概率=1-一件事不发生的概率...........公式1
理解抽象的概率最好用集合的概念来讲,否则结合具体体好理解写
a,b不是不兼容事件(也就是说a,b有公共部分)分别用集合A和集合B来表示
即集合A与集合B有交集,表示为A*B(a发生且b发生)
集合A与集合B的并集,表示为AUB(a发生或b发生)
则:
P(AUB)=P(A)+P(B)-P(A*B).................公式2
3)条件概率:
考虑的是事件A已发生的条件下事件B发生的概率
定义:
设A,B是两个事件,且P(A)>0,称
P(B|A)=P(A*B)/P(A)....................公式3
为事件A已发生的条件下事件B发生的概率
理解:
就是P(A与B的交集)/P(A集合)
理解:
“事件A已发生的条件下事件B发生的概率”,很明显,说这句话的时候,A,B都发生了,求的是A,B同时发生的情况占A发生时的比例,就是A与B同时发生与A发生的概率比。
4)独立事件与概率
两个事件独立也就是说,A,B的发生与否互不影响,A是A,B是B,用公式表示就是P(A|B)=P(A)所以说两个事件同时发生的概率就是:
P(AUB)=P(A)×P(B)................公式4
练习题:
1:
A,B独立事件,一个发生的概率是0.6,一个是0.8,问:
两个中发生一个或都发生的概率?
解答:
P=P(A且!
B)+P(B且!
A)+P(A且B)
=0.6*(1-0.8)+0.8*(1-0.6)+0.6*0.8=0.92
另一个角度,所求概率P=1-P(A,B都不发生)
=1-(1-0.8)*(1-0.6)=0.92
2:
一道概率题:
就是100以内取两个数是6的整倍数的概率.
解答:
100以内的倍数有6,12,18,...96共计16个
所以从中取出两个共有16*15种方法,从1-100中取出两个数的方法有99*100种,所以P=(16*15)/(99*100)=12/505=0.024
3:
1-350inclusive中,在100-299inclusive之间以3,4,5,6,7,8,9结尾的数的概率.
因为100-299中以3,4,5,6,7,8,9结尾的数各有20个,所以
Key:
(2*10*7)/350=0.4
4.在1-350中(inclusive),337-350之间整数占的百分比
Key:
(359-337+1)/350=4%
5.在E发生的情况下,F发生的概率为0.45,问E不发生的情况下,F发生的概率与0.55比大小
解答:
看了原来的答案,我差点要不考G了.无论柳大侠的推理还是那个哥哥的图,都太过分了吧?
其实用全概率公式是很好解决这个问题的,还是先用白话文说一遍吧:
某一个事件A的发生总是在一定的其他条件下如B,C,D发生的,也就是说A的概率其实就是在,B,C,D发生的条件下A发生的概率之和.A在B发生时有一个条件概率,在C发生时有一个条件概率,在D发生时有一个条件概率,如果B,C,D包括了A发生的所有的条件.那么,A的概率不就是这几个条件概率之和么.
P(A)=P(A|B)+P(A|C)+P(A|D)
好了,看看这个题目就明白了.F发生时,E要么发生,要么不发生,OK?
所以,P(F)=P(F|E)+P(F|!
E)感觉上也没错吧?
给了P(F|E)=0.45,所以
P(F|!
E)=P(F)-P(F|E)=P(F)-0.45
如果P(F)=1,那么P(F|!
E)=0.55
如果0.45=
E)<0.55
如果…………,唉,我就不说你什么了…………sigh
统计学部分
1.mode(众数)
一堆数中出现频率最高的一个或几个数
e.g.modeof1,1,1,2,3,0,0,0,5is1and0
2.range(值域)
一堆数中最大和最小数之差,所以统计学上又称之为极差.(两极的差)
e.g.rangeof1,1,2,3,5is5-1=4
3.mean(平均数)
arithmaticmean(算术平均数):
n个数之和再除以n
geometricmean(几何平均数):
n个数之积的n次方根
4.median(中数)
将一堆数排序之后,正中间的一个数(奇数个数位),
或者中间两个数的平均数(偶数个数字)
e.g.medianof1,7,4,9,2,2,2,2,2,5,8is2
medianof1,7,4,9,2,5is(5+7)/2=6
5.standarderror(标准偏差)
一堆数中,每个数与平均数的差的绝对值之和,除以这堆数的个数(n)
e.g.standarderrorof0,2,5,7,6is:
(|0-4|+|2-4|+|5-4|+|7-4|+|6-4|)/5=2.4
6.standardvariation
一堆数中,每个数与平均数之差的平方之和,再除以n
标准方差的公式:
d2=[(a1-a)2+(a2-a)2+....+(an-a)2]/n
e.g.standardvariationof0,2,5,7,6is:
average=4
((0-4)2+(2-4)2+(5-4)2+(7-4)2+(6-4)2)/5=6.8
7.standarddeviation
就是standardvariation的平方根d
8.thecalculationofquartile(四分位数的计算)
Quartile(四分位数):
第0个Quartile实际为通常所说的最小值(MINimum);
第1个Quartile(En:
1stQuartile);
第2个Quartile实际为通常所说的中分位数(中数、二分位分、中位数:
Median);第3个Quartile(En:
3rdQuartile);
第4个Quartile实际为通常所说的最大值(MAXimum);
我想大家除了对1st、3rdQuartile不了解外,对其他几个统计值的求法都是比较熟悉的了,而求1st、3rd是比较麻烦的。
下面以求1rd为例:
设样本数为n(即共有n个数),可以按下列步骤求1stQuartile:
1.n个数从小到大排列,求(n-1)/4,设商为i,余数为j
2.则可求得1stQuartile为:
(第i+1个数)*(4-j)/4+(第i+2个数)*j/4
例(已经排过序啦!
):
1).设序列为{5},只有一个样本则:
(1-1)/4商0,余数0
1st=第1个数*4/4+第2个数*0/4=5
2).设序列为{1,4},有两个样本则:
(2-1)/4商0,余数1
1st=第1个数*3/4+第2个数*1/4=1.75
3).设序列为{1,5,7},有三个样本则:
(3-1)/4商0,余数2
1st=第1个数*2/4+第2个数*2/4=3
4).设序列为{1,3,6,10},四个样本:
(4-1)/4商0,余数2
1st=第1个数*1/4+第2个数*3/4=2.5
5).其他类推!
因为3rd与1rd的位置对称,这是可以将序列从大到小排(即倒过来排),再用1rd的公式即可求得:
例(各序列同上各列,只是逆排):
1.序列{5},3rd=5
2.{4,1},3rd=4*3/4+1*1/4=3.25
3.{7,5,1},3rd=7*2/4+5*2/4=6
4.{10,6,3,1},3rd=10*1/4+6*3/4=7
9.ThecalculationofPercentile
设一个序列供有n个数,要求(k%)的Percentile:
(1)从小到大排序,求(n-1)*k%,记整数部分为i,小数部分为j
可以如此记忆:
n个数中间有n-1个间隔,n-1/4就是处于前四分之一处,
(2)所求结果=(1-j)*第(i+1)个数+j*第(i+2)个数
特别注意以下两种最可能考的情况:
(1)j为0,即(n-1)*k%恰为整数,则结果恰为第(i+1)个数
(2)第(i+1)个数与第(i+2)个数相等,不用算也知道正是这两个数.
注意:
前面提到的Quartile也可用这种方法计算,
其中1stQuartile的k%=25%
2ndQuartile的k%=50%
3rdQuartile的k%=75%
计算结果一样.
例:
(注意一定要先从小到大排序的,这里已经排过序啦!
)
{1,3,4,5,6,7,8,9,19,29,39,49,59,69,79,80}
共16个样本要求:
percentile=30%:
则
(16-1)*30%=4.5=4+0.5i=4,j=0.5
(1-0.5)*第5个数+0.5*第6个数=0.5*6+0.5*7=6.5
10.TofindmedianusingStem-and-Leaf(茎叶法计算中位数)
Stem-and-Leafmethod其实并不是很适用于GRE考试,除非有大量数据时可以用这种方法比较迅速的将数据有序化.一般GRE给出的数据在10个左右,茎叶法有点大材小用.
Stem-and-Leaf其实就是一种分级将数据分类的方法.Stem就是大的划分,如可以划分为1~10,11~20,21~30…,而Leaf就是把划分到Stem一类中的数据再排一下序。
看了例子就明白了。
ExampleforStem-and-Leafmethod:
Data:
23,51,1,24,18,2,2,27,59,4,12,23,15,20
0|1224
1|121518
2|2023232427
5|5159
Stem(unit)=10
Leaf(unit)=1
分析如下:
最左边的一竖行0,1,2,5叫做Stem,而右边剩下的就是Leaf(leaves).上面的Stem-and-Leaf共包含了14个data,根据Stem及leaf的unit,分别是:
1,2,2,4(firstrow),12,15,18(secondrow),20,23,23,24,27(thirdrow),51,59(lastrow).StemandLeaf其实就是把各个unit,比如个位,十位等归类了而已,一般是从小到大有序排列,所以在找Stem-andLeaf找median的时候,一般不需要你自己把所有的数写出来从新排序.所以只要找到中间的那个数(如果data个数是偶,则取中间两数的平均数),就是median了.这道题的median是18和20的平均值=19.大家在碰到这种题的时候都可以用上面的方法做,只要注意unit也就是分类的数量级就行了.
为什么用Stem-and-Leaf方法?
可能你觉得这样做太麻烦了,其实Stem-and-Leaf方法好处就是:
你不必从一大堆数里去按大小挑数了,按照data给出的顺序填到表里就可以了。
但是,GRE考试这样做是否值自己斟酌。
我的方法,不就是找十来个数么?
排序!
在先浏一眼数据看看大致范围,然后在答题纸上按个的写,觉得小的写前面,大的写后面,写了几个数之后,就是把剩下的数儿们,一个个的插到已写的数中间么!
注意尽可能的把数之间的距离留大一些,否则,如果某些数比较密集,呵呵,你会死的很惨的。
11.Tofindthemedianofdatagivenbypercentage(按比例求中位数)
给了不同年龄range,和各个range的percentage,问median落在哪个range里.把percentage加到50%就是median的range了.担小心一点,range首先要保证是有序排列.
Exampleforthis:
Given:
10~20=20%,30~50=30%,0~10=40%,20~30=10%,问median在哪个range里.
分析:
千万不要上来就加,要先排序,切记!
!
重新排序为:
0~10=40%,10~20=20%,20~30=10%,30~50=40%.然后从小开始加,median(50%)落在10~20这个range里.
如果觉得比较玄乎,我的方法,GRE大部分的题都可以这么搞。
0~10岁40匹ETS猪,10~20岁20匹ETS猪,20~30岁匹ETS猪,30~50岁匹ETS猪,这100匹ETS猪按着年龄排下来,你说第五十匹ETS猪的年龄落在那个范围。
(原题:
说一堆人0-10岁占10%,11-20岁占12%,21-30岁占23%,31-40岁占20%,〉40岁占35%,问median在什么范围?
)
12:
比较,当n<1时,n,1,2和1,2,3的标准方差谁大
standarderror和standardvariation(作用=standarddeviation)都是用来衡量一组资料的离散程度的统计数值,只不过由于standarderror中涉及绝对值,在数学上是很难处里的所以,都用标准方差,实际上standarderror更合理一些,它代表了数据和平均值的平均距离.很明显题目中如果n=0的话,0,1,2的离散程度应该和1,2,3的离散程度相同.如果n<0,则n,1,2,的离散程度大于后者,而0Key:
n是整数,前〉=后(n=0,等;n=-1,-2,……大于)
13.算数平均值和加权平均值
三组资料的频数分布FREQUENCYDISTRIBUTION:
1(6),2(4),3
(1),4(4),5(6)
1
(1),2(4),3(6),4(4),5
(1)
1
(1),2
(2),3(3),4(4),5(5)
其中括号里的是出现的频率,问MEAN和AVERAGE相等的有那些.
答案:
只有第二个.
mean-arithmeticmean算术平均值(1+2+3+4+5)/5=3
average-weightedaverage加权平均值:
(1*1+2*4+...5*1)/(1+4+6+4+1)=48/16=3
14.正态分布题.
一列数从0到28,给出正态分布曲线.75%的percentile是20,85%的percentile是r,95%的percentile是26,问r与23的大小.
Key:
r<23
下面是来自柳大侠的七种武器中的正态分布
15.正态分布
高斯分布(Gaussian)(正态分布)的概率密度函数为一钟型曲线,即
a为均值,
为标准方差,曲线关于x=a的虚线对称,
决定了曲线的“胖瘦”,形状为:
圖1
高斯型随机变量的概率分布函数,是将其密度函数取积分,即
(★)
表示随机变量A的取值小于等于x的概率。
比如A的取值小于等于均值a的概率是50%。
曲线为
C
圖2
如果前面看得有些头大也没有关系,结合具体题目就很容易理解了☺
1)一道正态分布:
95%〈26,75%〈20,85%〈r,问r与23的大小,答小于
解:
由图2,正态分布的分布函数F(x)在其期望a的右方曲线是向上凸的,此时
F(20)=75%,F(r)=85%,F(26)=95%,
CA
如果把曲线的片段放大就比较清楚了。
O为AB的中点。
A(20,75%)
B(26,95%)