经济增长与税收收入增长的相关性分析.docx
《经济增长与税收收入增长的相关性分析.docx》由会员分享,可在线阅读,更多相关《经济增长与税收收入增长的相关性分析.docx(11页珍藏版)》请在冰豆网上搜索。
经济增长与税收收入增长的相关性分析
江西财经大学
2010 ~2011 学年第二 学期期末考试
论文题目:
我国地区经济增长与税收收入增长的相关性分析及对策研究
课程编码06452选课班A01
课程名称税收统计任课教师涂雄苓
62 学号0082261姓名刘起辉
学院金融与统计学院专业统计学
考试时间2011年6月9日星期四
江西财经大学2010~2011第2学期课程论文考试评分表
课程名称及代码:
06452提交时间:
6.9
学生姓名
刘起辉
学号
0082261
成绩
学院
金融与统计学院
任课教师
涂雄玲
题目
我国地区经济增长与税收收入增长的相关性分析及对策研究
项目
评分点
评分理由
得分
选题
(0~10分)
价值
难度
论点
(15分)
确定性
新颖性
论据
(30分)
阅读范围
调研观察
资料运用
分析推理
结论
(15分)
合理性
说服力
写作
(30~40分)
结构
表达
规范
注:
教师提供选题者,选题项不予评分
任课教师:
基于支持向量机的税收预测模型的研究
摘要:
针对税收收入预测不稳定、非线性、动态开放性的特点,提出了支持向量机(SVM)的税收收入预测方法,并将该方法用于某市国税系统的实际税收收入情况进行预测,和传统回归方法比较说明所提出的税收收入预测方法是可行和有效的。
关键词:
支持向量机;税收;预测
ForecastingmodeloftaxbasedonSVM
Abstract:
Becausethetaxforecastingisanuncertain,nonlinear,dynamicandcomplicatedsystem,itisdifficulttodescribesuchanonlinearcharacteristicsofthissystembytraditionalmethods,sothetaxforecastingisnotaccuratelyforecasted.Anoveltaxmethodispresentedinwhichanimprovedsupportvectormachines(SVM)algorithmisapplied.Applyingthepresentedmethodtoactualtaxforecasting,thecomparisonamongtheforecastedresultsandthetrueshowthatthepresentedmethodisfeasibleanddefective
Keywords:
supportvectormachines;tax;forecasting
引言
税收预测就是以充分掌握影响税收收入变动的因素和税收历史资料为基础,以统计方法、数学方法为手段,经过严密的推理和计算,对未来税收收入的前景做出比较确定的判断的一项科学管理工作。
其目的在于推测和预见税源、税收和税务工作未来的发展变化趋势。
因此,税收预测工作对于加强组织收入工作,更好地完成税收任务,为领导的科学决策和管理提供服务等,都具有重大意义。
目前,估算税收收入方法主要有因素计分法、因素回归法、系数调整法和人工神经网络方法等。
由于这些方法有的适用于大范围、多样本数据的处理,有的适用于较模糊情况的处理,有的则适用于一些不可比事件的量化处理。
在实际情况中,必须进行深入细致的定性与定量分析,选择最适合税收特点的计算方法和模型方法。
2O世纪7O年代,Vapnik等人提出统计学习理论,并用其研究有限样本的机器学习理论,为有限样本尤其是小样本情况下机器学习提供了有力的理论依据,到2O世纪9O年代中期,随着其理论的不断发展和成熟,也由于神经网络等学习方法在理论上缺乏实质性进展,统计学习理论开始受到越来越广泛的重视,并在此理论框架下产生了支持向量机(supportvectormachine,SVM)这一新的通用机器学习方法。
目前,SVM已经在模式识别中取得了良好的应用效果,广泛应用于文本识别、语音识别、人脸识别。
近年来,人们又发展了回归型支持向量机,它可以任意精度逼近非线性函数,具有全局极小值
点,收敛速的快。
与人工经网络方法相比,SVM不存在容易陷于局部最优等问题,并且提高了泛化能力,因此有较大的优越性。
针对税收收入预测的特点,时间、GDP等多重因素对税收收入的影响一直制约着预测精度的提高,本文根据XX市国税系统税收特点,提出了基于支持向量机(SVM)进行税收收入预测,为税收分析提供了新思路。
支持向量机(SVM)的基本原理
1SVM的基本思想支持向量机(SVM)的基本思想是通过用内积函数定义的
非线性变换将输入空间变换到一个高维空间,在这个高维空间中寻找输入变量和输出变量之间的一种非线性关系。
SVM有严格的理论基础,是基于结构风险最小化原则的方法,明显
优于传统的基于经验风险最小化的常规神经网络方法。
其算法是一个凸二次优化问题,保证找到的解是全局最优解,能较好的解决小样本、非线性、高维数等实际问题,问题的复杂度不取决于特征的维数,且具有良好的推广能力,正在成为继神经网络研究后的研究热点。
2改进的SVM算法对于训练样本集(x,y)∈为输入变量的值,YER为相
应的输出值,1为训练样本个数,回归问题就是寻找一个从输入空间的输出空间的映射:
一,使得)=y。
SVM的目标是寻求回归函数
(1)
y=)=·+6作者简介:
常青(1970一),女,山东青岛人,硕士,高级工程师,研究方向为数据挖据;刘强,副教授。
收稿日期:
2006-03-08E-maihcq05@mails.thu.edu_c玎
维普资讯
一
l653—
—
1654一
式中:
∞∈——权重、z∈一样本输入值;6∈R——阈值。
对于线性问题,根据统计学习理论,SVM通过极小化目标函数来确定回归函数,即
Min(丢l∞l+C·(善l()
(2)约束条件为
(1)多项式核函数J)=’.1)1,2,⋯(14)
(2)径向基(radialbasicfunction,IF)核函数K(x,y)=exp(~)(15)
(∞·)+6)一≤一(∞·J+6)≤(4)
≥O,s≥O(5)式(2式(5)中:
旷一平衡模型复杂项1lJ∞f和训练误差
项的权重参数;不敏感损失函数。
己——松弛因子。
对于约束条件,我们引入相应的乘子aa,7,≥O,根据拉格朗日算法,得出下式
(∞,6,a,,己“,s,7,7‘。
):
l∞l+Co砉(《)一一∑(叩叩)一∑a,(一(∞-一6+s)一∑a(+(∞’五)+6一+s)(6)
为了最小化式
(2),需要求出式(6)的鞍点,也就是最小化变量∞,s,b,己并且最大化变量aa礁,7,。
因此可以得到以下
4个方程
∞=∑(a一a)(7)C·0一∑(a—)一=O(8)∑一a):
O(9)
导一a一,7’)_o(1o)求解上述问题,我们将得到SVM的回归函数
)=∑一a)(-+6(11)
对于非线性问题,可以通过非线性变化将原问题映射到某个高维特征空间中的线性问题上进行求解。
在高维特征空
间中,线性问题中的内积运算可以用核函数来代替,即K(x,xj)=cp(x)((12)
核函数可以用原空间中的函数实现,没有必要知道非线性变换的具体形式。
因此非线性问题的回归方程为
.,)=∑:
一aJ+6(13)
2基于支持向量机(sVM)的税收预测模型
2.1税收收入影响因素的确定由于税收收入预测与很多因素有关,为了弄清楚系统中
各因素的内在联系及其发展规律,本文采用灰色系统理论对影响税收收入的有关经济指标进行优化选择,利用灰色关联分析方法对税收收入的影响因素进行定量分析和宏观因素的筛选,评估税收收入中诸多因素的作用,寻求未来发展中
值得注重的因素。
灰色关联分析是根据因素发展态势的相似或相异程度来衡量因素间的关联度,是动态过程发展态势的量化分析。
2.1.1确定特征序列和因素序列
表1是某市194年~2004年相关经济指标数据,设税收收入为特征行为序列,根据影响因素的大小,资料的可比性及预测模型的要求等原因,选择以下9个指标:
第一产业增加
值、第二产业增加值、第三产业增加值咒、工业增加值、财政支出、固定资产投资总额、全国城乡储蓄存款年末余额、社会消费品零售总额墨、进出口总额蜀作为相关因素序列进行灰色关联分析。
这些指标中,有直接影响税收收入水平的三次产业发展状况的指标,如第一、二、三产业增加值,有直接或间接反映税收规模大小的指标,如进出口总额、固定资产投资总额;有反映人民生活水平和直接影响税收总量增长状况的指标,如社会消费品零售总额;有反映税收增长与经济发展相互关系的指标,如全国城乡储蓄存款年末余额等。
2.1.2数据初始化
模型建立过程中,由于指标的量纲不同,数据在数量上差异性很大,无法进行关联计算,需要对各指标的数据进行归一
—~
税收收入,亿元第一产业增加值,亿元第二产业增加值,亿元250.34第三产业增加值,亿元185.45
328.49248.90289.9l
I95.64145.94746.97607.27680.96478.25124_39
工业增加值,亿元2l9.50固定资产投资总额,亿元l78.50
524.12578.23384.41l09.78
财政支出,亿元全国城乡储蓄存款年末余额,亿元社会消费品零售总额,亿元进出口总额,亿美元
27.7336I.06l39.758.86
37.7064.96477.79594.13170.76l94.59l30.75l3.93
l079.891304.48352.840.49
301.20228.60265.80214.O02l0.0
3382.0l298.72340.002l0.2056.48650.88
(3)sigmoid核函数(3)-tanh[b··.y)+(16)
根据支持向量机回归函数的性质,只有少数(a~-a)不为化处理,本文采用初值化算子对数据进行归一化。
零,这些参数对应的向量成为支持向量,回归函完全由2.1-3计算灰色关联度其决定。
根据灰色关联度计算步骤,经过运算,得出税收收入与
目前人们构造了lO多种核函数,其中常用的有如下几种:
的关联度分别为表1194年~204年XX市相关经济指标数据
——
塑l9446_3O84.97
19555.O9Il2.23
l96l97l9864.0I79.6484.94
l32.8lIl6.97140.40
l99Io3.O3137_36472.20383.27420.70278.9574.09894.57
2002ol2o2
158.63I78.62l39.8143.2560.0l648.74
2o3252.76147.5l937.2l695.70825.52739_38147.12908.475l2.2408.8l
2O04336.32l6I.80I17I.40830.60l024.101025.40146.06l089.49605.50269.88
413.76334.24366.87242_3067.86723.922l6.18242.03270_3l54.23l46_37l69.65
450.185o_32321.1387.87956.43307.70252.40279.7l3l2.80
维普资讯
(下转第1694页)
获历时较平时长,超过了通信程序设定的出错等待时间,导致通信失败。
于是加长了上、下位机通信程序的延时时长,并经过调试、使用,达到了较好的可靠性、较高的成功率,满足了应用的需求。
参考文献:
【1]吕捷.GPRS技术【M】.北京:
北京邮电学院出版社,201.51.53.63-7O.
【2]摩托罗拉工程学院.GPRS网络技术【M].北京:
电子工业出版社.2005.60—70.
【3】程起敏,杨崇俊,刘冬林,等.基于WebGIS/GPS/GSM的车辆监控网络信息系统【J】.计算机工程,205,31(7):
46-48.
(上接第1654页)
yo1=o.751154,y02=0.859695,∞=0.822426,yo4=0.81476,yo严0.773486,0.8l1631,=o.74093,y佣=O.770255,y呻=O.706483
由于>.>.>.>.y蚰>.yo>.y们>.y呻,影响XX市国税税收收入的主要经济因素依次为:
第二产业增加值、第三产业增加值、工业增加值、固定资产投资总额、财政支出、社会消费品零售总额、第一产业增加值、全国城乡储蓄存款年末余额、进出口总额。
2.2税收收入预测模型的建立由于税收收入预测与很多因素相关,假设置∈为影响税
收收入的因素,为税收收入预测值(卢1,2,⋯曲。
根据支持向量
机理论,税收收入预测模型的建立也即寻求如下的表达式成立I
∑一+6l
式中:
影响税收收入预测的因素;广个样本中的第i个样本;K(x,x核函数,可在式(14式(16)中选择。
然后利用Matlab的优化工具箱求解支持向量机的二次规划问题。
文中选取XX市194年-2004年的税收统计,根据灰色关联分析结果,以税收值为预测指标,第二、三产业增加值、固定资产投资总额、进出口总额为输入指标,把1994年-1998年的数据为训练样本,199年-203年的数据为测试样本,通过对各种核函数的测试,最终选择RBF(径向基)核函数,由式(7式(1O)解得,a,b,即可得到支持向量机的税收收入预测模型。
训练结束后的支持向量机模型必须经过测试集的评定,以此来控制该模型的预测性能。
本文用199年一203年的数据评价预测结果,将预测值与实际值进行比较。
预测结果及误差分析如表2所示,计算值与实际值很接近,说明该方法应
表2基于支持向量机(SVM)模型预测的税收收入结果
Regis(Bud)JBates.GPRS:
Generalpacketradioservice【M].NewYork:
McGraw—Hil,2001.131.149.
王庆刚,杨佃福.GPRS技术在嵌入式系统中的应用【J】.微计算机信息,205,(5).69.70.韩斌杰.GPRS原理及其网络优化[M̈匕京:
机械工业出版社,2003.25-53,81-147.
胡峪,刘静.VC++高级编程技巧与示例【M].西安:
西安电子科技大学出版社,201.98.131,132.21.
DavidMDikel揿件架构组织原则与模式【M1=.北京:
机械工业出版社,2002.1.24.
全茜,郑雪峰.基于GPRS的电力线路监控系统【J】.计算机工程与设计,2005,26(11):
3053.3055.
用与于税收收入预测是可行的。
因为SVM算法的计算结果稳定,不像一般算法具有一定的随机性,而且SVM算法不会
陷入局部最优值,用于税收收入预测具有一定的优势。
3结束语
税收收入预测受很多因素的影响,很难在税收收入和这些因素之间一种确定的数学模型。
一方面,这种关系是一种非常复杂的非线性关系;另一方面,税收收入预测还与具体的因素有很大的关系。
本文基于灰色系统理论的灰色关联分析方法确定了影响税收收入的经济指标中的主要因素和次要因素,并根据评价结果,优化选择输入指标,建立基于支持向量机(SVIv|)税收预测模型,对税收收入预测的探索取得了较为满意的结果。
从预测结果可以看出该方法预测的准确性,说明该方法进行税收收入预测时,相对传统的回归方法对数据有更好的容错性,能保证快的收敛速度和高的计算精度,且解收敛于全局最优,使结果更接近于真实值。
该方法用于税收收入中的预测是可行。
参考文献:
·——
1694·—
年年份实际值SVM预测值1999103.03102_37
200o158.63127.6020o1178.62155.822O02195.64198_3020o3252.76255.34
误差.0.776
.19.56.12.761_361.02
【1】
【2】【3]
[4】【5][6][7]【8】
中国国际税收研究会课题组.当代税源管理新论【M=I.北京:
人民出版社,2004.
张学工.统计学习理论的本质【M】匕京清华大学出版社,200.邓乃杨,田英杰.数据挖掘中的新方法一支持向量机【M].北京:
科学出版社,2004.235.243.刘思峰,党耀国,方志耕,等.灰色系统理论及其应用【M】.第3版.北京:
科学出版社,2004.刘广利,杨志民.一种新的支持向量机预测模型【J].吉林大学学报,2002,23(3):
28-31.许建华,张学工,李衍达.支持向量机的新发展【J].控制与决策,2040,19(5):
4814-84.
徐夫田,葛邦春.基于范例推理的税收案例分析系统设计【J].计算机工程与设计,205,26(12):
310.312.惠守博,王文杰.基于支持向量机的财务预警模型与应用研究【J】.计算机工程与设计,206,27(7):
183。
186.
维普资讯