R语言课程设计个人所得税回归分析.docx

上传人:b****5 文档编号:3629819 上传时间:2022-11-24 格式:DOCX 页数:12 大小:358.27KB
下载 相关 举报
R语言课程设计个人所得税回归分析.docx_第1页
第1页 / 共12页
R语言课程设计个人所得税回归分析.docx_第2页
第2页 / 共12页
R语言课程设计个人所得税回归分析.docx_第3页
第3页 / 共12页
R语言课程设计个人所得税回归分析.docx_第4页
第4页 / 共12页
R语言课程设计个人所得税回归分析.docx_第5页
第5页 / 共12页
点击查看更多>>
下载资源
资源描述

R语言课程设计个人所得税回归分析.docx

《R语言课程设计个人所得税回归分析.docx》由会员分享,可在线阅读,更多相关《R语言课程设计个人所得税回归分析.docx(12页珍藏版)》请在冰豆网上搜索。

R语言课程设计个人所得税回归分析.docx

R语言课程设计个人所得税回归分析

成绩:

统计计算与软件

期末大作业

大作业题目:

任课老师:

姓名:

学号:

班级:

摘要

在纳税单位的选择上,有家庭和个人两种选择方法,选择不同的纳税单位会对国家财政收入、纳税人税负造成不同影响。

目前我国个人所得税制以个人为纳税单位,按其收入类别进行划分,在进行合理扣除后乘以相应税率计征。

而在国外,一些国家允许将家庭作为个人所得税的纳税单位,具有一定的借鉴意义。

本文结合我国国情,探索个人所得税的影响因素。

当前,我国个人所得税的纳税单位为个人,针对不同类型的收入分别采用统一的扣除标准和税率,随着我国经济的快速发展,人们的收入水平也随之不断提升。

在现行的个人所得税制度下,个人作为纳税义务主体,必须按照相关税法对个人收入缴纳所得税,这就导致个人获取的实际收入会有所减少。

 

关键词:

个人所得税;回归分析;聚类分析;时间序列分析

Abstract

Therearetwowaystochoosetaxpayingunits:

familyandindividual.Differenttaxunitswillhavedifferenteffectsonnationalfiscalrevenueandtaxpayer'staxburden.Atpresent,theindividualincometaxsystemofourcountrytakestheindividualasthetaxunit,dividesitaccordingtoitsincomecategory,andmultipliesthetaxratebythecorrespondingtaxrateafterthereasonablededuction.Inforeigncountries,somecountriesallowthefamilytobetheindividualincometaxunit,whichhascertainreferencesignificance.Thispaperexplorestheinfluencefactorsofpersonalincometaxincombinationwiththenationalconditionsofourcountry.Atpresent,thetaxunitofpersonalincometaxinChinaisindividual,andaunifieddeductionstandardandtaxrateareappliedtodifferenttypesofincome.WiththerapiddevelopmentofChina'seconomy,people'sincomelevelisalsorising.Underthecurrentpersonalincometaxsystem,individualsasincometaxentitiesmustpayincometaxaccordingtotherelevanttaxlaws,whichleadstoadecreaseinpersonalincome.

Keywords:

personalincometax;regressionanalysis;clusteranalysis;timeseriesanalysis

一.数据预处理

首先,将个人所得税收表保存为CSV(逗号分隔)格式,之后用函数将数据读入到R的内存中。

为了方便之后的操作,对各列进行命名,其中NY代表年度时间,CSJMNRJKZPSR,CZDWZGNPJGZ,CZJMCXCKYE,DQSCZZ,DECYZJZ,CZFSYDWCYRYS,DFCZSR,GRSDS,YBYSSR,ZFXJJSR分别代表城市居民年人均可支配收入、城镇单位职工年平均工资、城镇居民储蓄存款余额、地区生产总值、第二产业增加值、城镇非私营单位从业人员数、地方财政收入、个人所得税、一般预算收入、政府性基金收入。

同时给出各类别下的样本量个数。

从原始数据中可知样本量为16,不是很多,如果再进行分块,可能由于样本量的限制无法得到最好的结果,因此,下文中的训练集和测试集均选用原始数据来充当。

二.建模应用:

财政收入的数据分析

2.1分类与预测:

回归分析

回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量之间的关系。

这种技术通常用于预测分析以及发现变量之间的因果关系。

本次运用了lm函数进行回归建模。

MultipleR-squared和AdjustedR-squared这两个值,常被叫做“拟合优度”和“修正拟合优度”,是指回归方程对样本的拟合程度,越接近“1”,拟合程度越高。

显然,这个回归模型的拟合优度为0.9764,拟合程度一般。

而标准化残差则可以认为是模型用城市居民年人均可支配收入、城镇非私营单位从业人员数、城镇居民储蓄存款余额、地区生产总值、第二产业增加值、地方财政收入、政府性基金收入预测个人所得税的平均误差。

各个变量的P值都大于0.05,即各个变量都显著不为零。

图1

图1为模型的回归诊断图。

左上图是残差对拟合值做图,显然残差值与拟合值就没有任何系统关系,即因变量与自变量存在相关关系;右上图为残差QQ图,用以观察残差是否符合正态分布,显然图上的点基本都落在呈45°的直线上,即残差满足正态分布;左下图是标准化残差对拟合值,用于判断模型残差是否等同方差,图上的点呈随机分布状态,故模型残差满足同方差假设;右下图是残差与杠杆图。

2.2聚类分析:

2.2.1层次聚类算法

图2

从图2可以看出,在聚类树的最下端,每个样本独自为一类,越往上,一条分支里的样本多,直至所有的样本聚为一类。

2.2.2其他聚类分析函数

(聚类概率分布)图3

(聚类结果)图4

三.时间序列分析

3.1导入时间序列对象

3.2绘制原始时间序列图

图5

由图5可见原始时间序列图呈单调递增趋势。

 

3.3时间序列检验分析

>#对序列做自相关检验

>acf(sales_time,lag.max=35)

>#对序列做偏自相关检验

>pacf(sales_time,lag.max=35)

>#对序列做单位根检验

>unitrootTest(sales_time)

ErrorinunitrootTest(sales_time):

couldnotfindfunction"unitrootTest"

>#对序列做白噪声检验

>Box.test(sales_time,lag=1,type="Ljung-Box")

Box-Ljungtest

data:

sales_time

X-squared=11.082,df=1,p-value=0.0008715

图6

图7

由对时间序列的检验分析会指出序列的自相关图,可以看出延迟2阶后自相关系数都在两倍标准差内,但时序图有明显递增趋势,且由白噪声检验P值=0.0008较小,所以该序列可以认为是非平稳的非纯随机序列。

所以可以认为个人所得税与时间的变化相关关系影响不大。

3.4ARIMA建模分析

 

3.4.1对序列一阶段差分后绘制时序图与偏自相关图、自相关图。

图8

图9

图10

结果显示,一阶差分后的序列时序图仍然有较明显的递增趋势,自相关图10阶后结尾,偏自相关图呈拖尾性,所以可以考虑用ARIMA(0,1,1)模型拟合。

3.4.2白噪声检验

P-valu=0.5667>0.05,说明残差为白噪声序列,所以该模型通过白噪声检验。

四.研究结论

本文旨在分析个人所得税的影响因素,主要运用了回归分析与时间序列分析的方法,又通过分析相关数据图,研究出个人所得税受影响的情况。

分别找到了影响几种税收的主要因素。

城市居民年人均可支配收入、城镇单位职工年平均工资、城镇居民储蓄存款余额、地区生产总值、第二产业增加值、城镇非私营单位从业人员数、地方财政收入、一般预算收入、政府性基金收入对个人所得税都有一定影响。

 

参考文献:

[1]李子奈潘文卿,计量经济学

[2]张良均谢佳标杨坦肖刚,R语言与数据挖掘

[3]王燕,应用时间序列分析

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > PPT模板 > 自然景观

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1