浅谈 Python 程序和 C 程序的整合.docx
《浅谈 Python 程序和 C 程序的整合.docx》由会员分享,可在线阅读,更多相关《浅谈 Python 程序和 C 程序的整合.docx(12页珍藏版)》请在冰豆网上搜索。
浅谈Python程序和C程序的整合
浅谈Python程序和C程序的整合
周怿,IBM中国系统与技术实验室,软件工程师,2006年获得浙江大学计算机硕士学位并于2007年加入IBM,目前主要从事IBM系统管理软件的研发。
简介:
Python是一种用于快速开发软件的编程语言,它的语法比较简单,易于掌握,但存在执行速度慢的问题,并且在处理某些问题时存在不足,如对计算机硬件系统的访问,对媒体文件的访问等。
而作为软件开发的传统编程语言C语言,却能在这些问题上很好地弥补Python语言的不足。
因此,本文通过实例研究如何在Python程序中整合既有的C语言模块,包括用C语言编写的源程序和动态链接库等,从而充分发挥Python语言和C语言各自的优势。
概览
Python是一种用于快速开发软件的编程语言,它的语法比较简单,易于掌握,但存在执行速度慢的问题,并且在处理某些问题时存在不足,如对计算机硬件系统的访问,对媒体文件的访问等。
而作为软件开发的传统编程语言——C语言,却能在这些问题上很好地弥补Python语言的不足。
因此,本文通过实例研究如何在Python程序中整合既有的C语言模块,包括用C语言编写的源程序和动态链接库等,从而充分发挥Python语言和C语言各自的优势。
背景知识介绍
Python语言的特点
Python作为一门程序开发语言,被越来越多地运用到快速程序开发。
Python是一种解释型的,互动的,面向对象的编程语言,它包含了模块化的操作,异常处理,动态资料形态,以及类型的使用。
它的语法表达优美易读,具有很多优秀的脚本语言的特点:
解释的,面向对象的,内建的高级数据结构,支持模块和包,支持多种平台,可扩展。
而且它还支持交互式方式运行,图形方式运行。
它拥有众多的编程界面支持各种操作系统平台以及众多的各类函数库,利用C和C++可以对它进行扩充。
C语言的特点
C语言作为最受人们欢迎的语言之一,有广泛的发展基础。
简洁紧凑、灵活方便,功能强大是其特点。
另外,C语言是一门中级语言。
它把高级语言的基本结构和语句与低级语言的实用性结合起来。
由于可以直接访问物理地址,可以方便的对硬件进行操作。
因此,很多的系统软件都是由C语言编写。
Python语言与C语言的交互
为了节省软件开发成本,软件开发人员希望能够缩短的软件的开发时间,希望能够在短时间内开发出稳定的产品。
Python功能强大,简单易用,能够快速开发应用软件。
但是由于Python自身执行速度的局限性,对性能要求比较高的模块需要使用效率更高的程序语言进行开发,例如C语言,系统的其他模块运用Python进行快速开发,最后将C语言开发的模块与Python开发的模块进行整合。
在此背景下,基于Python语言与C语言的各自特点,用C语言来扩展现有的Python程序,显得很有意义。
本文首先介绍几种常用的整合Python程序与C语言程序的方法,最后给出相应的实例。
利用ctypes模块整合Python程序和C程序
ctypes模块
ctypes是Python的一个标准模块,它包含在Python2.3及以上的版本里。
ctypes是一个Python的高级外部函数接口,它使得Python程序可以调用C语言编译的静态链接库和动态链接库。
运用ctypes模块,能够在Python源程序中创建,访问和操作简单的或复杂的C语言数据类型。
最为重要的是ctypes模块能够在多个平台上工作,包括Windows,WindowsCE,MacOSX,Linux,Solaris,FreeBSD,OpenBSD。
接下来通过几个简单的例子来看一下ctypes模块如何整合Python程序和C程序。
源代码层面上的整合
利用Python本身提供的ctypes模块可以使Python语言和C语言在源代码层面上进行整合。
本节介绍了如何通过使用ctypes库,在Python程序中可以定义类似C语言的变量。
下表列出了ctypes变量类型,C语言变量类型和Python语言变量类型之间的关系:
表1.ctypes,c语言和Python语言变量类型关系
ctypestype
ctype
Pythontype
c_char
char
1-characterstring
c_wchar
wchar_t
1-characterunicodestring
c_byte
char
int/long
c_ubyte
unsignedchar
int/long
c_short
short
int/long
c_ushort
unsignedshort
int/long
c_int
int
int/long
c_uint
unsignedint
int/long
c_long
long
int/long
c_ulong
unsignedlong
int/long
c_longlong
__int64orlonglong
int/long
c_ulonglong
unsigned__int64orunsignedlonglong
int/long
c_float
float
float
c_double
double
float
c_char_p
char*(NULterminated)
stringorNone
c_wchar_p
wchar_t*(NULterminated)
unicodeorNone
c_void_p
void*
int/longorNone
表1中的第一列是在ctypes库中定义的变量类型,第二列是C语言定义的变量类型,第三列是Python语言在不使用ctypes时定义的变量类型。
举例:
清单1.ctypes简单使用
>>>fromctypesimport*#导入ctypes库中所有模块
>>>i=c_int(45)#定义一个int型变量,值为45
>>>i.value#打印变量的值
45
>>>i.value=56#改变该变量的值为56
>>>i.value#打印变量的新值
56
从下面的例子可以更明显地看出ctypes里的变量类型和C语言变量类型的相似性:
清单2.ctypes使用C语言变量
>>>p=create_string_buffer(10)#定义一个可变字符串变量,长度为10
>>>p.raw#初始值是全0,即C语言中的字符串结束符’\0’
'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00'
>>>p.value="Student"#字符串赋值
>>>p.raw#后三个字符仍是’\0’
'Student\x00\x00\x00'
>>>p.value="Big"#再次赋值
>>>p.raw#只有前三个字符被修改,第四个字符被修改为’\0’
'Big\x00ent\x00\x00\x00'
下面例子说明了指针操作:
清单3.ctypes使用C语言指针
>>>i=c_int(999)#定义int类型变量i,值为999
>>>pi=pointer(i)#定义指针,指向变量i
>>>pi.contents#打印指针所指的内容
c_long(999)
>>>pi.contents=c_long(1000)#通过指针改变变量i的值
>>>pi.contents#打印指针所指的内容
c_long(1000)
下面例子说明了结构和数组的操作:
清单4.ctypes使用C语言数组和结构体
>>>classPOINT(Structure):
#定义一个结构,内含两个成员变量x,y,均为int型
..._fields_=[("x",c_int),
...("y",c_int)]
...
>>>point=POINT(2,5)#定义一个POINT类型的变量,初始值为x=2,y=5
>>>printpoint.x,point.y#打印变量
25
>>>point=POINT(y=5)#重新定义一个POINT类型变量,x取默认值
>>>printpoint.x,point.y#打印变量
05
>>>POINT_ARRAY=POINT*3#定义POINT_ARRAY为POINT的数组类型
#定义一个POINT数组,内含三个POINT变量
>>>pa=POINT_ARRAY(POINT(7,7),POINT(8,8),POINT(9,9))
>>>forpinpa:
printp.x,p.y#打印POINT数组中每个成员的值
...
77
88
99
Python访问C语言dll
通过ctypes模块,Python程序可以访问C语言编译的dll,本节通过一个简单的例子,Python程序helloworld.py中调用some.dll中的helloworld函数,来介绍Python程序如何调用windows平台上的dll。
1.导入动态链接库
清单5.ctypes导入dll
fromctypesimportwindll#首先导入ctypes模块的windll子模块
somelibc=windll.LoadLibrary(some.dll)#使用windll模块的LoadLibrary导入动态链接库
2.访问动态链接库中的函数
清单6.ctypes使用dll中的函数
somelibc.helloworld()#这样就可以得到some.dll的helloworld的返回值。
整个helloworld.py是这样的:
清单7.Pythonhellpworld代码
fromctypesimportwindll
defcallc():
#loadthesome.dll
somelibc=windll.LoadLibrary(some.dll)
printsomelibc.helloworld()
if__name__==“__main__”:
callc()
在命令行运行helloworld.py,在console上可以看到some.dll中helloworld的输出。
清单8.PythonhellpworldWindowscommandconsole运行输出
C:
\>pythonC:
\python\test\helloworld.py
HelloWorld!
Justasimpletest.
Python调用C语言so
通过ctypes模块,Python程序也可以访问C语言编译的so文件。
与Python调用C的dll的方法基本相同,本节通过一个简单的例子,Python程序helloworld.py中调用some.so中的helloworld函数,来介绍Python程序如何调用linux平台上的so。
1.导入动态链接库
清单9.ctypes导入so
fromctypesimportcdll
#首先导入ctypes模块的cdll子模块,注意linux平台上使用cdll的,而不是windll。
somelibc=cdll.LoadLibrary(“./some.so”)
#使用cdll模块的LoadLibrary导入动态链接库
2.访问动态链接库中的函数
清单10.ctypes使用so中的函数
somelibc.helloworld()#使用方法与windows平台上是一样的。
整个helloworld.py是这样的:
清单11.Pythonhelloworld代码
fromctypesimportcdll
defcallc():
#loadthesome.so
somelibc=cdll.LoadLibrary(some.so)
printsomelibc.helloworld()
if__name__==“__main__”:
callc()
在命令行运行helloworld.py,在linux标准输出上可以看到some.so中helloworld的输出。
清单12.PythonhellpworldLinuxshell运行输出
[root@linux-790t]python./helloworld.py
HelloWorld!
Justasimpletest.
Python程序和C程序整合实例
以下我们举例用Python来实现一个小工具,用来实现hash算法,查看文件的校验和(MD5,CRC,SHA1等等)。
通过查看文件的校验和,可以知道文件在传输过程中是否被破坏或篡改。
Hash,一般翻译做“散列”,也有直接音译为"哈希"的,就是把任意长度的输入(又叫做预映射,pre-image),通过散列算法,变换成固定长度的输出,该输出就是散列值。
这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,而不可能从散列值来唯一的确定输入值。
简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
由于相对C语言来说,Python的运行效率较低,因此我们的Python小工具利用一个已有的C语言的动态链接库(hashtcalc.dll)来实现我们的程序。
本例中,我们运用wxPython编写简单的GUI界面,通过python调用hashtcalc.dll的接口计算文件的校验和,然后输出在界面上。
架构图
图1.工具的架构图
hashcalc.dll接口描述
函数名:
calc_CRC32
函数:
char*calc_CRC32(char *filename);
参数:
文件名
返回值:
字符串
说明:
该函数对输入的文件内容进行计算,并且返回它的CRC32
函数名:
calc_MD5
函数:
char*calc_MD5(char *filename);
参数:
文件名
返回值:
字符串
说明:
该函数对输入的文件内容进行计算,并且返回它的MD5
函数名:
calc_SHA1
函数:
char*calc_SHA1(char *filename);
参数:
文件名
返回值:
字符串
说明:
该函数对输入的文件内容进行计算,并且返回它的SHA1
HashcalcAdapter代码
HashcalcAdapter.py实现了一个python的classHashcalcAdapter,HashcalcAdapter对hashtcalc.dl的C语言接口进行了封装,使得其他python模块可以直接通过HashcalcAdapter使用hashtcalc.dll中实现的hash算法。
具体的代码如下:
清单13.HashcalcAdapter.py代码
fromctypesimportwindll
fromctypesimport*
classHashcalcAdapter(object):
def__init__(self,dllpath):
self._dllpath=dllpath
self._libc=windll.LoadLibrary(self._dllpath)
defcalc_CRC32(self,filename):
new_filename=c_char_p(filename)
returnself._libc.calc_CRC32(new_filename)
defcalc_MD5(self,filename):
new_filename=c_char_p(filename)
returnself._libc.calc_MD5(new_filename)
defcalc_SHA1(self,filename):
new_filename=c_char_p(filename)
returnself._libc.calc_SHA1(new_filename)
运行界面
图2.工具的运行界面
总结
在软件开发过程中同时运用Python语言和C语言,既能够在加快开发速度的同时,也能够保证软件的运行性能。
参考资料
∙参考Pythonv2.6.4documentation,了解更多Python各个模块的更多信息。
∙参考Python网站,了解Python的最新信息。
∙在developerWorksLinux专区寻找为Linux开发人员(包括Linux新手入门)准备的更多参考资料,查阅我们最受欢迎的文章和教程。
∙在developerWorks上查阅所有Linux技巧和Linux教程。
作者简介
陈健,IBM中国开发中心,软件工程师,2007年加入IBM中国开发中心工作,目前主要工作是从事服务器平台管理软件开发。
对虚拟化技术比较感兴趣。
任亮,IBM中国系统与技术实验室,软件工程师,2004年获得上海交通大学计算机学士学位并于2008年加入IBM,目前主要从事IBM系统管理软件的研发。
周怿,IBM中国系统与技术实验室,软件工程师,2006年获得浙江大学计算机硕士学位并于2007年加入IBM,目前主要从事IBM系统管理软件的研发。