Python自动化开发学习4-3-白红宇

Python自动化开发学习4-3

阅读量：7100 次

发布时间：2019-06-28

本文共 3153 字，大约阅读时间需要 10 分钟。

JSON 和 pickle

序列化：把数据对象变成字符串的形式，这样可以保存在文件中。反之就是反序列化

python自带的str()可以完成序列化，然后eval()可以反序列化，但是我们先把他们忘记。不知道适用范围是多大。

我们用json的规范来做序列化和反序列化。

import jsondica = {'name':'Alice',        'age':18,        'from':'ShangHai'        }stra = json.dumps(dica)  # 序列化print(type(stra),stra)dica2 = json.loads(stra)  # 反序列化print(type(dica2),dica2)strb = '{"name":"Jack","age":22,"from":"BeiJing"}'  # JSON只认双引号，所以字符串内部要双引号print(type(strb),strb)dicb = json.loads(strb)  # 反序列化print(type(dicb),dicb)

一种需求是序列化成字符串之后存入文件保存起来。下次要用的时候再读取文件，反序列化生成之前的数据。对于这种情况，对应有两个便捷的方法可以直接完成。

import jsondica = {'name':'Alice',        'age':18,        'from':'ShangHai'        }with open("testjson.txt",'w',encoding='utf-8') as file:    json.dump(dica,file)

可以去查看一下，运行目录下是否生成了一个文件。然后再来反序列化

import jsonwith open("testjson.txt",'r',encoding='utf-8') as file:    data = json.load(file)print(type(data),data)

上面的JSON的序列化并不支持python所有的数据类型。但是JSON是通用的规范，也就是JSON序列化之后的数据到其他语言环境也能识别。

对于不支持的数据类型，应该可以加一步编解码，但是如果别的语言环境也不支持这个数据类型，那么即使能序列化也没有用。

不过python序列化保存之后再给python反序列化使用，就没有数据类型的问题，那么可以使用pickle。

python的pickle模块实现了python的所有数据序列和反序列化。基本上功能使用和JSON模块没有太大区别，方法也同样是dumps/dump和loads/load

import pickledica = {'name':'Alice',        'age':18,        'from':'ShangHai'        }stra = pickle.dumps(dica)  # 序列化print(type(stra),stra)  # 这里bytes类型了，只有二进制类型才有可能把所有的数据类型都序列化dica2 = pickle.loads(stra)  # 反序列化print(type(dica2),dica2)

软件目录开发规范

假设项目名称是Foo，项目名称的首字母大写。下面是一个简单的目录结构：

Foo/

|-- bin/

| |-- foo

|-- foo/

| |-- tests/

| | |-- __init__.py

| | |-- test_main.py

| |

| |-- __init__.py

| |-- main.py

|-- docs/

| |-- conf.py

| |-- abc.rst

|-- setup.py

|-- requirements.txt

|-- README

bin/: 存放项目的一些可执行文件，当然你可以起名script/之类的也行。

foo/: 存放项目的所有源代码。(1) 源代码中的所有模块、包都应该放在此目录。不要置于顶层目录。(2) 其子目录tests/存放单元测试代码； (3) 程序的入口最好命名为main.py。

docs/: 存放一些文档。

setup.py: 安装、部署、打包的脚本。

requirements.txt: 存放软件依赖的外部Python包列表。

README: 项目说明文件。

不同目录间进行模块调用

python里一个文件夹下如果有一个__init__.py的空文件，这就不是一个普通的文件夹了，这是一个包。

要调用包里的模块，可以使用：from 包名 import 模块名

要能够调用，还要先保证包的上级目录在环境变量里。要动态的获取到程序的目录和上级目录，并且导入环境变量，看下面的例子：

import os,sysprint(__file__)  # 打印相对路径print(os.path.abspath(__file__))  # 打印绝对路径print(os.path.dirname(os.path.abspath(__file__)))  # 打印上一级目录，这里是去掉了文件名print(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))  # 打印再上一级目录BASE_DIR = os.path.dirname(os.path.dirname(os.path.abspath(__file__)))  # 只要这句，上面都不要print(sys.path)  # 打印当前的环境变量sys.path.append(BASE_DIR)  # 添加环境变量，这句也要。print(sys.path)  # 看看现在的环境变量是否有增加

实际使用时，我们只需要上面的2句就可以了。

作业

员工信息表：

staff_id	name	age	phone	dept	enroll_date
1	Adam Liu	25	13562984561	IT	2013-04-01
2	Barry Allen	22	13659874522	HR	2015-05-03
3	Clark Kent	30	13156998456	Sales	2016-04-22
4	Eddie Thawne	40	13566942130	HR	2009-03-01