二进制与字符编码
单位的换算
8 bit(位)=1 byt(字节)
1024 byt=1kB
1024KB=1MB
1024MB=1GB
1024GB=1TB
计算机如何识别呢?一开始是0,1的二进制,一张ASCII码表格让计算机认识的符号和数字对应好,但是这明显不够用,于是在80年代推出了可以表示简体中文字符的GB2312,可以表示7445个字符。显然还是不够,于是在90年代又推出了GBK既可以表示简体中文又可以表示繁体中文。为了考虑少数民族的字符,又推出了GB18030,每一个字符可以是1个、2个、4个字符组成。而外国也有外国的编码,这就导致了同样一个编码,能够表示不同的信息,这显然是荒唐的,于是就统一了一个Unicode编码。Unicode几乎包含了全世界的字符,他规定了无论是中文还是英文都使用2个字符表示。UTF-8规定英文用ASCII表示,中文用三个字节表示。
例如:在Unicode编码中,“乘”的编码为4e58,它的二进制为100 1110 0101 1000,十进制为20056,验证如下:
print(chr(0b100111001011000)) #二进制转化为字符,来自Unicode汉字编码表 print(ord('乘')) #字符转化为二进制 二进制以0b开头,八进制以0o开头,十六进制以0x开头
Python中的标识符与保留字
保留字:有一些单词被赋予了特殊的意义,在自定义的时候不能使用!如果使用了,程序就会报错。
标识符:程序员给变量、函数、类、模块和其他对象取的名字叫做标识符。
规则:
- 1数字、字母、下划线
- 2不能以数字开头
- 3严格区分大小写
变量定义和使用
变量就像是一个带标签的盒子,通过等号把需要的数据放进去。
变量由三部分组成:标识、类型、值
标识:标识对象所存储的内存地址,使用内置函数id(obj)来获取
类型:表是对象的数据类型,使用内置函数type(obj)来获取
值:表示对象所存储的具体数据,使用print()函数进行打印
name='玛利亚' print('标识:',id(name)) print('类型:',type(name)) print('值:',name)
当多次赋值后,变量会指向新的空间,就得空间会被Python回收。
数据类型
1.int整数类型,可以表示二进制、十进制、八进制、十六进制。默认是十进制
n1=90 n2=-76 n3=0 print(n1,type(n1)) print(n2,type(n2)) print(n3,type(n3))
2.float浮点数在计算机中以二进制存储,相加减计算出来的结果可能有问题,
比如:n1=1.1,n2=2.2,pritnt(n1+n2)。结果为3.3000000003
有一种模块来完成它们的相加减
from decimal import Decimal print(Decimal('1.1')+Decimal('2.2'))
3.bool布尔类型,是可以转化成整数计算
f1=True f2=False print(f1,type(f1)) #True <class 'bool'> print(f2,type(f2)) #False <class 'bool'> print(f1+1) #2 print(f2+1) #1
4.字符串类型
字符串又被称为不可变的字符序列
可以使用单引号、双引号、三引号或''''来定义
单引号的字符串必须在一行,三引号的字符串可以分布在连续的多行
数据类型转换
加号是字符串连接字符,但是str类型和int类型不能连接,所以要把int转化为str类型。
print('我叫'+name+',今年'+str(age)+'岁') a=10 b=198.8 c=False print(type(a),type(b),type(c)) print(str(a),str(b),str(c),type(str(a)),type(str(b)),type(str(c)))
int()将其转化为int类型
注意:int()可以将其他类型转化为整形,但是字符串必须为整数数字串,例如'1122';将浮点型转化的时候,取他的整数部分
s1='128' f1=98.7 s2='76.77' ff=True s3='hello' print(type(s1),type(f1),type(s2),type(ff),type(s3)) print(int(s1),type(int(s1))) pritn(int(f1),type(int(f1))) #pritn(int(s2),type(int(s2)))#报错因为字符串为小数字符串 pritn(int(ff),type(int(ff))) #pritn(int(s3),type(int(s3)))#报错
Python中的注释
1.‘#’井号表示单行注释
2.'''三引号代表多行注释
3.中文编码声明注释,写在最前面
#coding:gbk,标注了这个.py文件的存储格式。使用记事本打开,点击另存为可以看到格式为ANSI。
#coding:utf-8。使用记事本打开,点击另存为可以看到格式为UTF-8。