为什么要编码?
大家可以先思考个问题:
计算机是如何表示我们人类能够理解的符号的,也就是我们人类使用的语言。
人类的语言有太多了,因而表示这些语言的符号太多。
我们无法用计算机中一个基本的存储单元—— byte 来表示。
因而必须要经过拆分或一些翻译工作,才能让计算机能理解。
我们可以把计算机能够理解的语言假定为英语,其它语言要能够在计算机中使用必须经过一次翻译,把它翻译成英语。
这个翻译的过程就是编码。
所以可以想象只要不是说英语的国家要能够使用计算机就必须要经过编码。
常见的编码有以下几种:
1. Unicode(Unicode Character Set)
Unicode包含除键盘以外的编码是Unicode,又称统一码、万国码、单一码、标准万国码。
Unicode在js、json里出现的比较多。
其格式为:\u+4位字符串\
例如:\u4e2d\ \u4e2d\
2. ASCII
美国信息交换标准代码,标准ASCII 码也叫基础ASCII码。
使用7位二进制数(剩下的1位二进制为0)来表示所有的大写和小写字母,数字0—9、标点符号以及在美式英语中使用的特殊控制字符。
3. URL编码
URL编码原理是使用安全的字符(没有特殊用途或者特殊意义的可打印字符)去表示那些不安全的字符。
可以避免Url中有些字符会引起歧义。
URI编码就是一个字符的ASCII码,它的ACSII码的十六进制式,在前面加上"%",就是它的URL编码。
例如:"/"的ASCII码是92,92的十六进制是5c, 所以"/"的URI编码就是 %5c
"胡"的ASCII码是-17670, 它的十六进制是BAFA, 所以它的URI编码就是 "%BA%FA"
4. Native编码
每个国家都有自己的Native编码,中国的是GBK(Chinese Internal Code Specification)。
GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位。
GBK编码共收录了21003个汉字,完全兼容GB2312-80标准,支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。
5. hex编码
Hex编码的原理就是将原来8位的二进制字节打断,分成两个4位的,并且在前面加上4个零,进行补位。
这样一个8位二进制字节就变成了2个8位的二进制字节,再将新得到的2个二进制字符,进行16位进制转换,得到的新的16位字符串就是Hex的值。
所以二进制的[72, 69, 88]与hex的484558是相等的。
例如:中国——E4B8ADE59BBD
6. BASE64编码
Base64要求把每三个8Bit的字节转换为四个6Bit的字节(3*8 = 4*6 = 24),然后把6Bit再添两位高位0,组成四个8Bit的字节。
也就是说,转换后的字符串理论上将要比原来的长1/3。
计算机常用的信息编码有哪几种?
计算机常用的编码有:ASCII码,汉字编码等 字符编码就是以二进制的数字来对应字符集的字符,目前用得最普遍的字符集是ANSI,对应ANSI字符集的二进制编码就称为ANSI码,DOS和Windows系统都使用了ANSI码,但在系统中使用的字符编码要经过二进制转换,称为系统内码。 1.汉字内码:ANSI码是单一字节(8位...
计算机的信息编码有哪几种?
1、ASCII。ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)是基于罗马字母表的一套电脑编码系统,它主要用于显示现代英语和其他西欧语言。它是现今最通用的单字节编码系统,并等同于国际标准ISO 646。2、GB2312。GB2312又称为GB2312-80字符集,全称为《信息交换用汉字编码...
计算机常用的信息编码有哪几种?
常用的代码类型有:(1)顺序码,即接信息元素的顺序依次编码;(2)区间码,即用一代码区间代表某一信息组;(3)记忆码,即能帮助联想记忆的代码。信息的表现形式多种多样,因而编码的方案也非常多。例如:我国制定的包括一、二级汉字和常用符号的图形字符代码(GB5007-85),日文、韩文等其他文字与...
计算机的信息编码
数字编码:BCD码 BCD(Binar coded Decimal)码是十进制数在计算机中的一种表示方法。它是将十进制数的每一位直接用4位或者8位二进制码表示。 将十进制数的每一位直接用4位二进制码表示,称作压缩BCD码表示。 将十进制数的每一位直接用4位二进制码表示,高4位为全0,称作非压缩BCD码表示。字符的...
常用的编码方式有哪些
1. ASCII 编码 ASCII(美国标准信息交换码)是最早的编码标准之一,它使用7位二进制数来表示128个不同的字符,主要包括英文字母、数字和标点符号。由于其字符集有限,ASCII 编码不支持非英文字符。2. Unicode 编码 Unicode 编码是为了克服 ASCII 编码的限制而设计的,它能够表示世界上几乎所有语言的字符。
计算机常用的信息编码有哪几种?
计算机领域中,信息编码的种类繁多,其中包括以下几种:1. 文字编码:文字编码是使用标记语言来标记文本的结构和其他特征,以便计算机进行处理。这种编码方式使得计算机能够理解和处理人类语言。2. 语义编码:语义编码是通过使用一种语言来表达另一种语言的所有词汇的方法,它关注的是信息的含义和上下文。这种...
编码有哪些
编码的种类包括:二进制编码、ASCII编码、Unicode编码、Base64编码等。编码是一种将信息转换为特定格式的技术,以便于存储、传输和处理。以下是几种常见的编码类型及其解释:1. 二进制编码:这是计算机内部处理信息的基础方式。它使用0和1两种状态来表示不同的数据,如开关状态或逻辑值。这种编码方式简单...
计算机常用的信息编码有哪几种?
计算机常用的信息编码包括以下几种:1. ASCII码:这是最基本的字符编码方式,使用一个字节(8位二进制数)来表示128个标准字符,包括英文字母、数字和一些特殊符号。2. 汉字编码:由于ASCII码无法表示汉字,因此设计了多种汉字编码方式。这些编码通常使用两个字节来表示一个汉字,以满足大量汉字的需求。不...
编码有哪些
常用的编码有以下方式:1、ASCII码。ASCII码,总共有128个,用一个字节的低7位表示,0到31是控制字符如换行回车删除等。32到126是打印字符,可以通过键盘输入并且能够显示出来。2、ISO-8859-1。128个字符显然是不够用的,于是ISO组织在ASCII码基础上又制定了一些列标准用来扩展ASCII编码,它们是ISO-8859...
计算机常用的信息编码有哪几种_计算机中的信息编码一般采用
机内码。计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。汉字交换码(国标码)主要用于汉字信息交换,《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码。国标码是汉字信息交换的标准编码,但...