編碼與編號(hào)有區(qū)別嗎
有人認(rèn)為編號(hào)和編碼是同個(gè)意思,其實(shí),編碼比編號(hào)復(fù)雜多了,編號(hào)僅僅就是一個(gè)順序代號(hào),編碼里面卻蘊(yùn)含著很多信息。下面小編帶你了解一下。
編號(hào):
給順序號(hào)作為一種識(shí)別的方法,如給房間編號(hào),限定于有限的或確定的數(shù)字內(nèi)。
編碼:
編碼(Encoding)在認(rèn)知上是解釋傳入的刺激的一種基本知覺(jué)的過(guò)程。技術(shù)上來(lái)說(shuō),這是一個(gè)復(fù)雜的、多階段的轉(zhuǎn)換過(guò)程,從較為客觀的感覺(jué)輸入(例如光、聲)到主觀上有意義的體驗(yàn)。
字符編碼是一套法則,使用該法則能夠?qū)ψ匀徽Z(yǔ)言的字符的一個(gè)集合(如字母表或音節(jié)表),與其他東西的一個(gè)集合(如號(hào)碼或電脈沖)進(jìn)行配對(duì)。
編碼分類(lèi):
數(shù)字系統(tǒng)中常用的編碼有兩類(lèi),一類(lèi)是二進(jìn)制編碼,另一類(lèi)是二—十進(jìn)制編碼。
編碼體系:
1.ASCII與Binary
我們?nèi)粘=佑|到的文件分ASCII和Binary兩種。ASCII是“美國(guó)信息交換標(biāo)準(zhǔn)編碼”的英文字頭縮寫(xiě),可稱(chēng)之為“美標(biāo)”。美標(biāo)規(guī)定了用從0到127的128個(gè)數(shù)字來(lái)代表信息的規(guī)范編碼,其中包括33個(gè)控制碼,一個(gè)空格碼,和94個(gè)形象碼。形象碼中包括了英文大小寫(xiě)字母,阿拉伯?dāng)?shù)字,標(biāo)點(diǎn)符號(hào)等。我們平時(shí)閱讀的英文電腦文本,就是以形象碼的方式傳遞和存儲(chǔ)的。美標(biāo)是國(guó)際上大部分大小電腦的通用編碼。
然而電腦中的一個(gè)字符大都是用一個(gè)八位數(shù)的二進(jìn)制數(shù)字表示。這樣每一字符便可能有256個(gè)不同的數(shù)值。由于美標(biāo)只規(guī)定了128個(gè)編碼,剩下的另外128個(gè)數(shù)碼沒(méi)有規(guī)范,各家用法不一。另外美標(biāo)中的33個(gè)控制碼,各廠家用法也不盡一致。這樣我們?cè)诓煌娔X間交換文件的時(shí)候,就有必要區(qū)分兩類(lèi)不同的文件。第一類(lèi)文件中每一個(gè)字都是美標(biāo)形象碼或空格碼。這類(lèi)文件稱(chēng)為“美標(biāo)文本文件”(ASCII Text Files),或略為“文本文件”,通??稍诓煌娔X系統(tǒng)間直接交換。第二類(lèi)文件,也就是含有控制碼或非美標(biāo)碼的文件,通常不能在不同電腦系統(tǒng)間直接交換。這類(lèi)文件有一個(gè)通稱(chēng),叫“二進(jìn)制文件”(Binary Files)。
2.國(guó)標(biāo)、區(qū)位、“準(zhǔn)國(guó)標(biāo)”
“國(guó)標(biāo)”是“中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)信息交換用漢字編碼”的簡(jiǎn)稱(chēng)。國(guó)標(biāo)表(基本表)把七千余漢字、以及標(biāo)點(diǎn)符號(hào)、外文字母等,排成一個(gè)94行、94列的方陣。方陣中每一橫行叫一個(gè)“區(qū)”,每個(gè)區(qū)有九十四個(gè)“位”。一個(gè)漢字在方陣中的坐標(biāo),稱(chēng)為該字的“區(qū)位碼”。例如“中”字在方陣中處于第54區(qū)第48位,它的區(qū)位碼就是5448。
其實(shí)94這個(gè)數(shù)字。它是美標(biāo)中形象碼的總數(shù)。國(guó)標(biāo)表沿用這個(gè)數(shù)字,本意大概是要用兩個(gè)美標(biāo)形象符代表一個(gè)漢字。由于美標(biāo)形象符的編碼是從33到126,漢字區(qū)、位碼如果各加上32,就會(huì)與美標(biāo)形象碼的范圍重合。如上例“中”字區(qū)、位碼加上32后,得86,80。這兩個(gè)數(shù)字的十六進(jìn)制放在一起得5650,稱(chēng)為該字的“國(guó)標(biāo)碼”,而與其相對(duì)應(yīng)的兩個(gè)美標(biāo)符號(hào),VP,也就是“中”字的“國(guó)標(biāo)符”了。
3.GBK碼
GBK碼是GB碼的擴(kuò)展字符編碼,對(duì)多達(dá)2萬(wàn)多的簡(jiǎn)繁漢字進(jìn)行了編碼,簡(jiǎn)體版的Win95和Win98都是使用GBK作系統(tǒng)內(nèi)碼。
4.BIG5碼
BIG5碼是針對(duì)繁體漢字的漢字編碼,目前在臺(tái)灣、香港的電腦系統(tǒng)中得到普遍應(yīng)用。
5.HZ碼
HZ碼是在Internet上廣泛使用的一種漢字編碼。“HZ”方案的特點(diǎn),是以“純國(guó)標(biāo)”的中文與美標(biāo)碼混用。那么“HZ”是怎樣區(qū)分國(guó)標(biāo)符和美標(biāo)符的呢?答案其實(shí)也很簡(jiǎn)單:當(dāng)一串美標(biāo)碼中間插入一段國(guó)標(biāo)碼的時(shí)候,我們便在國(guó)標(biāo)碼的前面加上~,后面加上~。這些附加碼分別叫“逃出碼”和“逃入碼”。 由于這些附加碼本身也是美標(biāo)形象碼,整個(gè)文件就儼然是一個(gè)美標(biāo)文本文件,可以安然地 在電腦網(wǎng)上傳遞,也和大部分英文文本處理軟件兼容。
6.ISO-2022CJK碼
ISO-2022是國(guó)際標(biāo)準(zhǔn)組織(ISO)為各種語(yǔ)言字符制定的編碼標(biāo)準(zhǔn)。采用二個(gè)字節(jié)編碼,其中漢語(yǔ)編碼稱(chēng)ISO-2022 CN,日語(yǔ)、韓語(yǔ)的編碼分別稱(chēng)JP、KR。一般將三者合稱(chēng)CJK碼。目前CJK碼主要在Internet網(wǎng)絡(luò)中使用。
7.UCS和ISO10646
1993年,國(guó)際標(biāo)準(zhǔn)ISO10646 定義了通用字符集 (Universal Character Set, UCS)。 UCS 是所有其他字符集標(biāo)準(zhǔn)的一個(gè)超集。它保證與其他字符集是雙向兼容的。就是說(shuō), 如果你將任何文本字符串翻譯到 UCS格式,然后再翻譯回原編碼, 你不會(huì)丟失任何信息。
UCS 包含了用于表達(dá)所有已知語(yǔ)言的字符。不僅包括拉丁語(yǔ),希臘語(yǔ),斯拉夫語(yǔ),希伯來(lái)語(yǔ),阿拉伯語(yǔ),亞美尼亞語(yǔ)和喬治亞語(yǔ)的描述, 還包括中文,日文和韓文這樣的象形文字,以及平假名,片假名,孟加拉語(yǔ), 旁遮普語(yǔ)果魯穆奇字符(Gurmukhi), 泰米爾語(yǔ), 印.埃納德語(yǔ)(Kannada),Malayalam,泰國(guó)語(yǔ), 老撾語(yǔ), 漢語(yǔ)拼音(Bopomofo), Hangul,Devangari,Gujarati, Oriya,Telugu 以及其它語(yǔ)種。對(duì)于還沒(méi)有加入的語(yǔ)言, 由于正在研究怎樣在計(jì)算機(jī)中最好地編碼它們, 因而最終它們都將被加入。這些語(yǔ)言包括Tibetian,高棉語(yǔ),Runic(古代北歐文字),埃塞俄比亞語(yǔ), 其他象形文字,以及各種各樣的印-歐語(yǔ)系的語(yǔ)言,還包括挑選出來(lái)的藝術(shù)語(yǔ)言比如 Tengwar,Cirth 和 克林貢語(yǔ)(Klingon)。UCS 還包括大量的圖形的,印刷用的,數(shù)學(xué)用的和科學(xué)用的符號(hào),包括所有由 TeX,Postscript, MS-DOS,MS-Windows, Macintosh, OCR 字體, 以及許多其他字處理和出版系統(tǒng)提供的字符。
8.Unicode碼
。Unicode其實(shí)就是寬字節(jié)字符集,它對(duì)每個(gè)字符都固定使用兩個(gè)字節(jié)即16位表示,于是當(dāng)處理字符時(shí),不必?fù)?dān)心只處理半個(gè)字符。
目前,Unicode在網(wǎng)絡(luò)、Windows系統(tǒng)和很多大型軟件中得到應(yīng)用。
字符種類(lèi):
1.文字編碼
2.語(yǔ)義編碼
3.電子編碼
4.神經(jīng)編碼
5.記憶編碼
6.加密
7.譯碼
小編推薦:HS編碼
HS采用六位數(shù)編碼,把全部國(guó)際貿(mào)易商品分為22類(lèi),98章。章以下再分為目和子目。商品編碼第一、二位數(shù)碼代表"章",第三、四位數(shù)碼代表"目"(Heading),第五、六位數(shù)碼代表"子目"(Subheading)。前6位數(shù)是HS國(guó)際標(biāo)準(zhǔn)編碼,HS有1241個(gè)四位數(shù)的稅目,5113個(gè)六位數(shù)子目。有的國(guó)家根據(jù)本國(guó)的實(shí)際,已分出第七、八、九位數(shù)碼。
在HS中,"類(lèi)"基本上是按經(jīng)濟(jì)部門(mén)劃分的,如食品、飲料和煙酒在第四類(lèi),化學(xué)工業(yè)及其相關(guān)工業(yè)產(chǎn)品在第六,紡織原料及制品在第十一類(lèi),機(jī)電設(shè)備在第十六類(lèi)。運(yùn)輸設(shè)備在第十七類(lèi),武器、彈藥在第十九類(lèi)等。HS"章"分類(lèi)基本采取兩種辦法:一是按商品原材料的屬性分類(lèi),相同原料的產(chǎn)品一般歸入同一章。章內(nèi)按產(chǎn)品的加工程度從原料到成品順序排列。如52章棉花,按原棉--已梳棉--棉紗--棉布順序排列。二是按商品的用途或性能分類(lèi)。制造業(yè)的許多產(chǎn)品很難按其原料分類(lèi),尤其是可用多種材料制作的產(chǎn)品或由混合材料制成的產(chǎn)品(如第64章鞋、第65章帽、第95章玩具等)及機(jī)電儀產(chǎn)品等,HS按其功能或用途分為不同的章,而不考慮其使用何種原料,章內(nèi)再按原料或加工程序排列出目或子目。HS的各章均列有一個(gè)起"兜底"作用,名為"其他"的子目,使任何進(jìn)出口商品都能在這個(gè)分類(lèi)體系中找到自己適當(dāng)?shù)奈恢谩?/p>
我國(guó)目前使用的HS編碼,一共10位,其中前面8位稱(chēng)為主碼,后兩位稱(chēng)為附加碼。