大家好,今天趙新來和大家分享一些關于一個字固定等于兩個字節么,計算機程序常識講解的經驗,想要掌握字節,一個字,兩個,漢字,常識的實用干貨和最新資訊分享嗎?閱讀這篇文章后,相信你會更深入地理解這個領域的基礎知識。
char型變量中能不能存貯一個中文漢字。確定下一個漢字到底占幾個字符?
char類型可以存儲一個中文漢字。因為Java中char的編碼方式為UTF-16BE。UTF-16編碼使用2或者4字節,在65536以內的占兩個字節。而基本上所有中文的Unicode編碼在19968到40869之間——既Unicode至少包含了20902個漢字,所以一個char類型可以存儲一個漢字。
占用的字節
GB2312
GB2312標準主要針對的是簡體中文常見字符,包括約7000個漢字,不包括一些罕用詞,不包括繁體字。
GBK
GBK建立在GB2312的基礎上,向下兼容GB2312,也就是說,GB2312編碼的字符和二進制表示,在GBK編碼里是完全一樣的。需要注意的是,低位字節是從0x40也就是64開始的,也就是說,低位字節最高位可能為0。
GB18030
GB18030向下兼容GBK,增加了五萬五千多個字符,共七萬六千多個字符。包括了很多少數民族字符,以及中日韓統一字符。
Big5
Big5是針對繁體中文的,廣泛用于臺灣香港等地。
Big5包括1萬3千多個繁體字,和GB2312類似,一個字符同樣固定使用兩個字節表示。在這兩個字節中,高位字節范圍是0x81-0xFE,低位字節范圍是0x40-0x7E和0xA1-0xFE。
總之,byte是1個字節,char是兩個字節,但是char里可以存一個漢字,這么說漢字就占用兩個字節?String類型里的漢字,按照編碼格式的不同,分為2-4個字節的占用,UTF-8占用3個字節,特別的占用4個字節。GBK里漢字確實是占用2個字節。UTF-16里漢字一般占2個字節,特殊的是4個字節。
綜上所述,那要看漢字是以什么編碼格式來存儲了,以及漢字是否為特殊漢字
今天的內容就到這里,感謝大家的關注!希望這些信息對大家有所啟發,看完這篇一個字固定等于兩個字節么:計算機程序常識講解,如果你覺得它對你有啟示,不妨將它轉發給更多人吧!
本文發布者:大嫂助理,不代表巢座耶立場,轉載請注明出處:http://www.sdwldmy.com/p/6106.html
版權聲明:本文內容由互聯網用戶自發貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發現本站有涉嫌抄襲侵權/違法違規的內容, 請發送郵件至 jubao226688#126.com 舉報,一經查實,本站將立刻刪除。