1
/
の
7
PayPal, credit cards. Download editable-PDF & invoice in 1 second!
GB 18030-2022 英語 PDF (GB18030-2022)
GB 18030-2022 英語 PDF (GB18030-2022)
通常価格
$5,005.00 USD
通常価格
セール価格
$5,005.00 USD
単価
/
あたり
配送料はチェックアウト時に計算されます。
受取状況を読み込めませんでした
配信: 3 秒。真の PDF + 請求書をダウンロードしてください。
1分で見積もりを取得: GB 18030-2022をクリック
過去のバージョン: GB 18030-2022
True-PDF をプレビュー(空白の場合は再読み込み/スクロール)
GB 18030-2022: 情報技術 - 中国語コード化文字セット
イギリス
国家標準の
中華人民共和国
ICS35.040
CCS L71
イギリス 18030-2022
GB 18030-2005 の置き換え
情報技術 - 中国語コード化文字セット
発行日: 2022年7月19日
実施日: 2023年8月1日
発行元:国家市場監督管理総局
中華人民共和国標準化管理局。
目次
序文 ... i
1 スコープ...0
2 規範的参照 ... 0
3 用語と定義 ... 0
4 レパートリー ... 1
5 全体構造 ... 2
6 文字列 ... 4
7 コードポイントの割り当て ... 4
8 いくつかの文字とコードの説明 ... 7
9 実装レベル ... 7
付録A(規定)2バイト文字表...9
付録B(規範)表意文字記述子...91
付録C(規定)4バイト文字表...92
付録D(参考)いくつかの文字とコードの説明...546
付録E(参考)「一般標準」における漢字のコード位置
漢字一覧表」…549
文献 ... 742
ii
序文
この文書はGB/T 1.1-2020の規則に従って作成されました。
「標準化指令 - 第1部:標準化指令の構造と起草に関する規則」
「文書の標準化」。
この文書はGB 18030-2005「情報技術 - 中国語コード
GB 18030-2005と比較すると、構造的な変更に加えて、
修正と編集上の変更、この文書の主な技術的変更は
次のように:
a) この文書の適用可能なオブジェクトを追加します(この版の第1章を参照)。
b) 2バイトコード領域で、GB/T 13000コードの位置を変更します。
縦書きの句読点10個と漢字8文字に相当する
構成要素。6つの繰り返しコード化された漢字構成要素と9つの
繰り返しコード化された漢字(この版の付録D、
2005年版);
c) 4バイトのコーディングエリアで、18個のGB/T 13000コード位置を変更する(付録Dを参照)。
この版の、2005年版の付録D);
d) 4バイトコード0x82358F33~0x82359636の部分に66個の新しい中国語を追加
CJK統一中国語文字により追加された文字(本版の付録Cを参照)。
e) 4バイトコード0x9835F738~0x98399E36の部分に4149中国語を追加する
CJK統一漢字拡張Cの文字(この付録Cを参照)
版);
f) 4バイトコード0x98399F38~0x9839B539の部分に222の中国語を追加
CJK統一漢字拡張Dの文字(この付録Cを参照)
版);
g) 4バイトコード0x9839B632~0x9933FE33の部分に5762中国語を追加する
CJK統一漢字拡張Eの文字(この付録Cを参照)
版);
h) 4バイトコード0x99348138~0x9939F730の部分に7473中国語を追加する
CJK統一漢字拡張Fの文字(この付録Cを参照)
版);
i) 4バイトコード0x81398B32~0x8139A035の部分に、214個の康熙部首を追加する。
(本版の付録Cを参照)
j) 4バイトコード0x8134F932~0x81358437の部分に83 Xishuangbannaを追加する
新しいダイ文字(この版の付録Cを参照)
iii
情報技術 - 中国語コード化文字セット
1 範囲
この文書は中国語のグラフィック文字の16進表現を規定する。
および情報技術で使用されるバイナリコード。
この文書は、処理、交換、保管、送信、提示、
中国語やその他のグラフィック文字情報の入出力。
この文書は、情報処理および
中国語やその他のテキストやグラフィック文字の交換機能(ただし、
入力方法、光学文字によって表されるソフトウェア製品に限定される
認識(OCR)、編集と校正、機械翻訳、音声合成、
テキスト転写、インテリジェントライティングなど、また、ハードウェア製品も紹介されています。
コンピュータ、通信端末機器、電子書籍リーダー、学習機器など
等
2 規範的参照
以下の参考文献は、この適用に必須である。
文書。日付のある参考文献については、引用された版のみが適用されます。日付のない参考文献については、
参照文書の最新版(修正を含む)が適用されます。
GB/T 2312-1980、情報用中国語グラフィック文字セットのコード
交換 - プライマリセット
GB/T 11383-1989、情報交換のための8ビットコードによる情報処理 -
実施の構造とルール
GB/T 13000、情報技術 - ユニバーサルマルチプル - オクテットコード化文字
設定 (UCS)
3 用語と定義
このドキュメントでは、以下の用語と定義が適用されます。
3.1 文字
データを整理、制御、または表現するために使用される要素のコレクション内の要素。
3.2 コード化文字
文字(3.1)とそのコード化された表現。
3.3 私的使用区域
この文書に準拠した製品のユーザーが指定できる領域。
3.4 レパートリー
コード化文字セット(3.2)によって表される指定された文字セット(3.1)。
3.5 予約ゾーン
このドキュメントで指定されている将来のために予約されている領域。
4 レパートリー
4.1 概要
この文書に含まれる文字は、1バイト、2バイト、または4バイトでコード化されています。
バイト。
4.2 シングルバイトの一部
この文書では、シングルバイトの部分は0x00から0x7Fまでの128文字すべてを含む。
GB/T 11383-1989 の。
4.3 2バイト文字の一部
2バイト部分にはGB/T 2312-1980、CJK統一のすべてのグラフィック文字が含まれます。
GB/T 13000の漢字と一部のグラフィック文字。
ダブルバイトの一部は、附属書Aの規定に従っている。その中で、
表意文字記述子の図形、コード位置、機能は、
附属書Bの規定。
注: GB/T 13000は、中国、日本、韓国で使用される漢字を統一的にエンコードします。
ベトナムやその他の国や地域では、独特の抽象的な字形を持つ漢字が
別々のコード位置が割り当てられている。異なるソースを持つが、同じ抽象を持つ漢字
グリフには共通のコード位置が与えられている。エンコードされた中国語の文字はCJK統合文字と呼ばれる。
中国語の文字(CJK 統合表意文字)。CJK は中国、日本、韓国を意味します。
4.4 4バイトの一部
4バイトの部分に66個のCJK統一漢字(9FA6〜9FEF、
GB/T 13000の上記2バイト文字以外の9FB4~9FBBを除く
文字、CJK 統合漢字拡張 A、CJK 統合漢字
拡張 B、CJK 統合漢字 拡張 C、CJK 統合漢字
拡張D、CJK統合漢字 拡張E、CJK統合漢字
拡張子 F と GB/T 13000 でコード化された少数民族の文字。
4バイト部分の文字は附属書Cの規定に従います。
5 全体構造
本文中の0xでマークされた数字はすべて16進数です。0xでマークされていない数字は
10 進数です。付録のすべてのコード化表現は 16 進数で表されます。
その他の数値はすべて 10 進数で表されます。
シングルバイト部分はGB/T 11383-1989のエンコード構造を採用しています。コード使用
0x00〜0x7Fを指します。
2バイトの部分は、文字を表すために2つのオクテット文字列を採用しています。その最初のバイト
コードポイントは0x81~0xFEです。末尾バイトのコードポイントは0x40~0x7Eで、
それぞれ0x80~0xFEです。
4バイトの部分はGB/T 11383-1989では使われていない0x30~0x39を接尾辞として採用し、
ダブルを展開します...
1分で見積もりを取得: GB 18030-2022をクリック
過去のバージョン: GB 18030-2022
True-PDF をプレビュー(空白の場合は再読み込み/スクロール)
GB 18030-2022: 情報技術 - 中国語コード化文字セット
イギリス
国家標準の
中華人民共和国
ICS35.040
CCS L71
イギリス 18030-2022
GB 18030-2005 の置き換え
情報技術 - 中国語コード化文字セット
発行日: 2022年7月19日
実施日: 2023年8月1日
発行元:国家市場監督管理総局
中華人民共和国標準化管理局。
目次
序文 ... i
1 スコープ...0
2 規範的参照 ... 0
3 用語と定義 ... 0
4 レパートリー ... 1
5 全体構造 ... 2
6 文字列 ... 4
7 コードポイントの割り当て ... 4
8 いくつかの文字とコードの説明 ... 7
9 実装レベル ... 7
付録A(規定)2バイト文字表...9
付録B(規範)表意文字記述子...91
付録C(規定)4バイト文字表...92
付録D(参考)いくつかの文字とコードの説明...546
付録E(参考)「一般標準」における漢字のコード位置
漢字一覧表」…549
文献 ... 742
ii
序文
この文書はGB/T 1.1-2020の規則に従って作成されました。
「標準化指令 - 第1部:標準化指令の構造と起草に関する規則」
「文書の標準化」。
この文書はGB 18030-2005「情報技術 - 中国語コード
GB 18030-2005と比較すると、構造的な変更に加えて、
修正と編集上の変更、この文書の主な技術的変更は
次のように:
a) この文書の適用可能なオブジェクトを追加します(この版の第1章を参照)。
b) 2バイトコード領域で、GB/T 13000コードの位置を変更します。
縦書きの句読点10個と漢字8文字に相当する
構成要素。6つの繰り返しコード化された漢字構成要素と9つの
繰り返しコード化された漢字(この版の付録D、
2005年版);
c) 4バイトのコーディングエリアで、18個のGB/T 13000コード位置を変更する(付録Dを参照)。
この版の、2005年版の付録D);
d) 4バイトコード0x82358F33~0x82359636の部分に66個の新しい中国語を追加
CJK統一中国語文字により追加された文字(本版の付録Cを参照)。
e) 4バイトコード0x9835F738~0x98399E36の部分に4149中国語を追加する
CJK統一漢字拡張Cの文字(この付録Cを参照)
版);
f) 4バイトコード0x98399F38~0x9839B539の部分に222の中国語を追加
CJK統一漢字拡張Dの文字(この付録Cを参照)
版);
g) 4バイトコード0x9839B632~0x9933FE33の部分に5762中国語を追加する
CJK統一漢字拡張Eの文字(この付録Cを参照)
版);
h) 4バイトコード0x99348138~0x9939F730の部分に7473中国語を追加する
CJK統一漢字拡張Fの文字(この付録Cを参照)
版);
i) 4バイトコード0x81398B32~0x8139A035の部分に、214個の康熙部首を追加する。
(本版の付録Cを参照)
j) 4バイトコード0x8134F932~0x81358437の部分に83 Xishuangbannaを追加する
新しいダイ文字(この版の付録Cを参照)
iii
情報技術 - 中国語コード化文字セット
1 範囲
この文書は中国語のグラフィック文字の16進表現を規定する。
および情報技術で使用されるバイナリコード。
この文書は、処理、交換、保管、送信、提示、
中国語やその他のグラフィック文字情報の入出力。
この文書は、情報処理および
中国語やその他のテキストやグラフィック文字の交換機能(ただし、
入力方法、光学文字によって表されるソフトウェア製品に限定される
認識(OCR)、編集と校正、機械翻訳、音声合成、
テキスト転写、インテリジェントライティングなど、また、ハードウェア製品も紹介されています。
コンピュータ、通信端末機器、電子書籍リーダー、学習機器など
等
2 規範的参照
以下の参考文献は、この適用に必須である。
文書。日付のある参考文献については、引用された版のみが適用されます。日付のない参考文献については、
参照文書の最新版(修正を含む)が適用されます。
GB/T 2312-1980、情報用中国語グラフィック文字セットのコード
交換 - プライマリセット
GB/T 11383-1989、情報交換のための8ビットコードによる情報処理 -
実施の構造とルール
GB/T 13000、情報技術 - ユニバーサルマルチプル - オクテットコード化文字
設定 (UCS)
3 用語と定義
このドキュメントでは、以下の用語と定義が適用されます。
3.1 文字
データを整理、制御、または表現するために使用される要素のコレクション内の要素。
3.2 コード化文字
文字(3.1)とそのコード化された表現。
3.3 私的使用区域
この文書に準拠した製品のユーザーが指定できる領域。
3.4 レパートリー
コード化文字セット(3.2)によって表される指定された文字セット(3.1)。
3.5 予約ゾーン
このドキュメントで指定されている将来のために予約されている領域。
4 レパートリー
4.1 概要
この文書に含まれる文字は、1バイト、2バイト、または4バイトでコード化されています。
バイト。
4.2 シングルバイトの一部
この文書では、シングルバイトの部分は0x00から0x7Fまでの128文字すべてを含む。
GB/T 11383-1989 の。
4.3 2バイト文字の一部
2バイト部分にはGB/T 2312-1980、CJK統一のすべてのグラフィック文字が含まれます。
GB/T 13000の漢字と一部のグラフィック文字。
ダブルバイトの一部は、附属書Aの規定に従っている。その中で、
表意文字記述子の図形、コード位置、機能は、
附属書Bの規定。
注: GB/T 13000は、中国、日本、韓国で使用される漢字を統一的にエンコードします。
ベトナムやその他の国や地域では、独特の抽象的な字形を持つ漢字が
別々のコード位置が割り当てられている。異なるソースを持つが、同じ抽象を持つ漢字
グリフには共通のコード位置が与えられている。エンコードされた中国語の文字はCJK統合文字と呼ばれる。
中国語の文字(CJK 統合表意文字)。CJK は中国、日本、韓国を意味します。
4.4 4バイトの一部
4バイトの部分に66個のCJK統一漢字(9FA6〜9FEF、
GB/T 13000の上記2バイト文字以外の9FB4~9FBBを除く
文字、CJK 統合漢字拡張 A、CJK 統合漢字
拡張 B、CJK 統合漢字 拡張 C、CJK 統合漢字
拡張D、CJK統合漢字 拡張E、CJK統合漢字
拡張子 F と GB/T 13000 でコード化された少数民族の文字。
4バイト部分の文字は附属書Cの規定に従います。
5 全体構造
本文中の0xでマークされた数字はすべて16進数です。0xでマークされていない数字は
10 進数です。付録のすべてのコード化表現は 16 進数で表されます。
その他の数値はすべて 10 進数で表されます。
シングルバイト部分はGB/T 11383-1989のエンコード構造を採用しています。コード使用
0x00〜0x7Fを指します。
2バイトの部分は、文字を表すために2つのオクテット文字列を採用しています。その最初のバイト
コードポイントは0x81~0xFEです。末尾バイトのコードポイントは0x40~0x7Eで、
それぞれ0x80~0xFEです。
4バイトの部分はGB/T 11383-1989では使われていない0x30~0x39を接尾辞として採用し、
ダブルを展開します...
共有






