お役立ちコラム

機種依存文字とは?機種依存文字一覧と避ける方法について

  • このエントリーをはてなブックマークに追加
機種依存文字とは?機種依存文字一覧と避ける方法について

「機種依存文字は文字化けする」という考え方は、一昔前のものです。UTF-8などの文字コードが普及した今、機種依存文字による文字化けに悩まれる機会が減りました。本記事では、代表的な機種依存文字をご紹介するとともに、Webページが文字化けするメカニズムと、文字化けしないために気を付けることを解説します。

機種依存文字とは?

機種依存文字とは、WindowsやMacなどのOSやフォントに依存する文字を指します。環境依存文字とも呼ばれ、元々は特定の環境下で使用するために用意されたものです。一方、機種依存文字の影響からWebサイトが正常に表示されなかったり、文字化けを起こしたりすることがありました。これまでのWeb業界において、機種依存文字をサイト構築に使わないのは、一種のマナーとなっていました。

近年はUTF-8の登場により、機種依存文字による文字化けに悩まされる機会が減りました。これについては後述しますが、以前よりも避ける必要はなくなっています。

主な機種依存文字一覧

代表的な機種依存文字として、「丸囲みの数字」「ローマ数字」「単位」「省略文字」「縦書き記号」が挙げられます。左から順に一覧で見ていきます。

①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳(丸囲みの数字)
Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ(ローマ数字)
㎜ ㎝ ㎞ ㎎ ㎏ ㏄ ㍉ ㌔ ㌢ ㍍ ㌘ ㌧ ㌃ ㌶ ㍑ ㍗ ㌍ ㌦ ㌣ ㌫(単位)
№ ℡ № ㏍ ℡ ㊤ ㊥ ㊦ ㊧ ㊨ ㈱ ㈲ ㈹ ㍾ ㍽ ㍼ ㍻ ≡ ∑ ∫(省略文字)
纊 鍈 蓜 炻 棈 兊 夋 奛 奣 寬 﨑 嵂 咊 咩 哿 喆 坙 坥 垬 埈(縦書き記号)

上記の環境依存文字は、通常通りに使用すると文字化けを起こす可能性があります。それでも環境依存文字を使いたい場合、複数の文字を組み合わせて表現します。例えば、「Ⅵ」というローマ数字は大文字の「V」と「I」と並べて「VI」と表します。「㊤」は「(上)」、「㎜」は「mm」といった具合です。

また、WindowsとMac共通で使える、文字化けしそうでしない文字もあります。

〇 ○ ◇ □ △ ▽ ☆ ● ◆ ■ ▲ ▼ ★ ◎ ◯ ♂ ♀ 〒(マーク)
+ - ± × ÷ = ≒ ≠ ≦ ≧ < ≪ ≫ ∞ ∽ ∝ ∴ ∵ ∈ ∋(学術記号)
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ (ギリシャ文字)
# & * @ § ※ 〓 ♯ ♭ ♪ † ‡ ¶ 仝 々 〆 ー ~  ̄ _ ―(その他)

上記は双方のOSで使える一方、その見た目から機種依存文字に間違われることがあります。普段使いしても問題ありませんので、覚えておいてください。

なぜ文字化けするのか?

機種依存文字の文字化けは、Shift-JISという文字コードを使用する際に起こります。文字コードとは、PC上で文字を表示するキャラクターコードのことです。Shift-JISもその規格に含まれます。

PCが扱えるデータ

そもそもPCが扱えるデータは、「0」と「1」の2進数のみです。「A」や「B」といった文字を表現するには、8bitのバイト表現に文字を対応させる必要がありました。そのような状況で考案されたのが、ASCIIコードをはじめとするバイト表現リストです。「A」は「00110000」、「B」は「00110001」というように、特定のバイト表現に対してさまざまな文字、記号を割り当てました。

日本語を表現する文字コード

一方、日本語を8bitで表現するのは困難でした。日本語には平仮名や片仮名に加え、漢字が存在するためです。そこで0から9の数字、AからFの文字を組み合わせる16bitの文字コードが作られます。それがShift-JISであり、1982年頃に誕生しました。
日本語を表現する文字コードは、Shift-JISのほかにJIS、EUC-JP、UTF-8、UTF-16などがあります。これまで、日本語のWebサイトで使われてきたのはShift-JISであり、同規格で扱えない文字は機種依存文字に分類されました。

規格毎のキャラクターコード

また、文字に割り振られたキャラクターコードは、規格毎に異なります。例えば、EUCにおける「あ」のキャラクターコードは「A4A2」ですが、Shift-JISでは「82A0」に割り振られています。この違いにより、Webサイト上で特定の文字を異なる規格間で変換すると、文字化けする可能性が出てきます。
ベンダーがShift-JISに定義されていないキャラクターコードに、新しく文字を割り当てたのも問題です。例えば、先述した機種依存文字の「①」は、Shift-JISでは「8740」というキャラクターコードとなります。これがWindows環境においては「①」と正しく表示されますが、Mac環境では「㈰」と文字化けします。この要因により、異なる環境下において文字化けが発生するようになりました。

文字化けの解決方法

なお、Webページ上で起きた文字化けは、正しい文字コードを読み込ませることで解決します。一般的なブラウザは、文字コードの変換機能を搭載しており、それらを一つひとつ試すことで、正しく表示されるようになります。Webページ閲覧時の文字化けに悩んだ際はぜひお試しください。

文字化けしないために気を付けること

機種依存文字による文字化けは、文字コードにUTF-8を採用することで防げます。UTF-8とは、符号化文字集合と呼ばれるUnicodeで定義された文字コードのことです。ASCIIコードに世界各国の文字を加えたもので、日本語、韓国語、ロシア語、ギリシャ語などを共通の文字コードで表現できるのが特徴です。
UTF-8はASCIIコードとの互換性が高く、世界中のWebサイトやソフトウェアに採用されています。いわば“コンピューターにおける世界共通言語”です。文字に割り当てた固有番号が閲覧環境に左右されず、文字化けが起こらなくなります。

運営者側の対策

文字化け対策は、Webサイトの運営者と閲覧者でやるべきことが変わります。まず、サイト運営者はHTMLのコーディングにおいて、ファイル内に文字コードを指定するタグを入れてください。文字コードはmetaタグを使い、「<meta http-equiv="content-type" charset="utf-8">」のように記述します。この作業により、Webページで使われる文字コードをブラウザが解釈できるようになります。
仮に指定しなかった場合、ブラウザは文字コードの判別、解釈ができません。UTF-8で書いたWebページをShift-JISで表示するなど、想定外の動作をすることがあります。それが文字化けに繋がるのはいうまでもありません。なお、metaタグで指定する文字コードは、UTF-8がおすすめです。最新のHTML規格であるHTML5においても、UTF-8を文字コーディングに推奨しています。

閲覧者側の対策

閲覧者目線での文字化け対策は、専用サービスを活用するのがおすすめです。例えば、文字化けした文章をフォームに貼り付け、内容を解読してくれる無料サービスがあります。ブラウザの文字コード変換機能を使っても解決しない場合に有効です。

文字化けは未然に防止でき、従来よりも大きな問題ではなくなりました。それでもなお、一定の対策は必要です。UTF-8などを積極的に採用し、文字化けしない閲覧環境づくりを進めてください。

まとめ

文字化けを防ぐ最も簡単な方法は、UTF-8でWebページを書くことです。機種依存文字による文字化けから開放され、ユーザーに快適な閲覧環境を提供します。それにともない、一部の機種依存文字はサイズが小さくなり、読みづらくなるケースがあります。「㈱」といった省略文字、「㎜」などの単位が代表的です。機種依存文字を使用する場合、プレビュー画面で表示を確かめてから利用することをおすすめします。
また、Webサイトだけでなく、メールでもこのような機種依存文字の問題は存在します。メーラーやメール配信サービスによってもUTF-8の対応有無が分かれますので注意が必要です。メールマーケティングサービスの配配メールでは、多言語配信オプションを利用すれば、UTF-8でのテキストおよびHTMLでのメール配信が可能です。

信頼と実績のメール配信サービス配配メール

何度配信しても定額のメール・メルマガ配信サービスは「配配メール」

無料でもらえる

今なら売上UPノウハウが詰まった
メルマガ成功事例集をプレゼント!

資料請求・お問い合わせ

03-6675-3612

受付時間 | 平日 9:00~17:00 (土日祝日除く)

ページトップへ