お役立ちコラム
環境依存文字の一覧 | 文字化けの理由と避ける方法

「機種依存文字(環境依存文字)は文字化けする」という考え方は、一昔前のものです。UTF-8などの文字コードが普及した今、機種依存文字による文字化けに悩まされる機会が減りました。本記事では、代表的な機種依存文字をご紹介するとともに、Webページが文字化けするメカニズムと、文字化けしないために気を付けることを解説します。
目次
環境依存文字とは?
一般的に、環境依存文字と機種依存文字は同じ意味合いで使われることがほとんどです。いずれも特殊な記号や半角カタカナなど特定の機種にしか存在しない文字であり、対応していない機種や環境においては正しく表示できずに文字化けを引き起こしてしまいます。その場合、元はどんな文字だったのかを判別することはできません。詳しい定義については次項でご紹介します。
機種依存文字とは?
機種依存文字とは、WindowsやMacなどのOSやフォントに依存する文字を指します。環境依存文字とも呼ばれ、元々は特定の環境下で使用するために用意されたものです。一方、機種依存文字の影響からWebサイトが正常に表示されなかったり、文字化けを起こしたりすることがありました。これまでのWeb業界において、機種依存文字をサイト構築に使わないのは、一種のマナーとなっていました。
近年はUTF-8の登場により、機種依存文字による文字化けに悩まされる機会が減りました。これについては次でご紹介しますが、以前よりも避ける必要はなくなっています。
UTF-8とは?
UTF-8は世界で広く使用されている文字コードであり、世界中のあらゆる文字を一意のコードで表現できる「Unicode」の一種です。文字コードの種別によっては利用環境毎に各文字のコード番号が大きく違う場合がありますが、Unicodeであればどのような環境下でも同じ見え方を実現できるのが強みといえます。インターネット上のWebサイトを構築する言語のひとつであるHTML5においてもエンコーディングにUTF-8を活用するように推奨されており、現在では世界中のWebサイトの90%程度がUTF-8で制作されているともいわれています。言語体系の異なるさまざまな人がインターネットを利用する時代になった今、Web上においては最もポピュラーであるといえるでしょう。
UTF-8はASCIIと互換性をもち一部の文字に共通している部分があるため、世界中のさまざまなサービスやソフトウェアに使われています。
名前が似ている文字コードのひとつにUTF-16がありますが、UTF-8ほどは広く普及していません。UTF-8とUTF-16の大きな違いは「1文字を表現するために何バイト使用するか」の部分にあり、UTF-8では英数字を1バイト、日本語を3バイトで表現するのに対し、UTF-16では英数字も日本語も全て2バイトで表します。
主な機種依存文字一覧
代表的な機種依存文字として、「丸囲みの数字」「ローマ数字」「単位」「省略文字」「縦書き記号」が挙げられます。左から順に一覧で見ていきます。
①②③④⑤⑥⑦⑧⑨⑩⑪⑫⑬⑭⑮⑯⑰⑱⑲⑳(丸囲みの数字)
Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ(ローマ数字)
㎜ ㎝ ㎞ ㎎ ㎏ ㏄ ㍉ ㌔ ㌢ ㍍ ㌘ ㌧ ㌃ ㌶ ㍑ ㍗ ㌍ ㌦ ㌣ ㌫(単位)
№ ℡ № ㏍ ℡ ㊤ ㊥ ㊦ ㊧ ㊨ ㈱ ㈲ ㈹ ㍾ ㍽ ㍼ ㍻ ≡ ∑ ∫(省略文字)
纊 鍈 蓜 炻 棈 兊 夋 奛 奣 寬 﨑 嵂 咊 咩 哿 喆 坙 坥 垬 埈(縦書き記号)
上記の環境依存文字は、通常通りに使用すると文字化けを起こす可能性があります。それでも環境依存文字を使いたい場合、複数の文字を組み合わせて表現します。例えば、「Ⅵ」というローマ数字は大文字の「V」と「I」と並べて「VI」と表します。「㊤」は「(上)」、「㎜」は「mm」といった具合です。
また、WindowsとMac共通で使える、文字化けしそうでしない文字もあります。
〇 ○ ◇ □ △ ▽ ☆ ● ◆ ■ ▲ ▼ ★ ◎ ◯ ♂ ♀ 〒(マーク)
+ - ± × ÷ = ≒ ≠ ≦ ≧ < ≪ ≫ ∞ ∽ ∝ ∴ ∵ ∈ ∋(学術記号)
Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ (ギリシャ文字)
# & * @ § ※ 〓 ♯ ♭ ♪ † ‡ ¶ 仝 々 〆 ー ~  ̄ _ ―(その他)
上記は双方のOSで使える一方、その見た目から機種依存文字に間違われることがあります。普段使いしても問題ありませんので、覚えておいてください。
なぜ文字化けするのか?

機種依存文字の文字化けは、Shift-JISという文字コードを使用する際に起こります。文字コードとは、PC上で文字を表示するキャラクターコードのことです。Shift-JISもその規格に含まれます。
PCが扱えるデータ
そもそもPCが扱えるデータは、「0」と「1」の2進数のみです。「A」や「B」といった文字を表現するには、8bitのバイト表現に文字を対応させる必要がありました。そのような状況で考案されたのが、ASCIIコードをはじめとするバイト表現リストです。「A」は「00110000」、「B」は「00110001」というように、特定のバイト表現に対してさまざまな文字、記号を割り当てました。
日本語を表現する文字コード
一方、日本語を8bitで表現するのは困難でした。日本語には平仮名や片仮名に加え、漢字が存在するためです。そこで0から9の数字、AからFの文字を組み合わせる16bitの文字コードが作られます。それがShift-JISであり、1982年頃に誕生しました。
日本語を表現する文字コードは、Shift-JISのほかにJIS、EUC-JP、UTF-8、UTF-16などがあります。これまで、日本語のWebサイトで使われてきたのはShift-JISであり、同規格で扱えない文字は機種依存文字に分類されました。
規格毎のキャラクターコード
また、文字に割り振られたキャラクターコードは、規格毎に異なります。例えば、EUCにおける「あ」のキャラクターコードは「A4A2」ですが、Shift-JISでは「82A0」に割り振られています。この違いにより、Webサイト上で特定の文字を異なる規格間で変換すると、文字化けする可能性が出てきます。
ベンダーがShift-JISに定義されていないキャラクターコードに、新しく文字を割り当てたのも問題です。例えば、先述した機種依存文字の「①」は、Shift-JISでは「8740」というキャラクターコードとなります。これがWindows環境においては「①」と正しく表示されますが、Mac環境では「㈰」と文字化けします。この要因により、異なる環境下において文字化けが発生するようになりました。
文字化けの解決方法
なお、Webページ上で起きた文字化けは、正しい文字コードを読み込ませることで解決します。一般的なブラウザは、文字コードの変換機能を搭載しており、それらを一つひとつ試すことで、正しく表示されるようになります。Webページ閲覧時の文字化けに悩んだ際はぜひお試しください。
関連記事はこちら日本語メールの仕組みとは?文字コードの種類と文字化けしたときの対処法をご紹介
文字化けしないために気を付けること

機種依存文字による文字化けは、文字コードにUTF-8を採用することで防げます。UTF-8とは、符号化文字集合と呼ばれるUnicodeで定義された文字コードのことです。ASCIIコードに世界各国の文字を加えたもので、日本語、韓国語、ロシア語、ギリシャ語などを共通の文字コードで表現できるのが特徴です。
UTF-8はASCIIコードとの互換性が高く、世界中のWebサイトやソフトウェアに採用されています。いわば“コンピューターにおける世界共通言語”です。文字に割り当てた固有番号が閲覧環境に左右されず、文字化けが起こらなくなります。
運営者側の対策
文字化け対策は、Webサイトの運営者と閲覧者でやるべきことが変わります。まず、サイト運営者はHTMLのコーディングにおいて、ファイル内に文字コードを指定するタグを入れてください。文字コードはmetaタグを使い、「<meta http-equiv="content-type" charset="utf-8">」のように記述します。この作業により、Webページで使われる文字コードをブラウザが解釈できるようになります。
仮に指定しなかった場合、ブラウザは文字コードの判別、解釈ができません。UTF-8で書いたWebページをShift-JISで表示するなど、想定外の動作をすることがあります。それが文字化けに繋がるのはいうまでもありません。なお、metaタグで指定する文字コードは、UTF-8がおすすめです。最新のHTML規格であるHTML5においても、UTF-8を文字コーディングに推奨しています。
閲覧者側の対策
閲覧者目線での文字化け対策は、専用サービスを活用するのがおすすめです。例えば、文字化けした文章をフォームに貼り付け、内容を解読してくれる無料サービスがあります。ブラウザの文字コード変換機能を使っても解決しない場合に有効です。
文字化けは未然に防止でき、従来よりも大きな問題ではなくなりました。それでもなお、一定の対策は必要です。UTF-8などを積極的に採用し、文字化けしない閲覧環境づくりを進めてください。
まとめ
文字化けを防ぐ最も簡単な方法は、UTF-8でWebページを書くことです。機種依存文字による文字化けから開放され、ユーザーに快適な閲覧環境を提供します。それにともない、一部の機種依存文字はサイズが小さくなり、読みづらくなるケースがあります。「㈱」といった省略文字、「㎜」などの単位が代表的です。機種依存文字を使用する場合、プレビュー画面で表示を確かめてから利用することをおすすめします。
また、Webサイトだけでなく、メールでもこのような機種依存文字の問題は存在します。メーラーやメール配信サービスによってもUTF-8の対応有無が分かれますので注意が必要です。メールマーケティングサービスの配配メールでは、多言語配信オプションを利用すれば、UTF-8でのテキストおよびHTMLでのメール配信が可能です。
関連記事はこちらECサイト運営におけるメルマガの役割とは?
関連記事はこちらECサイト運営におけるメルマガ配信のポイント
関連記事はこちらメルマガとは?10分でメルマガを説明できるようになる基礎講座
「配配メール」は、企業の集客・販促活動に携わる方のメールマーケティング業務を支援するサービスです。
シンプルな配信操作、見やすい成果指標レポート、メールの反応による見込み客の可視化、サイト来訪通知といった機能によりメールマーケティングの実践をサポートします。
また、機能の提供だけではなく、ナレッジ提供や個社の運用に踏み込んだ手厚いアフターフォローにより、お客様の販促の成功に向け伴走します。
メール配信の初心者から本格的なメールマーケティングの実践を目指している方まで、どなたでも安心してお使いいただけるサービスとして、お客様に長く愛され、98%の継続利用率を維持しています。
記事執筆者紹介
人気記事
- メールの一斉送信を効率化!メール配信ソフトの活用方法から厳選したおすすめのツールを紹介 2022年12月19日
- 一斉送信メールのマナーとは?複数送信のBCC・CCの使い分け 2021年11月02日
- メルマガとは?10分でメルマガの基本から効果的な配信方法がわかる基礎講座 2022年11月11日