新米フリーランスである私は、Mac使用の方と取引することになりこの問題に遭遇しました。
Macで作成した文章がWindowsで文字化けするってのはよくある話で、その対処法もネットではわんさかありますね。
ただ、私がMac無知なだけに、その方たちの対処法を読んでも自分の問題にどう当てはめていいか分からず苦労したので、記録として綴っておきます。
[ 目次 ]
※Mac全然使ったことないので超初心者目線の記事です。
また、正規化形式等の知識も無い方向けの記事になるかと思いますのでご了承ください(^^;
濁点・半濁点が“?”(半角クエスチョンマーク)になるんですけど・・・
Macで作成した文章(Wordのdocxファイル)を、Windowsのテキストエディタで開くと、濁点・半濁点が“?”(半角クエスチョンマーク)になっていました。
「が」→「か?」という具合です。
今までやり取りがあったお相手(Macで編集している人)だけに、「ん?なんで今回だけこうなったんだ??」とWindows専門の私は謎でした。
色々原因を調べて試行錯誤し、結局以下の方法で無事解決しました。
NFD→NFC変換で無事解決
一発で解決してくれる私の求めてる記事は・・・
ありました!!
以下の記事の変換ツールを使わせていただき、解決しました!
Mac で PDF からコピーした濁点/半濁点付きの文字列を Firefox に貼り付けた時におかしくなる問題の対処方法 – 強火で進め
ページ真ん中あたりに紹介されている、こちらのツールです。
とても急いでいたので大変助けられました!!ありがとうございます!!
変換ツールにMacから来た文章をコピペして、「変換」ボタンクリック後、変換された文章をテキストエディタで開いてみると一発で変換されていました!
原因は正規化の違い
原因は「Unicodeによる文字の正規化の種類の違い」ということでした。
MacではNFDの正規化形式、WindowsではNFCの正規化形式を使用している、とのこと。
Uincodeでは
- 「が」→「が」という単体で表現
- 「が」→「か」+「゛」の組合せで表現(合成文字)
という2パターンで表現することができるよう。
2パターンの表現方法があると、検索時に両方を考慮しないといけないので、正規化という作業が必要になるのです。
正規化についても
1.全ての文字を単体で表現するNFC(Normalization Form Canonical Composition)
⇒「が」
2.全ての文字をバラバラで表現するNFD(Normalization Form Canonical Decomposition)
⇒「か」+「゛」
の2つの方法があるようで、私はWindowsなので、この2つ目の方法であるNFDで正規化されているみたいですね。しかも、バラバラになった濁点・半濁点部分が “?”(半角はてな)になっていたので、ネットで沢山出てきた「濁点部分がばらばらになる」という現象とはまた別物なんだ!と思ってしまったのです。
しかし、上記のNFDからNFCへ変換するツールを使わせていただいたところ無事解決したので、同じような原因だったんでしょうね。
私がすぐに解決できなかった理由
私はMacで作られたWord(docxファイル)をWindowsで開き、TeraPad(テキストエディタ)に貼り付けたところ、この現象が発生しました。
しかし、貼り付け先によって違う現象が起きたので時間をくってしまいました^^;
色々コピペして試してみたのがこちら↓↓
- メモ帳:問題なし(「が」の単体表現)
- ワードパット:問題なし(「が」の単体表現)
- ブラウザ(IE/Chrome/Firefox)の入力フォーム:問題なし(「が」の単体表現)
- 秀丸エディタ:バラバラ(「か」+「゛」の合成文字)
- TeraPad:バラバラかつ “?”(「か」+「?」の合成文字)
でした。
とにもかくにも、先ほど紹介した
Mac で PDF からコピーした濁点/半濁点付きの文字列を Firefox に貼り付けた時におかしくなる問題の対処方法 – 強火で進め
の記事にあるNFD→NFC変換ツールを使わせいただいて解決したので、濁点が“?”になってようが同じ問題だったのかな?と勝手に思っております。
どなたか詳しい方がいらっしゃれば勉強の為にコメントいただけると助かります。