半角カタカナ

2007-07-28さんのところで発見.TeXネタ.

いわゆる「半角カタカナ」*1ASCIIでいうところの128番から256番の文字はTeXでは鬼門です.日本で標準的なpTeXでは,ソースの文字コードによって

  • SJISの場合は無視(組版には現われない)
  • JISの場合はエラー(コンパイルすら通らない)
  • EUCの場合は,生成されたDVIファイルで文字化け

となります.欧文の場合,128番から256番まではTeXでの設定に応じてアクセント記号つき文字になったりヘブライ語になったりで,もっと複雑になります.

注意が必要なのは,「半角カタカナ」じゃないような文字も「半角カタカナ」であることです.かぎ括弧,濁点・半濁点,小さな中黒なんかが問題を起こす文字の代表でしょう.

こういうのが混入しそうな場合は,あらかじめ簡単なスクリプトでも書いて置換するようにしましょう.勝手に置換されてると怖いような場合は,一緒に何かのマークを入れるようにしておいて,そのマークを検索していけばよいのです.

このことについては

  • LaTeX2e 標準コマンドポケットリファレンス pp.47--49

にもうちょっと包括的に書いてあります.

ついでに,Gohongi Lab.さんの以前のエントリに日本語と英文のフォントの変更コマンドについてありましたが,\textbf は日本語に使うときには \textgt と同じになるように調整されています.したがって,全部 \textbf にすれば和文もゴシックになります.\bf や \bfseries も同様ですが,\bf は古いコマンドなので使用は推奨されていません.私が作るクラスファイル群では苦情が来ない限り,\bf/\it/\em/\sf/\mc/\gt は使えないようにします.

ただ,\textbf/\bfseries は「ボールド体」にするものですが,和文の「明朝のボールド」とは果たしてゴシックでよいのか?という疑問もあります.奥村先生の「jsclasses」では,和文のゴシックと欧文のサンセリフをペアにしています.私もこの組合せが妥当だと思います.

私は「明朝体のボールド体」はやはり「太明朝」が妥当かと思います.ただ,標準で「太明朝」は使えない,和文は明朝・ゴシックのみだという束縛があるのでなかなか一筋縄には行きませんね.職業的にTeXを扱っている人ならばこれくらいの細工は必須でしょうし,行っているのでしょう.モリサワのフトミンあたりがちょうどいいのかな.

*1:はてなで最初のTeXネタが半角カタカナというのもなかなかカーブしてていい.