Minisforum X400 (2) テ料理時代にはMacとWindowsの改行コードの違いが深刻な問題だったが…

 基幹PCのTeXliveのupLaTeXでノーミスで通るように改修したPubMedアブストラクトの80万行のテキストが、X400上のTeXliveではエラーを頻発する。
 おそらくX400のTeXliveのUTF-16処理の微調整を要する問題なのであろうが、Windows 10用にxyzzyの後継、かつJEditΩのカウンターパートとなる64 bitアプリのテキストエディタを探そうといくつか候補(Visual Studio Code, Sublime Text 4, Atom editor)を試用しながら、デバグを行ってみた。
 それぞれに実装されているテキスト置換機能はもちろん正規表現をサポートしていて、そういうところに機能の優劣があろうはずもない。X400では250 MBのテキストファイルの読み込み時間は一瞬で、ほとんど意識せずにすむので25行くらいのファイルのつもりで扱っているが、なかにかなり多数の場所の一括置換をたくらんでいるのを察知するや亡くなってしまわれるエディタもあった。
 それで、気がついてみるとPubMedのプレーンなテキスト(UTFコード)の中にギリシア文字が表示されているのである。
 テ料理本の時代以前から生物分子のサブユニットなどにギリシア文字は頻用されてきたが、もちろんASCIIキャラクタの範囲外であるから、半角aと打ってそこだけフォントの種類をSymbolにするとか、元の原稿には$\alpha$と表記してLaTeXを使って組版したりしてきた。
 あれから30年も経過すると、こんなに便利になったかと感激すべきところであるが、実にLaTeXのエラーの原因のほとんどはこのUTF文字コードが解釈できないことであった。
 その根源には筆者がUTF-8(16?)をうまく解釈できるようにパッケージを読み込ませるスクリプトを書く技量がないことがあるのだが、候補エディタの中には、エディタ画面上でコピーした文字を検索窓にペーストできなかったり、検索窓の中にUTFコードで文字を書き込めなかったりした。

本ブログではamazon associate広告を利用しています。