MacでPDFからコピペした文字が濁点/半濁点になる問題

MacでPDFからコピペしようとすると,例えば「だ」が「た」+「”」とペーストされてしまう問題。引用する際などに面倒くさい。。。

そこで,MacでPDFからコピペする方法について調べてみました。

まず,この現象が起きる原因は・・・

MacOSのファイルシステムであるHFS+が使用している、UTF-8の正規化方法が「NFD」というもので、2文字に分けて正規化されてしまうことが原因。

Quita(@takuya abe)様より引用

とのこと。まぁ,簡単に言うとMacと仕様と言うことですね(省略しすぎ?)

今回は初心者向けになるべく丁寧に説明をしてみたいと思います。

まず最初に nkf Network Kanji Filter プロジェクト日本語トップページ – OSDN から,nkf2.1.5(執筆時点の最新バージョン)をダウンロードしましょう。

ダウンロードが完了したら,[ターミナル]を起動します。LaunchPadの「その他フォルダ」の中に入っていますね。


(ここから先は,kengo92iの日記様の記事を参考にさせていただきました。)

まずは,$の後に,以下の様に記入してみましょう。大文字と小文字を間違わないでくださいね。

$ cd ~/Downloads

記入し終えたら,Enterキーを押します。
また$が表示されますので,以下の様に入力してみましょう。

$tar xvzf nkf-2.1.5.tar

バージョンが異なる場合は,数字を変えてくださいね。
入力し終えたら,次の様に入力してくてください。
一行一行,入力後に[Enter]を押してくださいね。

$ cd nkf-2.1.5
$ make
$ sudo make install
$ which nkf

makeの後に次のような表示がでる場合は,インストールが完了するのを待って,もう一度「make」からやり直してください。

xcode-select: note: no developer tools were found at '/Applications/Xcode.app', requesting install. Choose an option in the dialog to download the command line developer tools.

which nkfの後に・・・

/usr/local/bin/nkf

もしくは

/opt/local/bin/nkf

といった一文が表示された場合は,作業は順調です。

出てきたら,この一文をコピーしておきましょう。

(ここから先は,Quita(@takuya abe) 様の記事を参考に,手順を整理してみました。)

LaunchPadの「その他」から「Automator」を起動してみましょう。ロボットみたいなアイコンです。

次に,画面左下の「新規書類」を選択します。

クイックアクションを選択してみましょう。

「クリップボードにコピー」をダブルクリックしましょう。

「シェルスクリプトを実行」をダブルクリックします。

先ほどコピーしたものを「貼り付け」してください。
さらに,その後に「-w –ic=UTF8-MAC」と入力してください。
半角空白を忘れずに入れてくださいね。

もう一度,「クリップボードにコピー」をダブルクリックしてください。

編集から「保存」を選択してください。
クイックアクションの名前は任意ですが,仮に「PDFtxtCP」とでもしておきましょう。

Launch Padから「システム環境設定」をクリック。

キーボードをクリック。

ショートカットタブの中に,先ほど作った「PDFtxtCP」があるはずです。

チェックをつけて,「ショートカットを追加」をクリック

お好きなショートカットを設定してください。
例は「Shift(↑)」ボタンを押しながら,「command」キーを押しながら「c」キーを押しています。(command+cだと,通常のコピーと重複するので避けたほうが良いでしょう。)

これで,完了です。PDFを何か開き,テキストを上記のショートカットでコピペしてみてください。
きっと「濁点」問題は解消していると思います。

ただし,当然のことですが,コピーした際は必ず引用元を明記する様にしてくださいね。

追記)うまくいかない場合は,一度「メモ」などに貼り付けてみましょう。うまくいくと思います。

コメント

タイトルとURLをコピーしました