ぴろログ

Output Driven

洋書を読むために一晩google翻訳と格闘した話

和訳されていない技術書

オライリー本の「Zero Trust Networks」に興味津々なのですが、日本語に翻訳されておらず、四苦八苦しながら原書(英語)を読んでいます。 英語は得意でないため効率的な読み方がないかとネットで検索したものの、なかなかヒットしない(というか、みんな困っているように見える)ため、自分の経験を書き残しておくことにしました。 残念ながら私の実践している方法も効率が良いとは言えないため、どちらかというとアンチパターンの共有という意味合いが強いです。

前提:私の英語スキル

高校で英検2級を取得。そこを頂点に、リーディングスキルは下落の一途を辿っています。
簡単な文章ならなんとなく読めますが、技術書レベルになるとちょっと辛い、、といった感じです。

まずは紙の本を買った

とりあえず紙媒体の書籍を購入しました。電子版の技術書は読んでいても頭に情報が入ってこない(蓄積されず、そのままどこかいってしまう感覚)、という個人的な理由からです。
ワクワクしながらページをめくったものの、すぐに挫折。

  • 意味がわからない単語が出てくる都度、Google翻訳に単語を入力して翻訳、という作業を繰り返す。苦痛。
  • スマホ版アプリのGoogle翻訳も試したが(カメラで入力を代替)、位置を微調整しながら対象の文章をスキャン→認識→翻訳の一連の流れが、PCでの翻訳より時間がかかり、これまた苦痛。

最初の1ページで紙媒体を諦め、次の案を考えました。

Kindle本を購入

はい、Kindle本も購入しました。同じ本を2冊買ったことになります。(オライリーKindle本もいいお値段するんですよね。。)
Kindleからテキストをコピペできれば、Google翻訳がノリノリに捗るだろうと考えたわけです。

が、これもうまくはいかず。。
※ここではKindle for Macを使っています

  • Kindle内蔵の英和辞書を利用
    Kindleには「プログレッシブ英和中辞典」が内蔵されています。テキストを選択すると、その単語の意味を表示させることができます。
    • 文章(複数の単語)の翻訳はできない。単一の単語の意味を表示するのみ。
    • 単語が持つ全ての意味が表示されるため、文脈を自分で判断して適切なものを選択する、という作業が面倒。(英語の勉強にはなりそうだけど、目的は本の内容のインプットなので。)
    • 技術的な単語は辞書に載ってない。
  • Kindle Cloud Readerの利用
    Kindle Cloud ReaderWebブラウザKindle本が読めるサービスです。(初めて知った。) こちらのブログで、『Translate Anywhereとの組み合わせでWebページ全体を翻訳』する方法が紹介されているのを見つけて試した次第です。
    • これで楽々読めるじゃーん → Translate Anywhereが動作せず、断念
    • Kindle Cloud Readerではテキストのコピー操作が制限されているようで、Google翻訳にもかけれず。。

と、ここで思いついたのが、Chrome拡張機能の「Google翻訳」による「ページの翻訳」機能です。Webページ全体をまとめて翻訳してくれてありがとうGoolgle。…って、あれ、翻訳精度ヒドすぎじゃない??

…何が起きたかというと、通常(って言うのかな?)のGoogle翻訳と、翻訳結果が違うんです。下の例は、Amazonの商品説明に載っていた一文の翻訳結果です。

原文Google翻訳
(通常)
Google翻訳
(ページの翻訳)
The Zero Trust Model treats all hosts as if they’re internet-facing, and considers the entire network to be compromised and hostile.
Zero Trust Modelは、すべてのホストをあたかもインターネットに面しているかのように扱い、ネットワーク全体が危険にさらされ、敵対的であると見なします。ゼロ の信頼 モデルが決まる ことを、全てのホストを さ 扱わ よう であれば、彼らがしているインターネットに直接接続。

Kindle Cloud ReaderとGoogle翻訳の組み合わせが良くないのでしょうか。翻訳エンジンが複数あるとも考えられないし。とにかく、原文のままの方がマシですね。というわけで、次です。

  • Kindleからひたすらコピペ
    この辺りから諦め感が出てきて、とにかく手を動かすか、、という心境です。
    • Kindleで翻訳対象の文章をコピー
      • ショートカットキー(Ctrl + C)の使用が制限されているため、右クリックして「コピー」を選択。効率が悪い。
      • ペーストすると、末尾に書籍名や"Kindle版"という文字列が追加されている。(著作権の絡みでクリップボードに自動で入ってくる?)
    • Google翻訳にかける。
    • 対訳形式となるよう、スプレッドシートに翻訳結果をコピペしていく

まぁ時間がかかります。一気に翻訳しちゃいたいですが、「文字数多すぎ!」と怒られてしまうので、チマチマ進めました。(上限数は5,000文字→フォントサイズがミニマム状態のKindle本で1ページちょっと。)
ちなみに、Google翻訳にはドキュメントファイル(.txt、.docx、.pdf、等)を丸ごと翻訳する機能があり、こちらは文字数の上限がありません。


上のスプレッドシートのキャプチャでは隠れていますが、書籍の段落単位でセルを分割しています。段落が変わると、C4セル→C5セルへ、といった感じです。(単一セルに入力可能な文字数制限と、見やすさの観点から。)

作業単位としても5,000文字ぐらいがちょうど良かったので、ファイル全体の翻訳機能は使いませんでした。

余談ですが、この作業に着手したのがAM2時ぐらい。白目のコピペマシーンと化していました。

翻訳後の文章を読んでみた

下準備が整ったところで、翻訳された文章を読んでみます。

  • 良かった点
    • 「読む」行為に集中でき、健全なメンタルが保てる。
    • ある程度は文脈が汲み取られており、最低限の意味は通る文章ではある。
  • イマイチな点
    • 文章のレイアウトが崩壊。(後述)
    • キーワード的な固有名詞も日本語に翻訳されてしまう。(英語のままの方がわかりやすい)
    • 技術的要素の多い文章は翻訳精度が低い。

イマイチを通りこして致命的だったのが、コピペ作業による「文章のレイアウト」の崩壊でした。
段落や箇条書き、太字表現、等々の情報が残らず、フラットな構造になってしまうためわかりづらい。頭の中で構造を組み立てるのに苦労します。

ここで振り返ってみた

(翌朝)「あれ、目的はなんだっけ?」と気づき、状況を整理することにしました。

  • 「読む」行為に対する障害は排除したい
    • 相応の頻度で理解できない表現が出るので、その度に翻訳が必要。
    • 「読む」→「翻訳作業」への切替により、インプットしていた情報がリセットされがち。
    • リズムも崩されるので、集中力・モチベーションの低下に繋がっている。
  • 翻訳作業に執着しすぎている感がある
    • 日本語への翻訳にフォーカスしすぎている。翻訳憎し、となっている。
    • 「木を見て、森を見ず」。全体の文脈を読み取るのではなく、字面だけを追っている。

日本語の本でも、難解で読むのに苦労するものがあります。そういう場合、1回目はざっくり読み通して流れや構成を把握し、2回目で詳細をおさえる、という読み方が定石ですよね。
英語で書かれていようが原則は変わらないはず、ということで、一語一句の理解はスコープ外としました。特に今回の書籍はセキュリティの"概念"を述べるものなので、まずはエッセンスが抽出できればOK、とします。(最終的にはちゃんと翻訳してみたいけど。)

今はこうやって読んでいる

紆余曲折を経た結果です。

  1. KindleGoogle翻訳へのコピペで、1章分をまとめて和訳しておく
    • 対訳形式で、Googleスプレッドシートにコピペしていく。
    • 翻訳作業のために 「読む」行為を中断しないことが目的
    • 翻訳の正確さ、文章としての読みやすさにはこだわらない。
  2. 文章のレイアウト情報をマークダウン形式で書き出す
    • 段落、小見出しに当たる部分を書き出す。
      StackEditを使うと、Googleドキュメントにマークダウン形式で記入できます。
    • レイアウトだけで話の大筋を理解する
      • よくわからなければ、対象のテーマと見出し等の単語をネットで検索して知識を補強。(似たテーマの日本語記事があるはず。)
      • そのほうが技術書の内容よりとっつきやすい。
  3. 技術書を英語で読み進める
    • スプレッドシートで、英語の方を読み進める
      • 和訳は文章としての違和感を感じることが多く、ツッコミを入れたくなってしまう
      • 2で文脈は把握できているので、そこに英語を乗せて詳細を補完していくイメージ。
      • 理解できない表現が出た時だけ和訳を読む。
    • 自分なりの表現で、2にメモ(追記)していく。
      • 箇条書き。
      • 日本語だと読み返した時に記憶が蘇るけど、英語だと同じようにはいかないので。(これは私の英語レベルが低いことが原因)

「そりゃそうですよね」感が強いですが、ここに辿り着くまでが長かったです。

まとめ

  • 英語の技術書を読む場合は、Kindle本を買うべし。
  • 「読む」行為に集中するため、まとまった分量をGoogle翻訳にかけておく。
  • 一字一句の理解に固執しない。文脈や概要の把握を優先すべし。

今後

一人で読み解くには時間がかかりそうだったので、コミュニティ(もくもく勉強会)で有志を募り、章単位で分担して要約作業中です。完成したら、内容を紹介していきたいと思っています。

追記(2019/06/01)

便利機能あるやん。。 gotcha.alc.co.jp Google スプレッドシート=googletranslate(訳したいセル,"en","ja")スプレッドシート上で翻訳作業ができるので、コピペ回数が減って楽になります。