訳者あとがき(ウェブ版)
原著者のTobius Baer氏が髪の毛の本数を予測するアルゴリズムを例にしていますので、髪の毛にまつわるストーリーから始めましょう(若干読みにくいかもしれませんが、許してやってください)。
約30年前、祖母から木製の櫛(つげ)をもらいました。彼女は鹿教湯温泉で購入しました。それは数年前に壊れました(それは長く続きました)。なので、それ以来プラスチック製の櫛を使っていましたが、木製の櫛を買うことを考えていました。
去年の10月に吉祥寺(東京都武蔵野市)に行った時、中国のくし屋が新しくオープンしたのを見つけました。私が店に入ると、日本語が話せない若い中国人男性がいくつかの商品を見せてくれました(店には他の店員はいません!)。彼は英語が話せると言ったので、私たちは英語で話しました。意味がわからないXXXを刺激することで、木の櫛が髪に良いとのことでした。私は彼にそれを書き留めるように頼みました、そして彼はツボ(日本語で「坪」)を意味する「坪穴」を書きました。
彼は、店は数ヶ月前に横浜から引っ越したばかりだったが、Corvid-19の不況のために翌月閉店すると述べた。木製の櫛を買いました。彼が言ったようにその店は翌月閉店し、それ以来そこに店は開いていません。
くしを買ってから2〜3週間で髪が暗くなってきました!!今は8月で、白髪の80%が黒に変わりました!!信じられますか?!
ちょっと変な日本語ですが、だいたい内容はおわかりいただけたのではないでしょうか。実は訳者の実体験を書いた英文を、機械学習を利用した「ニューラル機械翻訳(NMT)」の代表格であるGoogle翻訳(https://translate.google.co.jp/)で日本語にしたものです(翻訳実行は2021年8月25日。英文および日本語版はこのページの最後にあります)。
さて、上の訳文にいくつか意味のよくわからない点がありますが、そのうちのひとつ、最初の段落の「(それは長く続きました)」についてもう少し検討してみましょう。私の書いた英文は「It lasted long.」でした。確かに英文だけでは、「長続きした」のか「長持ちした」のかはわかりませんが、人間ならば「30年前に買った櫛が数年前に壊れた」のなら「長持ちした」を選択します。
この英文を少し変えて訳してみると、ニューラル機械翻訳(NMT)のひとつの特徴を表していると思われる現象が出てきます。
(a) It lasted long.
それは長続きしました。
(b) It lasted longer.
それは長持ちしました。
(c) My grandmother gave me a wooden comb, which lasted long.
私の祖母は私に木製の櫛をくれました、それは長続きしました。
(d) 30 years ago, my grandmother gave me a wooden comb, which lasted long.
30年前、祖母が私に木製の櫛をくれました。それは長持ちしました。
(e) 30 years ago, my grandmother gave me a wooden comb. It lasted long.
30年前、祖母が私に木製の櫛をくれました。 それは長続きしました。
(b)で "long" を "longer" と変えただけで「長持ち」に訳が変わりました。また、(c)で ", which lasted long" と何が「lasted」なのかを少しわかりやすくしても訳は変わりませんが、(d)で "30 years ago" を加えると「長持ち」に変わります。
NMTでは、「お手本」とする大量の例文(原文と訳文)を入力して、それをベースに「翻訳機械」を作ります。「longer」とか「〜years ago」というような表現が現れた例文では「長続きする」という訳よりも「長持ちする」という意味で使われることが多かったのではないか、と訳者は想像します。
2000年頃の翻訳ソフトが手元にあったので、同じように翻訳してみると、どの文を訳しても「長く続きました」という訳文になりました。ある意味一貫しています。そして「辞書登録」をすると訳を変えることができます。
まず、lastの訳語として「もつ」を登録して優先するようにしてみました。すると、すべての文で「長くもちました」となりました。自分の好む訳を優先することができます。このほうが「下訳には便利」なのです。「訳の不安定さ」があると、いつも気をつけてチェックしなければなりません(NMTを使う際の留意点のひとつと言えるでしょう)。
続いて、「長持ちする」という訳語を出したいと考え、「last long」を「長持ちする」で辞書登録すると「It lasted long.」は「長持ちしました」になりましたが、「It lasted longer.」は「より長く続きました」のままでした。形容詞の比較級も絡むため一筋縄ではいきません。
さて、翻訳出版の検討段階でこの本を先に読んだのはもうひとりの訳者である武舎るみで、「リーマンショック前に『危ない!』と警告を発していたアルゴリズムがあったにも関わらず「そんなことはあり得ない」とその貴重なアドバイスを無視してしまった人たちがいた」などといった、金融業界で長い経験をもつ著者ならではの興味深い逸話や、あちこちに散りばめられた著者のジョークが気に入って「訳したい」と思ったそうです。もうひとりの訳者(このあとがきの著者)である武舎広幸はというと、心のどこかに「流行りのAI絡みで一発当てたい」という打算もあったことは否定できませんが、「AI礼賛」に警鐘を鳴らしていそうな本で、「結構、立場が似てるかも」と感じ、最終的に翻訳することになりました。
武舎広幸は長い間、機械翻訳システム(翻訳ソフト)の開発に関与してきました。一応、人工知能(AI)の一分野に入ってはいましたが、訳者が直接関わったシステムの中身はといえば、何十万もある単語のひとつひとつに品詞や訳語などの情報を付与した「辞書」と、何千もある「文法規則」を使って、ほとんど無限にある組み合わせの中から一番可能性の高そうな解釈を選び出していくという手法をとっていました。いわゆる、ルールベースの機械翻訳(RBMT)です。
原著者もどちらかというと古いアルゴリズムに浸ってきた人間で、「5.3 他のモデリング手法との比較」など何箇所かで「機械学習のプロセスは透明性が低い」などの問題点を指摘し、「人間の直感や現場の声を大切するべきだ」と強調しています。訳者同様「機械学習(だけ)では足りない」と考えていそうです。金融と翻訳では、具体的な手法やツールの違いは大きいでしょうが、感覚的には共通部分が案外多いのかもしれません。
この本全体として、原著者はアルゴリズムの内包する「バイアス」に焦点を当ててその対策を説いています。ただ、訳者はそれに限定せず「(少し視点を変えた)機械学習の一般向け解説書」としても面白いのではないかと感じました。主に「金融業界」や「宇宙人たちが登場する仮想世界」を中心に興味深い具体例が散りばめられており、ビジネスパーソンやエンジニアなどにとって、機械学習や人工知能に対する理解を深めるための示唆に富む読み物だと思うのです(アルゴリズムに直接あるいは間接的に関わる方々が「バイアス対策」を進める一助として活用いただくのはもちろんですが)。
こんな思いがあって、原著とはやや方向の違うタイトル、サブタイトルを提案させていただきました。訳者らがこの本の直前に第2版を翻訳した『インタフェースデザインの心理学』(Susan Weinschenk著、オライリー・ジャパン)という、これまたバイアスが重要なトピックとなっている本の評判がとてもよいので、これにあやかったという面もあるのですが――こちらの本の主題はアルゴリズムの設計ではなく、ウェブやアプリなどの設計ですが、一般の方々にとっても「目からウロコ」の興味深いトピックが合計100個並んでいます(こちらのページから第1版のサンプルがお読みいただけます)。
さて、翻訳作業に予定をはるかに超える時間がかかってしまったため、いつもお世話になっているオライリー・ジャパンの皆様には、いつも以上にご迷惑をおかけしてしまいました。原著の面白さを再現しようと最大限努力したつもりですので、お許しいただければ幸いです。「一発当たって」恩返しができるとよいのですが……
2021年9月
訳者代表
マーリンアームズ株式会社 武舎 広幸
付録
上のGoogle翻訳の原文(木のクシに関する文章)
About 30 years ago, my grandmother gave me a wooden comb (made of "tsuge"). She bought it at Kakeyu-onsen. It was broken a few years ago (it lasted long). So I had been using a plastic comb since then, but I had been thinking of buying a wooden one.
Last October when I went to Kichijoji (Musashino-shi, Tokyo), I found a Chinese comb shop newly opened. I enter the shop and a young Chinese man who cannot speak Japanese showed me several of their items (no other clerk in the shop!). He said he could speak some English so we talked in English. He said that the wooden comb is good for my hair by stimulating XXX, which I could not understand the meaning. I asked him to write it down, and he wrote "経穴," which means acupressure point ("tsubo" in Japanese).
He said that the shop had just moved from Yokohama a few months before but would be closed the next month, due to the Corvid-19 recession. I bought a wooden comb. The shop was closed the next month as he said, and no shop has opened there since then.
2-3 weeks after I bought the comb, I found my hair was becoming darker!! It is now August and 80% of my white hair have changed into black!! Can you believe it?!
日本語版(木のクシに関する文章。2021年秋執筆)
30年ほど前のことです。祖母が鹿教湯温泉に行ったお土産に木の櫛(柘植の櫛)をくれました。ずっと使っていたのですが、何年か前に歯が欠けて使い物にならなくなってしまいました。仕方がないので、家にあったプラスチック製の櫛を使っていましたが、そのうち、どこかに出かけた折に木の櫛を買おうと思っていました。
昨年(2020年)10月のことです。吉祥寺(東京都武蔵野市)に行ってプログラミング講座用の会議室の予約を済ませ、家に帰ろうと駅に向かいました。あと数メートルで駅ビルに入る自動ドアが開くというところで、カミさんに頼まれた買い物を思い出しました。乾物屋さんに行くために今来た道を戻ろうと振り返った時、右手の店に櫛らしきものが並んでいるのが目に入りました。新しい店のようです。入ってみると、若い中国人の店員がいましたが、なんと日本語を話せないというのです。"Do you speak English?" と尋ねると "Yes, ..." と応えたので、カタコトの英語でやり取りをすることにしました。店員さん曰く「木の櫛は○○を刺激するので髪の毛によい」とのことです。○○の意味がわからないので、「漢字を書いてみてくれませんか?」と頼みました。するとメモ用紙に「経穴」と書いてくれました。「ああ、ツボね。ツボを刺激するのね」。
その店員さんによると、何ヶ月か前に横浜から移転したばかりだが、新型コロナウイルスの影響でうまくいかないので、翌月(11月)には閉店してしまうとのことです。そこで、私はその場でそれほど高くはないけれど、一番安くもない木の櫛を買うことにしました。翌月、その店は本当になくなって、今も空き店舗になっています。なお、私が買った数日後にカミさんも、そこで(私のよりも少し高い)櫛を買いました。
くしを買ってから2、3週間経った頃です。洗面所で髪の毛をとかしながら鏡を見ると、なんとなく前よりも全体に頭が黒くなっているではありませんか! どう見ても白髪が少なくなっていたのです。
あれから約1年が経過しようとしています。私の頭にあった白い部分の7、8割が黒くなってしまいました! 私のカミさんの頭の状態はというと、「少し、白髪が減ったかな〜」という程度です。
ちなみに、私が買ったのは例の櫛店のこちらのページにあるようなものです。Amazonや楽天などでも購入可能です。
ちなみにちなみに、黒ごまペーストも白髪対策に効果があるとのことです。たとえば こちらのページをご覧ください。
DeepL版(2022年2月15日追加)
ほかの文章をDeepLで翻訳してみたら、翻訳結果が驚くほどよかったので、上の英文もDeepLで翻訳してみました。
30年ほど前、祖母から木の櫛(「つげ」製)をもらいました。掛湯温泉で買ったものです。数年前に壊れました(長持ちしたんですけどね)。それ以来、プラスチックの櫛を使っていたのですが、木の櫛を買おうと思っていたんです。
昨年10月、吉祥寺(東京都武蔵野市)に行ったとき、中国製の櫛の店が新しくできているのを見つけたんです。店内に入ると、日本語を話せない若い中国人が何点か見せてくれた(他の店員はいない!)。彼は英語が少し話せるというので、英語で話をした。木製の櫛は○○○を刺激して髪にいいんだ」と言うのだが、意味がわからない。と聞くと、「経穴(ツボ)」と書いてくれたので、「経穴(ツボ)」とは、日本語で「指圧」のことです。
この店は数ヶ月前に横浜から移転してきたばかりだが、コルビド19不況のため、翌月には閉店してしまうとのことだった。私は木の櫛を買った。その店は、彼の言うとおり翌月には閉店し、それ以来、そこに店を開くことはなかった。
櫛を買ってから2-3週間後、私の髪の毛が黒くなっていることに気がつきました! 今、8月ですが、白髪の8割が黒髪に変わっています! 信じられますか?
"It lasted long." の変形パターンも訳してみました。
(a) It lasted long.
長く続きました。
(b) It lasted longer.
もっと長く続きました
(c) My grandmother gave me a wooden comb, which lasted long.
祖母がくれた木の櫛は長持ちしました。
(d) 30 years ago, my grandmother gave me a wooden comb, which lasted long.
30年前、私の祖母は私に木の櫛をくれた、それは長持ちした。
(e) 30 years ago, my grandmother gave me a wooden comb. It lasted long.
30年前、私の祖母は私に木製の櫛をくれた。それは長持ちした。
DeepLは文をまたぐ情報を使っているようです。たとえば、(e)の"It"が何を指すのか理解しようとしているようです。