ここ最近は、ちょくちょく生成AIの話題を見かけるのですけれども、ふとちょいと面白いことを思いつきまして、先日のゴールデンウィークの間ちろちろと触っていたのでございますよ。
以前インド映画の挿入歌の歌詞の翻訳に使ってみてからというもの、生成AIの翻訳能力の高さに注目していたのですけれども、「そうであるならば」と思い、この度あることを試してみたのでございます。
つまり、インド神話をサンスクリット語原典から日本語に翻訳させてみてはどうだろうかと思いまして、やってみたのですよ。
日本で出版されている翻訳版だと要点だけ短くまとめられた抄訳版しかなかったりするのでして、もうここまで来たらいっそのこと全訳版を読みたい。
それでとりあえずまずは『マハーバーラタ』から試してみようと思いまして、プーナ批判版と呼ばれる研究などで底本としてよく使われるバージョンを翻訳させてみました。
こういった神話みたいなのはいわゆるパブリックドメインですから、インターネットを探したら出てくるだろうと思い、まず手始めに原典をインターネットで探して、原典を見つけたら生成AIに翻訳依頼のプロンプトを送って、あとは原典をコピペしては送り、コピペしては送りで次々に翻訳させてみたのでございます。
生成AIには最初に「これからサンスクリット語の文章を送るので、逐次日本語に翻訳してください」みたいに言っておけば、あとは原文コピペで次から次へと翻訳していってくれるってな具合でございます。
そして途中で思いついて、IASTという翻字規則に基づいた翻字も追加でやってもらうようにしましたら、なんかいい感じになりましたよ。
サンスクリット語原文を送ると、原文、翻字、日本語訳の形式で1行ずつ出てきますから、出てきたのをメモ帳にコピペしていけば、日本語版マハーバーラタの一丁上がりってなもんでございます。
さて、ここで致命的な問題がありまして、生成AIは必ずしも正確な回答をしてくれるわけではないということでございます。
いわゆるハルシネーションと呼ばれる現象ですねえ。
なので、生成AIの回答の正確性については別途検証しないといけないのですけれども、私自身、サンスクリット語なんてさっぱり分かりませんから検証しようがない。
そもそも、分かってたら翻訳なんてせず直に読んでますよ、直に。
それとあともうひとつの問題は、マハーバーラタをこの試みの最初の題材に選んだことそれ自体ですねえ。
Wikipediaによると、どうもこのプーナ批判版のマハーバーラタは7万5千弱の詩節から構成されているのですけれども、こんなん全部手動でコピペしようと思ったら頭おかしくなる。
しかも全部一気に生成AIに取り込んで翻訳させる、というのも量が量だけに難しいですし。
いやあ、もっと簡単なやつからやっとけば良かったですねえ。
ちなみに、今現在の時点ではちょいとお試しで翻訳したにすぎませんから、29の詩節しか翻訳できておりません。
進捗率0.038%…
パワハラブラック企業とかだったら「テメェ!!進捗どうなってんだ!!進捗出せ、進捗!!!オラァ!!!!!」とか言われて机とか拳とかが飛んでくるレベルでございます。
ともあれ、もうここまで来たらいっそのこと生成AIに翻訳させるための生成AIがほしいですねえ!
おしまい。
