はじめに
こんにちは、Data&Analysis部(以下、D&A)所属の宇佐見です。D&Aは弊社が展開する製造業AIデータプラットフォームCADDiに集約されたデータを解析して価値を創造することがメインの業務です。
解析にはもちろん機械学習を用いることが多く、メンバー間の知見共有が求められます。そこで始まったのが機械学習勉強会だと思われます。
思われます、と書いているのはなぜかというと、この勉強会は非常に歴史が長く、2021年の1月ごろから続いているものだからです。
私は2024年8月入社なので初めの頃の雰囲気は不明ですが、おそらくそういう課題はどこのチームにもあるものなのでそういうモチベーションがあったのではないのかなと推察しています。
さて、現在の機械学習勉強会はどのような運用をしているかというと、インフレして負担にならないよう、ゆるく機械学習に関係のあるトピックならなんでも共有しようという会になっています。
毎週金曜日、割り当てられた人が20分程度喋り、それについて話し合うみたいなスタイルでゆるりとやっています。
公開に至った経緯
そんな勉強会を5年目にしてなぜ公開するに至ったかというと、これは私がキャディの選考を受ける前に持っていたキャディに対する(特にD&A)イメージを変えたいな、と思ったからです。
皆さんがそういうイメージを持っているのかは分かりませんが、私が持っていたキャディのD&Aに対するイメージは一言で言うと「謎」です。
というのも、D&Aがやっている内容や働いている機械学習エンジニアに言及した記事があまり見つけられず、実際にカジュアル面談で話を聞くまでどんな人がいるのかが中々イメージが湧かなかったのです。とはいえ、カジュアル面談まで行くというのは少しハードルがあると思います。
機械学習勉強会を公開することでD&Aのチームがどういった技術に興味があるのかをお見せして、どんな人がいるのかということが簡単に伝わればと思っています。
公開するにあたって工夫したこと
公開すると一言で言っても、どのように公開するのかというのは課題ではありました。機械学習勉強会は原則週1回は行われているので、公開する作業に負荷がかかってしまって、業務に影響を及ぼすことはしたくありません。また、勉強会の議事録を必死に取ることも避けたかったです。そこで、以下の方法を取って簡単に記事を作成するようにしました。
- 勉強会の録画動画よりffmpegで音声を抜き出します
- 勉強会のスライドをpdfに変換します
- それらをNotebookLMにソースとしてアップロードします
- ブリーフィングドキュメント機能を使ってまとめを作ってもらいます
- 作成されたドキュメントをレビュー、編集して記事とします
NotebookLMはGoogleが提供するAIリサーチアシスタントです。アップロードされたソースをもとにチャットで質問ができたり、英語限定ですが音声による二人の掛け合い付きのポッドキャスト的なまとめを作ってくれたりします。
ブリーフィングドキュメント機能は文字通りアップロードされたソースからまとめを作ってもらう機能ですが、これがまさにブログ記事にするのにちょうどいい長さの記事を作ってくれます。
このプロセスであれば記事のレビューも含めて、2時間程度で作成でき、持続的に公開が続けられそうです。
課題感としては、どうしてもLLMっぽい文章になってしまうのでその辺りは何かしらレビュー時に低減する方法を加えたいなと思っています。
最後に
今後は週一のペースで記事を公開していくので、CADDiのデータ解析チームがどんなことに興味を持っているかを記事から知っていただけると幸いです。
まずは一つ目はこちらより、LLM as a judgeのレビュー論文を読んだことに関する記事です。
また、そこからCADDiのD&A事業に興味が湧いてきたっていう方は、是非カジュアル面談に来ていただきもっとお話を聞いていただければと思います。もちろん、エンジニアのポジションも絶賛募集お待ちしておりますのでこちらもお願いいたします。
CADDi Tech 採用情報
カジュアル面談
ML Engineer
MLOps Engineer
Data Engineer