以下の内容はhttps://ozaki25.hatenadiary.jp/entry/2024/10/30/204803より取得しました。
ナウキャストのデータ共通基盤
- Snowflakeとdtbでプライベートネットワーク内で完結させている
- データパイプラインの事例
- データホルダーは個人情報はセキュアな環境でのみ扱ってほしい
- セキュアな環境を担保しながら開発効率は落としたくない
- 個人情報出ないデータは社内で幅広く使いたい
- Snowflakeのセキュアな環境と通常の環境でアカウントを分ける
- セキュア側へのアクセスはPrivateLinkで絞る
- 個人情報出ないデータはセキュアから通常へはSecureDataSharingで連携
- データの実体は1つだけで参照ができるようになるのでコピーが不要
- データを共有するチームと共有されるチームで責任がきれいに分かれる
- セキュアでありながらスピードを落とさないように動ける
- 一部のCIがGitHubActionsでSnowflakeにアクセスできないから動かせない
最速最小からはじめるデータプロダクト
データプロダクト
- データがあるとデータが使えるは違う
- データが使えるようになってもプロダクト化するにはさらにハードルがある
- データが使えるとデータが使われるの違い
- ユーザが扱いやすいアウトプットか
- 本来取りに行くべきデータにたどり着けるか
- 最速最小から始めるといい
- MVPを定めてそこから進める
- 通常のプロダクトと同じようにアジャイルに小さくサイクルを回す
- とはいえ眼の前の今あるデータから始めるとなってしまっていいのか
- プロダクトのユーザのニーズから
- 分析できれば課題を解決できるのか
- 新しいデータを集める必要があるのか
- プロトタイピング
- まずは紙に書いたりFigmaで書いたりするところから
- エクセルに手動でデータ入れたものを用意
- データ基盤と切り離せる
- ユーザが加工したことを確認できる
- BIツールを使う
小規模に始めるデータメッシュとデータガバナンスの実践
データメッシュとデータガバナンス
- データメッシュ
- 組織内のデータ管理するを分散型アプローチ
- データのオーナーシップを各ドメインに分散する
- 中央集権的な管理がないのでアジリティ高く動ける
- なぜデータメッシュ
- 事業の拡大とともにドメインが増えた
- ドメインが1から複数に増えていったので移行コストがなかった
- 各ドメインが独立して開発をしている
- データガバナンス
- Dataplexで分散データを統合
- 発見可能性/品質/セキュリティ/相互運用性
- Dataplexの機能で実現
以上の内容はhttps://ozaki25.hatenadiary.jp/entry/2024/10/30/204803より取得しました。
このページはhttp://font.textar.tv/のウェブフォントを使用してます
不具合報告/要望等はこちらへお願いします。
モバイルやる夫Viewer Ver0.14