データの準備
データ正常性というコンセプト
このセクションでは、基本的なデータ正常性というコンセプトについて定義します。このコンセプトを使用して、データ全体の正常性を改善するために、検討、監査、最適化を実施することができます。目標は、信頼されたデータ基盤を確立したうえで、確実に作業を開始できるようにすることです。多数の要因に基づき、ビジネスごとにデータ成熟度レベルは異なるので、以下のコンセプトのそれぞれを確認および検討することが重要です。
これらのコンセプトを確認して理解した後、以下のデータ準備ステップに進むことができます。
戦略の定義
ビジネス目標と戦略を定義します。マシンラーニングテクノロジーを使用して何を実行しようとしているかを定義し、オーディエンスを特定して、どのようなデータの収集とそれらに基づく行動を起こそうとしているかを判断します。データの完全性
データのボリュームと完全性を検討します。いつでもそうですが、良好なデータからは良好な結果が得られます。ガバナンスと同意
コンプライアンスのプラクティス(慣行)とデータの使用方法に関する要件を確認し、理解します。アクセシビリティ(アクセスしやすさ)
特定したインサイトが、社内の”テクノロジースタック”内にある他のツールからアクセス可能であることを確認します。データの完全性 Tealium AudienceStream CDPの実装を確認し、現在の社内データに関する結果を、これから収集および行動を起こすために使用することを予定しているデータの理想像と比較します。
データの準備に関する詳細を参照し、正常性のチェックリストを確認するには、Data Readiness for Machine Learning Checklist.(マシンラーニング向けのデータの準備に関するチェックリスト)を参照してください。
データ正常性サービス
作業開始の支援が必要な場合、当社は”データ正常性”サービスパッケージを提供しており、Tealium Predictで使用できるようにデータを準備するための支援を行うことができます。お客様独自のデータに合わせて、このサービスを活用する方法については、アカウント担当者にお問い合わせください。
データ準備のアクション
以下の手順で、Tealium Predictを追加する目的で、データの基盤を準備するためにお客様とそのチームが実行することのできる一連のアクションについて説明します。マシンラーニングモデルから最適な結果を確実に得られるように、推奨されるアクションを実行するための全般的なガイドラインとして、これらの手順を使用することができます。
- 監査
データレイヤーとAudienceStreamの属性を監査します。データの品質、ボリューム、成熟度を検討し、カスタマーデータの品質と完全性を改善するために、必要に応じてさまざまな調整を加えます。 - 定義と連携
デジタルデータに関する戦略を定義し、連携を進めます。データの基盤とインフラストラクチャはベンダー中立であることが望ましく、いずれか1社のベンダーに依存することなく、社内の”テクノロジースタック”全体の能力を強化する目的で使用できることが求められます。 - Data Governanceのプラクティス
データガバナンスのプラクティスの確認、定義、実装を行います。コンプライアンスは継続的に進化しているので、定期的な間隔でコンプライアンスの問題を再検討し、データの長期的な正常性と存続可能性を確認します。 - 理解とエンリッチメント
この時点ではまだ、イベントデータインフラストラクチャはマシンラーニングのインテリジェンスを獲得していません。AudienceStreamによって自動的に生成されるインサイトの品質を改善するために、受信するイベントデータのエンリッチメントと編成を実施します。実装の他のコンポーネントがマシンラーニング機能を搭載しているかどうかにかかわりなく、この手順を使用して、実装全体でマシンラーニングによるインサイトをすぐに有効にすることができます。 - オーケストレーション
インフラストラクチャを定義し、ビジネスがデータを収集する手法の中にデータインサイトを作り込んだ後、それらのインサイトのオーケストレーションを実施し、実装に統合済みの各種ツールを使用してアクションを推進することができます。カスタマーエンゲージメントチャネル全体にデータインサイトが自動的かつリアルタイムに流れるように、独自のビジネスルールを追加実装することもできます。
ベストプラクティス
最適な結果を得られるように、90日分以上のデータを保持している予測時間枠を使用するトレーニングを実施することをお勧めします。多くの状況で、またターゲットの使用事例によっては、それより短い期間と少ないデータを使用してモデルのトレーニングを成功させることも可能です。少なくとも、できるだけ多くの日数にわたる予測時間枠を確保して、モデルのトレーニングを実施する必要があります。