商品マスタをDatahubにインポートする流れを説明します。

全体の流れ

商品マスタを用意する

  • フォーマットに従った商品マスタをCSVファイル形式で用意します。

データセットを作成する

  • Datahubのグローバルメニューから「データセット」を選択
  • 左上の作成から「データセットを作成」を選択

  • データセット名を入力して保存する
    • データセット名は任意になりますが、例では「karte_recommend」

  • 注意点:
    • データセット名には半角英数字とアンダースコアのみ利用できます
    • データセット名は後から変更できませんのでご注意ください

データテーブルを作成する

  • データセット右上のテーブルを作成から「テーブルを作成」を選択
  • 以下のように設定します
項目 内容
テーブル名 任意のテーブル名を入力(例ではitem_master)
追加先データセット 上記で作成したデータセットを選択
スキーマ(オプション) 商品マスタのフォーマットに併せて以下のように記述します。
id:STRING,name:STRING,price:INT64, display_price:STRING, image:STRING, url:STRING, category_cd:STRING, brand_cd:STRING, sex_cd:STRING, recommend_f:STRING
SALE商品もマスタとして用意している場合は、追加で以下スキーマも指定してください
sale_price:INT64, sales_ratio:INT64, sales_start_date:DATETIME, sales_end_date:DATETIME
参考:データテーブルのスキーマを指定する
分割テーブルにするかどうか(オプション) 今回はチェックなし
  • 注意点:
    • テーブル名には半角英数字とアンダースコアのみ利用できます
    • テーブル名、追加先データセットは後から変更できませんのでご注意ください

用意した商品マスタをデータテーブルにインポートする

CSVファイルをアップロードする場合

  • 画面左のCSVからアップロードを選択し、商品マスタのCSVファイルをアップロード

※管理画面でアップロードする場合は毎回手作業になります。定期的に自動でデータをインポートする場合は後述の「ジョブフローを使ってインポートする」方法で設定ください。

外部サービスからジョブフローを使ってインポートする場合

外部のストレージサービス(例:Amazon S3, Google Cloud Storage)に商品マスタを定期的にアップロードすることで、自動でDatahubのインポートを行います。KARTEプロジェクト内で利用できる専用のバケットを新規で払い出すことが可能です。詳しくは以下の記事をご確認ください。

ジョブの設定

  • Datahubのグローバルメニュー→ジョブフロー画面に遷移
  • 右上の「作成」ボタンを押下してジョブフロー設定画面に遷移
  • 設定画面から以下を設定し、右上の「保存して完了」をクリック
項目 内容
ジョブ名 商品マスタをデータテーブルへ
ジョブタイプ データテーブルへインポート
インポート元 外部サービス
接続先 Google Cloud Storage / S3
接続先の設定方法についてはこちらをご確認ください
Google Cloud Storage
Amazon S3
インポート先 データテーブル:先程作成したデータテーブルを選択
ルール:置き換え

実行方法を選択

  • 「スケジュール実行を有効にする」にチェック
  • 「繰り返し実行を有効にする」にチェック
  • 実行頻度の設定を行う
    • 連携頻度は週次程度を推奨しています。

ジョブフローの設定

  • 「ジョブ実行終了後にアーカイブ」チェックなし
  • ジョブフロー名:任意
    • ジョブが一つの場合は「先頭のジョブ名を流用」するのを推奨しています。

  • 右上の「今すぐ実行」をクリックするとジョブが実行されます。
    • ※ジョブの終了までに5分ほど時間がかかります。

  • ジョブが「実行済み」になっていることを確認します。

商品マスタがデータテーブルにインポートされているか確認する

  • 対象のデータテーブル画面に遷移し、プレビュー画面からデータがインポートされていることを確認する

以上で設定は完了です。

正常に取り込めなかった場合

以下のトラブルシューティング、FAQをご確認いただき、それでも解決されない場合はチャットサポートよりご連絡ください。