ETLとEAIの違い、知っていますか?

ETLとEAIの違い、知っていますか?

 

みなさんこんにちは、「ITユニプラ」編集部です。


今回は、DX時代のデータ活用でニーズが高まるETLとEAIの違いについて記事にしました。

昨今、システム間やお客様間とのデータ連携をする時の加工・編集ツールとしてETLやEAIといった製品を検討している事かと思います。ETLとEAIで出来る事はさほど違いがないように見えますが、そもそもコンセプトや目的が異なるものという事をご存知でしょうか?
その辺りをご認識いただくと、目的に合った導入検討のポイントの1つとなるのではないでしょうか。

目次

  1. ETLとEAIの生い立ちと得意分野
  2. 向いている業務

①ETLとEAIの生い立ちと得意分野

ETLとEAIの生い立ちと得意分野

ETLもEAIもほぼ同時期にこの世に出てきました。おおよそ30年くらい前でしょうか?
当時はそれぞれ明確に住み分けをしていたのですが、ここ数年で同じような事ができるようになり、ETLとEAIの違いがわかりにくくなってきました。

ETLとは「Extract Transform Load」の略称で、組織の内外に散在するデジタルデータを抽出・収集し、用途に応じて変換・加工を行った上、その先にある格納先に有用な情報として配信・送出するITプロダクトのカテゴリとなります。
また、
EAIとは「Enterprise Application Integration」の略称で、企業内における様々なデータやアプリケーション同士をリアルタイムに連携するITプロダクトのカテゴリとなります。

このような特性の違う製品を目的や用途を明確にしないまま利用すると、不得意な分野で無理やり利用する事になり、本来の性能を発揮できないまま運用する事になってしまいます。


それぞれの得意分野は以下の通りです。
■ETL
  • 基本はファイル(BIN、TXT、CSV、FTP)とDB連携
  • ホスト(IBM,FACOM,HITAC,NEC)を含むデータ抽出、変換、クレンジング、LOAD
  • 複数レコードにわたる複雑なデータ加工・クレンジング要件に対応
  • 日本語、外字、英語、中国語対応
  • 大量データ一括超高速処理
  • バッチ型(非同期連携)
  • 簡易運用機能 ※運用ツールと併用可
■EAI
  • DB、R/3、Notes、Mail、XML、アプリと多彩な連携 
  • ホストを含まないコード変換、データタイプ変換、クレンジング
  • マッピング機能での単純なデータ加工
  • 少量データ(1:1)の連携処理
  • リアルタイム型(同期更新:2フェーズコミットなど)
  • 独自運用、プロセス管理機能
以上のように、ETL・EAIとも同じような事ができます。それぞれの得意・不得意をひとことで言うと、
 
ETLは
「大量データをバッチ処理するのが得意」

EAIは
「少量データをリアルタイムにアプリケーションと連携するのが得意」

という事になります。
もともとETLは、データウェアハウス構築において基幹システムからデータを抽出・加工する為のツールとして利用されてきたので、大量データを扱う事を得意としています。

ただ、最近はマシン性能も向上しEAIでもある程度大量のデータ処理でパフォーマンスを満たす事ができるようになってきました。
 
しかし、やはり餅は餅屋という事で大量データを処理するような業務ではETLが向いていると言われています。
また、昨今本当に秒レベルでリアルタイムな連携を必要とする業務はあまり多くはなく、データが発生した時や時間間隔で処理するレベルであれば、ETLでも十分対応する事ができるようになっています。

 

②向いている業務

向いている業務

ETLが向いてる業務
  • 基幹システムから情報系システム(データウェアハウス)のデータマート構築
  • システム再構築(ダウンサイジングなど)に伴うシステム間のデータ移行
  • システム間のデータ移行や連携(5分毎や1時間毎に処理をするような業務)
  • 取引先とのEDIデータ連携(データの到着監視で運用)
  • 決算時における連結決算データの収集加工業務
  • 監査ログデータの収集加工業務

企業内において「データを加工・編集」が伴う業務には全て活用できるのがETLとなります。

EAIが向いてる業務
  • システム間のマスター連携
  • 受発注業務における在庫の引き当て
  • 取引先とのEDIデータ連携

秒単位レベルのリアルタイムで連携する必要がある業務に活用できるのがEAIとなります。

これから「データ連携ツール」の導入またはリプレースをお考えの方は、

以下のポイントを整理しながら検討する事をおすすめします。

  1. 対象の業務は何か
  2. 導入の目的は何か
    ※様々なシステム(アプリケーション)との連携か、データの加工・編集か
  3. 連携するデータ量はどのくらいか
  4. 連携するタイミングはリアルタイムかバッチでも良いか
    ※リアルタイム:秒単位、バッチ:データの到着監視も含む

上記ポイントを明確にしないまま導入すると失敗してしまいます。

 

ContactUS