講演内容
「ETL」とは、データウェアハウスやデータマートを構築するときに必要な、
既存のデータソースから必要なデータを抽出(Extract)し、変換(Transform)し、
データベースにロード(Load)する、三つの処理工程の頭文字を取った言葉です。
最近はもっと広義に捉えられ、データ分析を行う前段のデータ加工処理全般を
指すようにもなってきているようです。
並列処理などを伴う高度なETLプログラムを、GUIベースで高生産性で開発できる
「ETLツール」と呼ばれる分野のソフトウェアは、
かつては数百万円から数千万円もする商用製品ばかりでしたが、
この分野に世界初のオープンソースETLツールとして切り込んだのが、
フランスで生まれた「Talend」です。
Talendのオープンソース版「Talend Open Studio」は、
商用の数千万円のETLツールに引けを取らない機能を持っています。
また、
(1)EclipseベースのIDE
(2)Pure Javaコードの生成
(3)Apacheプロジェクト成果物の積極採用
(4)HadoopやNoSQLを含むあらゆるデータソースへのアクセス手段の標準提供
(5)クラウドやIoTへの対応
といった、先進技術を多数取り込んだ、技術的にも非常に興味深いソフトウェアです。
いまや、広い意味での「データ処理」に関わらないエンジニアはごく少数のはずです。
データ分析やデータ処理に関わるエンジニア、もしくはそうでないエンジニアにとっても、
Talendがどのように役立つのか、本講演でたっぷりご紹介します。
講演者プロフィール
株式会社エアー プロダクト・カンパニー 第二営業部 マネージャー
巽 政明 氏
ダウンタウンの浜田・松本と同世代の大阪生まれ。
大学で社会心理学を学んだ後、深い考えなく就活し、大手ソフトウェアハウスに入社。
以後、様々な規模のシステム開発やコンサルタント業に従事したあと、縁あって現職に。
ひょんなことからTalendに関わるようになり、Talendのコンサルタント兼トレーニング講師に。
現在は、技術も語れるTalend担当セールスマネージャーとして活躍中。
プログラミングから遠ざかった今も、時折気になった言語や開発環境を調べては、
世の中の流れを感じている。
最近はJupyter Notebookに感心し、機械学習理論の理解に悪戦苦闘中。
※ 内容は変更になる可能性があります。