Apache Hadoop、およびApache Sparkに関するイベント「Hadoop Conference Japan 2016」「 Spark Conference Japan 2016」が2月8日(月)に東京、品川区のきゅりあん で開催される。参加費は無料で、事前にイベントサイト にて参加登録が必要。
開催を前に、プログラムの内容も明らかになってきた。キーノートはHadoop、Sparkの両Conference共通で、日本のHadoopコミッタ、Sparkコミッタ、そして海外からのゲスト講演者等が登壇し、Hadoop / Sparkの現状と展望について語る。
昼食時には恒例となったライトニングトーク、およびSparkコミッタの猿田氏によるSparkの入門講座が用意されている。午後のSpark Conferenceセッションを聞くための予習にも最適。
午後は4つのトラックに分かれ、より技術的に突っ込んだ各45分のセッションが5本も用意される濃密なスケジュール。テーマを決めて参加したい。午後の講演の1本、DatabricksのReynold Xin氏のセッションでは、Sparkの最新バージョンや高速化プロジェクトのTungstenについて、世界に先駆けて最新情報が披露されるとのこと。
このほか、17時からは懇親会+ライトニングトークが予定されている(参加費2,000円) 。
「Hadoop / Spark Conference Japan 2016」プログラム概要は以下の通り。
キーノート
10:00~
ご挨拶、Hadoopを取り巻く環境2016
濱野 賢一朗 ( 日本Hadoopユーザー会, NTTデータ)
Hadoopの現在と未来
鰺坂 明(Hadoopコミッタ) 、小沢 健史(Hadoopコミッタ)
Yahoo! JAPANのデータプラットフォームの全体像と未来
遠藤 禎士(ヤフー)
Hadoopのストレージの現状と展望
Todd Lipcon(Cloudera)
Spark Conference Japanの開催にあたって
猿田 浩輔(Apache Sparkコミッタ)
Spark 2.0: What's Next
Reynold Xin(Databricks)
さくらインターネットが構築した、Apache Sparkによる原価計算システム
須藤 武文(さくらインターネット)
A会場
B会場
C会場
D会場
ランチ会場
ライトニングトーク
ランチ会場
ライトニングトーク
ランチ会場
Apache Spark 超入門
猿田 浩輔(NTTデータ)
-
13:00~13:45
データドリブン企業における、Hadoop基盤とETL ~niconicoでの実践例~
嶋内 翔(Cloudera) 志村 誠(ドワンゴ)
YARN: Resource Manager for Analytic Platform
小沢 健史(NTT)
ストリーミングアーキテクチャ: State から Flow へ
草薙 昭彦(MapR Technologies)
次世代アーキテクチャから見たHadoop/Sparkの位置づけ ~特にRDMA・NVMを軸としたときの分散並列処理の観点から
神林 飛志(ノーチラステクノロジーズ)
13:45~14:30
On-Premises Hadoopクラスタ構築の苦労体験と運用ノウハウ
松浦 晋(SoftBank)
KuduによるHadoopのトランザクションアクセスと分析パフォーマンスのトレードオフ解消
Todd Lipcon(Cloudera)
リクルートライフスタイルの考えるストリームデータの活かし方 ~AWS + Kafka + Spark Streaming~
車田 篤史(リクルートライフスタイル) 堤 崇行(NTTデータ)
ビッグデータ可視化の性能を徹底検証 ~SparkSQL、Hive on Tez、Hive LLAPを用いた既存RDBデータ処理の特徴~
新郷 美紀(NEC) 蒋 逸峰(Hortonworks)
14:30~15:15
顧客事例から学んだ、エンタープライズでの"マジな"Hadoop導入の勘所
立山 重幸(日本オラクル)
今あらためて考えるHive ~ユースケースの広がりにより顕在化した課題と対応~
吉田 耕陽(NTTデータ)
さくらインターネットが構築した、Apache Sparkによる原価計算システムの仕組みとその背景
須藤 武文(さくらインターネット)
Spark MLlib Now and Beyond
石川 有(リクルートテクノロジーズ)
15:15~16:00
基幹業務もHadoopで!! ~ローソンにおける店舗発注業務へのHadoop + Hive導入と、 その取り組みについて~
須田 桂伍(フューチャーアーキテクト)
Hiveを高速化するLLAP
小澤 祐也(ヤフー)
Deep Dive into Project Tungsten
Reynold Xin(Databricks)
SparkによるGISデータを題材とした時系列データ処理
鈴木 由宇(IHI) 土橋 昌(NTTデータ)
16:00~16:45
Maintainable Cloud Architecture of Hadoop
佐々木 海(Treasure Data)
Hadoop Security Recap: -セキュリティ関連の概要/近況のおさらいとLDAP/AD, Kerberos, Apache Ranger
今井 雄太(Hortonworks)
Exploiting GPUs in Spark
石崎 一明(IBM Research)
Hive on Sparkを活用した高速データ分析
加嵜 長門 ( DMM.comラボ)
懇親会・ライトニングトーク ( 17:00-19:00)