読者です 読者をやめる 読者になる 読者になる

水底

ScalaとかC#とかネットワークとか

トレジャーデータでインターンしてた話 #td_intern

第一話「なんだかホントに入社した気分です!」

8/1-9/30の二ヶ月間参加してました. 丸ビルのプレミアムフロアでした. すごい. そして皆さんにご報告があります. インターン開始直後のこのツイート

なんと一回も涼風青葉さんにならずに切り抜けました!!!

f:id:amaya382:20161001195150j:plain

やっていたこと

メンターの @myui さんの下でHive上で動く機械学習ライブラリである Hivemall の開発を主に行っていました. なかなか慣れずに終始進捗がよくなかったのが心残りです… 具体的な内容はスライドを見ればわかるかもしれません. ちなみに今後もたまにPR投げようかなーと思っています(既に手元にはbranchが).

(やたら枚数が多いですがアニメーションを分割しているだけです)

エイゴハナセルヨウニガンバリマス(震え声)

(追記)必要だったスキル

去年のインターン生の方のエントリを読んで, 書いておいたほうがいいかなと思いの追記です

English Reading/Writing

社内のやり取りがSlack(英語)であったり参考文献を読むためにもできないと詰む.

English Listening/Speaking

社内会話は基本的に日本語なのでReading/Writingほどではないですが, 発表は英語の場合があるのでできないと相当辛い思いをします. 辛い思いをしました(経験談).

Unix

基本的なことは必須だと思います. 特にデータの前処理やHiveにいろいろ流し込んだりする際の処理をshellでババっと.

Git/GitHub

必須. 開発, 特にOSSが絡んでるわけですし.

Java, Python

HivemallがJava製なので言わずもがな, 機械学習系はPythonで書かれたコードを参考にすることが多いです. とはいえ何かしらの言語を扱えればあまり癖がない言語なので大丈夫かと.

SQL

HivemallはHQL(インターフェースはほぼSQL)で呼び出すため, テストをするためにも最低限扱えたほうがいいと思います.

機械学習

Hivemallは機械学習ライブラリなのである程度は前提として.

AWS

EMRとかS3とか, どうなっていてどう連携しているのか把握しているといいと思います.

雑な同期の紹介

英語のプレゼンが引くほどうまかった @takuti と, #id_intern を経て牡蠣嫌いから牡蠣好きになった @ganmacs の二人でした. 二人とも"“"非常に強い”“"同期だったので少し肩身が狭かったです. 強くなりたい… 以下報告エントリと進捗のお手本

Treasure Dataインターンにみる機械学習のリアル #td_intern | takuti.me

ganmacs.hatenablog.com

#td_intern 最終日

きくらげを食べてから,

f:id:amaya382:20161001192154j:plain

最後に牡蠣を食べて完全に優勝しました!!!

f:id:amaya382:20161001192115j:plain

漠然と凄いエンジニアだと思っていた @tagomoris さんのイメージが瞬く間に凄く食に詳しい人に変わったり, 前述の牡蠣駄目ですと明言していた同期が一口で牡蠣が好きになったりと楽しかったです. 以下ハイライト的な(ほとんど牡蠣)

最後に

一言で言うととてもいい職場でした(語彙力). フレックスであったり飲み物やお菓子が用意されていたりとエンジニアにとって自由度が高く過ごしやすい空間であっただけでなく, 活発に議論が行われていたのが印象的です. 取り組んでいた内容も, 普段の大学生活ではなかなか一つのプロジェクトに集中的に関わることができないため, 二ヶ月間通してやり甲斐がありました. 特に分散環境の特性やユーザにとって使いやすいインターフェースなどを考慮しながらの開発は難しいながらも楽しかったです. ありがとうございました.