業務内容
【グループ研究開発本部とは】
GMOインターネットグループの事業領域で力を入れているスタートアップやグループ横断のプロジェクトにおいて、技術支援・開発・解析などを行い、ビジネスの成功を支援する部署です。
主な事業領域
・インターネットインフラ事業(ドメイン、ホスティング/クラウド、アクセス、決済、EC支援、セキュリティ)
・インターネット広告・メディア事業(メディア、アドテク、クーポン・ポイント)
・インターネット金融事業(証券、銀行)
・暗号資産(仮想通貨)事業(交換所、マイニング、NFT)
最新のテクノロジーを常に研究開発し、いち早くビジネスに投入し結果に繋げます。
【プロジェクト業務】
以下のいずれかにまず参加して頂きます。その後さらに専門性を高めて頂くか、もしくは他のプロジェクトに参加して、実績に応じて希望のキャリアを積んで頂きます。
1.フィンテック(Fintech)のプロジェクト
GMOインターネットグループが展開する金融サービスの本質を理解し、数理モデルや機械学習などのデータサイエンス技術を駆使しながら、予測が難しい金融データをうまく扱って収益を改善させます。
2.アドテク(Adtech)のプロジェクト
インターネット広告の主な仕組みの一つであるRTB(リアルタイム入札)において、広告出稿する側の費用対効果を最適化するDSP(Demand-Side Platform)の機械学習モデルの設計開発、効果測定などをメインに行います。
3.アプリのプロジェクト
フリーWiFi接続を容易にするアプリの新機能や施策の効果測定を因果推論の技術を駆使して行い、データドリブンに経営判断するための仕組みを整えて、サービスのKPIを改善させます。
4.その他のプロジェクト
暗号資産取引、不正検知などに関して、データ解析や機械学習の技術を応用して支援します。
【研究開発業務】
・プロジェクト業務を行いながら、一定の時間、全員で最先端の機械学習手法や新たな機械学習の応用を研究します。
・さらに四半期ごとに選任されたメンバーは重点的に研究開発を行います。
【配属先例】
経験:大学でソフトウェア工学・データベース工学を学び、大学院では自然言語処理(トピックモデル)を主に研究。
前職はWebアプリケーション開発に従事。
配属先:世界 No.1 規模の金融データを扱うプロジェクトにデータ分析エンジニアとしてアサイン。
データを格納している Hadoop 上で Python/PySpark による解析モデルや実装開発をリード。
データ分析や解析アルゴリズム検討、モデルチューニングも担当。
能力に応じてデータサイエンティストとして進むことも、プロジェクトマネージャとしてのキャリアにチャレンジすることもできます。
【利用技術】
●解析手法
・機械学習:アンサンブル学習/勾配ブースティング(Gradient Boost Tree + LR, Random Forest, ExtraTree , Ada Boost, XGBoost, LightGBM)、PCA、ニューラルネットワーク (MLP)、FP-Growth、Word2Vec、Doc2Vec、協調フィルタリング、ベイズ推定、HMMモデル(隠れマルコフモデル)
・統計分析:t検定、カイ二乗検定、F検定、二項検定、コルモゴロフ・スミルノフ検定、シャピロウィルク検定、サンプリング(MCMC,ブートストラップ法など)、分散分析、因果推論(差分の差分法など)
●開発技術/環境
・Python、PyData(numpy、scipy、pandasなど)、Scala、Java
・MySQL、MariaDB、Percona Server、PostgreSQL、Galera Cluster、Oracle
・TensorFlow、Spark(PySpark)、Hive、Hadoop/HDFS、Sqoop
・GCP(GCS、BigQuery、VertexAI、Dataflowなど)、AWS(S3、SageMakerなど)
●開発ツール
・Trello、Atlassian(Jira、Confluence)
・PyCharm、Jupyter、HUE、VS Code
・Tableau
●開発手法
・アジャイル開発(scrumベース)