JOB ID:111644
| 給与 | 650万円 〜 1800万円 |
|---|---|
| 業種 | IT・通信・インターネット |
| 勤務地 | 東京都 |
| 業務内容 | 【ミッション】 The research scientist will focus on designing, implementing, and evaluate novel algorithms, models, and techniques for visual and multimodal generation. The research engineer will focus on implementation & optimization: Translate research concepts into practical implementations by developing and optimizing multimodal AI models, and building and maintaining robust data pipelines for training and evaluation. ・Research scientist:視覚およびマルチモーダル生成のための新規アルゴリズム、モデル、手法の設計・実装・評価 ・Research engineer:実装と最適化にフォーカスし、研究コンセプトを実用化するためにマルチモーダルAIモデルの開発・最適化を行い、学習・評価用の堅牢なデータパイプラインを構築・維持 【具体的な業務】 ・Training of foundational image, video and multimodal generation models, ensuring advanced performance and scalability. ・Translate cutting-edge research into practical solutions by investigating downstream applications that enhance the model’s business value and delivering actionable insights directly to the product team. ・Disseminate your findings at premier international conferences, showcasing your work to the global research community and forging connections with leading experts. ・ 大規模な画像・動画・マルチモーダル生成モデルの開発。 ・ プロダクトチームと連携し研究成果を実用的なプロダクトに繋げる。そのために市場の動向を調査し知見を収集。 ・ トップカンファレンスでの研究成果の発表。グローバルな研究者コミュニティとのつながりを構築。 |
| 応募資格 | 応募資格(必須) ・(For research scientist role) First-author publications on visual or multimodal generation (or related topics), in prestigious conferences and journals (such as ICCV, CVPR, NeurIPS, ICML, ICLR, ECCV, ACL, TPAMI, IJCV, or equivalent). ・(For research engineer role) Hands-on experience in (large-scale) generative model training or fine-tuning. ・Master’s or Ph.D. in Computer Science, Data Science, or a related field. Strong background in computer science and data science principles. ・Proven research (for research scientist role) or industrial (for research engineer role) experience in visual generation and/or multimodal generation. ・Willing to work collaboratively within a team. ・Proficiency in PyTorch or similar deep learning frameworks for model training/finetuing. ・(Solid) Understanding of recent visual generative model (i.e., diffusion/flow matching/AR), and experience of training/finetuning those models. ・Self-motivated with a passion for continuous learning and staying abreast of new technologies. ・Willing to engage in industrial research aimed at developing practical solutions for real-world applications, rather than focusing solely on academic publications. ・Research Scientist の場合:ICCV、CVPR、NeurIPS、ICML、ICLR、ECCV、ACL、TPAMI、IJCV などトップカンファレンス/ジャーナルで視覚またはマルチモーダル生成に関する第一著者論文を発表していること。 ・Research Engineer の場合:大規模生成モデルの学習またはファインチューニングに関する実践的経験があること。 ・ コンピュータサイエンス、データサイエンス、または関連分野の修士号/博士号を有し、これら分野の基礎原理に強い理解があること。 ・視覚生成および/またはマルチモーダル生成における研究経験(Research Scientist 職の場合)または産業界での実務経験(Research Engineer 職の場合)があること。 ・チーム内で協力しながら働く意欲があること。 ・PyTorch または同等の深層学習フレームワークを用いたモデル学習・ファインチューニングに習熟していること。 ・拡散モデル(diffusion)、Flow Matching、自回帰(AR)など最新の視覚生成モデルに関する深い理解と、これらのモデルの学習/ファインチューニング経験があること。 ・自発的に学び続け、新技術の動向を常に追いかける意欲があること。 ・学術論文の発表に偏るのではなく、実社会での応用に向けた実用的な解決策の開発を目的とした産業研究に積極的に取り組みたいと考えていること。 応募資格(歓迎) ・(For research engineer role) Experience on large scale training with FSDP/Deepspeed/Megatron-LM/.., as well as low precision training, and model parallelism. ・Contributions to open-source AI projects, or notable GitHub projects related to visual or multimodal generation with significant recognition. ・Knowledge of machine learning techniques for data collection, cleaning and preprocessing ・Experience of handling data beyond visual modality, such as audio/speech/language. ・(Research engineer)FSDP、DeepSpeed、Megatron-LM 等による大規模分散トレーニング、低精度トレーニング、モデル並列化の経験。 ・オープンソースAIプロジェクトへの貢献、または視覚/マルチモーダル生成に関する著名な GitHub プロジェクト経験。 ・データ収集、クレンジング、前処理に関する機械学習技術の知識。 ・音声・言語など視覚以外のモダリティデータを扱った経験。 求める人物像 当社の事業内容、ミッションに共感し、新たな事業への挑戦姿勢・意欲を持った方 |
| 福利厚生 / 待遇 | 通勤手当有り(上限:150,000円/月) 一般職:時間外勤務手当、深夜勤務手当、休日勤務手当、通勤手当など 管理職:マネジメント手当、深夜勤務手当、通勤手当など 健康保険、雇用保険、労災保険、厚生年金 ベネフィット・ワン、プレミアム優待、 財形貯蓄制度、総合福祉団体定期保険、 保険制度(団体生命保険、団体扱い生命保険、団体損害保険、団体扱い損害保険など)、 確定拠出年金(401K)に加入予定 |
| 勤務時間 | フレックス勤務:可 所定労働時間:午前9時〜午後5時45分 休憩:1時間 時間外労働:有り |
| 休日休暇 | 週休2日制(土曜日および日曜日)、国⺠の祝日、 年末年始(12月29日〜1月3日)、その他会社が指定した日 |