)

JOB ID:116219

非公開求人
非公開求人
給与 650万円 〜 1800万円
業種 IT・通信・インターネット
勤務地 東京都
業務内容 データサイエンティストは、データ処理、キュレーション、キャプションを含むデータ関連の業務に従事することが期待されています。
応募資格 応募資格(必須)
・データ基盤/パイプライン:大規模マルチモーダルパイプライン
・(ingest→dedupe→filter→shard→snapshot/version)設計
・標準化データAPIと高スループットローダー(ストリーミング、キャッシュ、サンプリング等)を提供
・キャプション/人手ラベリング:キャプション
・注釈フロー構築(属性/関係スキーマ、多言語対応)
・ベンダー/内部アノテータ運用、ゴールドセット、IA一致率、QCダッシュボード
・自動キャプショナー(CLIP/VLM補助)の検証
・キュレーション/品質管理:重複検出、クラスタリング、品質/美的評価、
 ポリシーフィルタ(NSFW/暴力/PII等)
・領域・スタイル・地域間のバランス調整、密キャプションや合成データ効果測定
・研究志向データサイエンス:データアブレーション(構成、キャプション密度、合成比)、軽量スコアラー試作(品質/安全)、社内レポート作成
・連携/展開:研究・プロダクトと協働しデータ構成をロードマップに沿って最適化
・スキーマ/マニフェスト/SLAを整備し、複数チームで再利用可能にする

応募資格(歓迎)
・学習時品質トラッキング/評価:固定プロンプト・シードによる評価フック
・CLIP整合性、美的代理指標、安全率、編集指標を追跡
・テストセット運用とチェックポイント管理
・安全/ガバナンス:データソース・ライセンス管理、削除フロー、顧客データ隔離
・ポリシーフィルタとNSFWトレースの運用

求める人物像
・当社の事業内容、ミッションに共感し、新たな事業への挑戦姿勢・意欲を持った方
福利厚生 / 待遇 健康保険、雇用保険、労災保険、厚生年金
ベネフィット・ワン、プレミアム優待、
財形貯蓄制度、総合福祉団体定期保険、
保険制度(団体生命保険、団体扱い生命保険、団体損害保険、団体扱い損害保険など)、
確定拠出年金(401K)
勤務時間 フレックス勤務:可
所定労働時間:午前9時〜午後5時45分
休憩:1時間
時間外労働:有り
休日休暇 週休2日制(土曜日および日曜日)、国⺠の祝日、
年末年始(12月29日〜1月3日)、その他会社が指定した日
年次有給休暇(6日〜21日)
※入社月によって付与日数は異なります。