業務内容
◼︎業務内容
・OCRモデルの開発・改善
AIモデルの設計・学習
モデル設計
既存エンジンとの比較・最適化
・前処理・後処理パイプラインの構築
画像の歪み補正・ノイズ除去・傾き補正
テキストの整形、構造化(表形式の抽出など)
誤認識の補正ロジック開発(言語モデルとの連携)
・データ収集・アノテーション
学習に必要な画像・帳票・文書の収集
自動アノテーションツールの導入・チューニング
・精度評価・改善
モデル精度(文字認識率、フィールド単位の正解率)の可視化とレポーティング
分析からの誤認識要因特定と改善ループの構築
・クラウド・エッジでのデプロイ
推論API化、オンプレミスまたはクラウド上での実装・運用
モデルの軽量化・最適化(Quantization, Pruningなど)
・関連技術との統合
生成AIとの連携(例:読み取った情報を要約、補完)
RPAやERPシステムとの連携による業務自動化への統合
【主要な技術スタック】
・バックエンド:Python
・フレームワーク:PyTorch、TensorFlow
・インフラ:AWS,GCP
・その他:Docker,Slack,Linear,GitHub