ストックマーク株式会社

【Dev】LLM推論基盤エンジニア/LLM推論高速化/モデル軽量化/フルリモート可/※ミドル~ハイレイヤー求人

  • 土日祝日休み
  • 年間休日120日以上
  • 服装自由
  • フレックス制
年収
755~1,306万円
働き方
フルリモート
最寄り駅
表参道駅 (東京都)
職種
データサイエンティスト
言語
C++ Python TypeScript
クラウド
AWS Windows Azure

仕事内容について

【業務内容】
自社プロダクトで活用する大規模言語モデル(LLM)およびマルチモーダルモデル(VLM)の推論・学習の高速化を担当します。
製品開発チームやリサーチチームと協働しながら、実際のプロダクトに最適な形で技術を落とし込んでいただきます。
■具体的な業務内容
・LLM/VLM推論パイプラインの最適化(高速化・省メモリ化・分散処理)
・モデル圧縮、量子化、蒸留などによる軽量化手法の検討と実装
・推論基盤の設計(モデル並列・パイプライン並列・ロードバランシング)
・推論時間・コストの定量的改善に向けた性能計測と最適化サイクルの運用

【仕事の特色】
【現状の課題】
国産LLM・VLMの自社開発を進める中で、推論・モデル軽量化などの性能最適化がボトルネックとなっています。
既存のフレームワークやGPU構成に依存しない、高速・安定・安価な基盤を構築することが急務です。
研究開発レベルの知見をプロダクトとして成立させる実装力を持つエンジニアを求めています。

【チーム構成】
PaaSユニット
事業責任者(CEO)1名
プロダクトマネージャー 1名

【開発環境】
■組織体制
PaaSエンジニアチーム
・プロダクトマネージャー1名
・フロントエンドエンジニア1名
・バックエンドエンジニア1名
・機械学習エンジニア3名

■開発言語
TypeScript、Vue.js 、Node.js、Python

■コンテナ
Docker

■IaC
Terraform

■クラウド
AWS, Azure

【ポジションの魅力】
・国産LLMを自社でフルスクラッチ開発している希少な環境
・研究成果を“動くプロダクト”として社会に届ける技術開発ができる
・OSSや論文に還元できるほどの技術的挑戦を実務で経験可能
・LLM/VLM領域の先端研究者と密に協働できる

【仕事内容(変更の範囲)】
開発関連業務

必須条件

※いずれか必須
・PyTorchやTensorFlowなどを用いたLLM/VLMの実装・最適化経験
・CUDA、NCCL、TensorRT、ONNX Runtimeなどを活用したGPU最適化知識
・モデル推論のパフォーマンス改善・メモリ削減の実務経験
・分散学習・推論に関する基礎理解(Data Parallel, Model Parallelなど)
・Python/C++などでの性能チューニング経験

・LLMの推論最適化や軽量化に関するOSS貢献または論文発表経験
・Megatron-LM、DeepSpeed、vLLMなどのフレームワーク実装経験
・Triton Inference ServerやRayなどの分散推論基盤の知識
・GPUクラスタ環境での実運用経験(Kubernetes, Slurm, etc.)
・研究チームとの共同開発経験、MLPerfなど性能ベンチマークの知見

歓迎要件

・LLMの推論最適化や軽量化に関するOSS貢献または論文発表経験
・Megatron-LM、DeepSpeed、vLLMなどのフレームワーク実装経験
・Triton Inference ServerやRayなどの分散推論基盤の知識
・GPUクラスタ環境での実運用経験(Kubernetes, Slurm, etc.)
・研究チームとの共同開発経験、MLPerfなど性能ベンチマークの知見

想定年収

755~1,306万円 (給与形態:月給)

■賞与・昇給
賞与:
昇給:年2回

無料

直接質問しづらいことお任せください!

※企業に問い合わせ内容が伝わることはありません。

知りたい内容をお選びください(複数選択可)

募集要項

募集職・職位
  • データサイエンティスト
業界
  • IT・通信
  • インターネット/ソフトウェア
  • メディア・エンターテイメント
  • 広告・デザイン・イベント
  • サービス
  • 人材・教育
雇用形態

正社員

予定勤務地
東京都港区南青山 1 丁目12-3 LIFORK MINAMI AOYAMA S209 ※本社または自宅その他リモートワークが行える場所
予定勤務地
(変更の範囲)
無し
就業時間
10:00~19:00  フレックスタイム制 コアタイム10:00~14:00
就業時間備考
・1ヶ月の標準労働時間:1日8時間×営業日数
※時間外労働あり(平均10〜20時間)
平均残業時間
10~30時間
年間休日
123日
服装
私服
リモート
ワーク

フルリモート

フレックス
あり
副業

福利厚生

■保険制度
健康保険 / 厚生年金 / 雇用保険 / 労災保険 / 通勤手当 / 年末年始 / 有給休暇

■制度
■定期健康診断
■インフルエンザ予防接種
■希望のPC支給
■オフィスにて水/コーヒー/炭酸/アルコールなどのドリンク無料提供
■オフィスグリコ設置
■屋内禁煙(屋外喫煙所あり)

【教育・スキルアップ】
■入社後5日間のオンボーディングあり
■月1回の研究日制度(自身の技術向上・学習目的)

【社内コミュニケーション】
■週1回全社オンラインミーティング
■月1回懇親会(オフライン開催、一部オンライン有り)
■半期1回キックオフ(オンライン&オフラインのハイブリッド開催)

試用期間
3ヶ月
休日休暇

■休日制度
■土日祝(完全週休2日制)
■年末年始休暇
■産前産後休暇
■育児休暇

手当

■通勤交通費(リモートのため実費支給)
■リモートワーク準備一時金(初回給与にて一律5万円)
 リモートワークを行うための準備に要する費用として支給

選考場所

本社、オンライン

検査・試験

実施される可能性がございます

提出書類

履歴書、職務経歴書

さらに表示する

ストックマーク株式会社が募集している求人・転職・採用情報

さらに表示する

ストックマーク株式会社について

設立年月日
2016年11月15日
代表者
代表取締役CEO 林 達,取締役CTO 有馬 幸介
従業員情報
42名(2020年03月03日時点)
事業内容
自然言語処理を活用した企業文化変革の支援を行うサービスの開発・運営

ストックマークの企業情報を見る

他の求人と比較してみる

300万円〜400万円 1021件
400万円〜500万円 2369件
500万円〜600万円 1587件
600万円〜700万円 940件
700万円〜800万円 385件
800万円〜900万円 204件
900万円〜1000万円 34件
1000万円〜 52件

Pythonの求人数

この求人は赤色の分布帯です。

出典:レバテックキャリアが保有する対象求人を下限年収で算出(2024年9月地点)

300万円〜400万円 768件
400万円〜500万円 965件
500万円〜600万円 450件
600万円〜700万円 228件
700万円〜800万円 63件
800万円〜900万円 39件
900万円〜1000万円 3件
1000万円〜 12件

C++の求人数

この求人は赤色の分布帯です。

出典:レバテックキャリアが保有する対象求人を下限年収で算出(2024年9月地点)

300万円〜400万円 179件
400万円〜500万円 500件
500万円〜600万円 399件
600万円〜700万円 276件
700万円〜800万円 97件
800万円〜900万円 62件
900万円〜1000万円 8件
1000万円〜 19件

データサイエンティストの求人数

この求人は赤色の分布帯です。

出典:レバテックキャリアが保有する対象求人を下限年収で算出(2024年9月地点)

同じ職種の似ている求人で探す

関連する職種から探す

関連言語・スキルから求人を探す

同じ職種のリモートの求人を探す

同じ職種の未経験の求人を探す

エリアから探す

ITエンジニア専用ページへ戻る

レバテックキャリアTOPへ戻る

  • ※1 2020年8月~2021年9月の実績

ITエンジニア転職ならレバテックキャリア

レバテックサービス

認知度 No.1

登録率 No.1

※ITエンジニア向け仕事探し支援サービスの認知度と登録率がNo.1(調査委託先:GMOリサーチ&AI株式会社/調査方法:インターネットリサーチ/調査対象:一都三県居住・20-49歳・男女・IT専門職/回答者数:4172名/調査期間:2024年12月5日~13日)

年収アップをご希望の方へ

簡単!年収診断

現在の市場価値や
年収UPの実現方法がわかる!

無料診断 START