掲載日 ・ 2026/03/03
日本電気株式会社
日本電気株式会社:4326 Site Reliability Engineer(Machine Learning Platform)_DPS
非公開
神奈川県
会社名
日本電気株式会社
会社概要
■パブリック事業:国内外の政府・官公庁・公共機関・金融機関などに向けて、ネットワーク技術やセンサ技術など当社の特長ある技術アセットと幅広いSIノウハウ・顧客アセットを融合し、安全・安心な社会の仕組みを作り上げています。
■エンタープライズ事業:製造業、流通・サービス業を中心とする民需向けにITソリューションを提供し、お客さまの売上拡大や経営効率化に加えて、新サービス立ち上げなど、お客さまにとっての新たな価値創造に貢献しています。
■ネットワークサービス事業:通信キャリア向けに、ネットワークを構築するために必要な機器や、ネットワーク制御のための基盤システム・運用サービスなどを提供しています。これまでに培った大規模ネットワーク構築をはじめとする豊富な実績と高い技術力を強みとして、信頼性の高い通信基盤の実現に貢献します。
■システムプラットフォーム事業:端末からネットワーク機器、コンピュータ機器、ソフトウェア製品、サービス基盤まで、ビジネス向け製品と、これらをベースにしたソリューション・サービスを一括提供しています。これらの製品群とソリューション・サービスを有機的に融合したソリューション型プラットフォームにより、お客さまの業務の省力化・効率化を実現するとともに、ICTを活用した新たな価値を創出していきます。
ポジション
4326 Site Reliability Engineer(Machine Learning Platform)_DPS
仕事内容
【事業・組織構成の概要】
私たちは、NECのAI事業を加速させるためのAIスパコンを開発・運用する、新設のエンジニアリンググループです。世界で最高のモノづくりにこだわり、先進AIで社会にイノベーションを起こしたい方を募集しています。
NECでは、世界でも有数の数百名のAIエンジニアがAIスパコンを用いて、NEC独自の生成AI等の大規模なAIモデルの開発を行っています。また、生成AI以外にも世界トップレベルの生体認証技術を始めとして、画像認識・データ分析・言語モデル(LLM)・ロボット制御等、多種多様な分野でAIの開発を行っており、事業の応用分野も多岐に及んでいます。
このAIスパコンは、生成AIの研究開発を支えるキーコンポーネントであり、NECのAI事業全体を強化・推進するべくAIスパコンの開発・運用を共に行って頂ける方を求めており、技術の力で事業の未来をデザインする、極めて重要なポジションです。
【職務内容】
最新のハイエンドGPU928基を備える国内企業で最大級のAIスーパーコンピューターを開発・運用を共に行って頂くSite Reliability Engineer (Machine Learning Plaftorm) を数名募集します。スケーラブルかつ洗練されたGPUサーバーを用いた世界有数のAIスパコンを開発・運用し、AIの技術開発に革新をおこしたい方を募集しています。コンピューターアーキテクチャ・ソフトウェアアーキテクチャに精通し、世界に誇れるAIスパコンを共に開発・運用して頂ける方を求めています。
AIスパコンの安定運用を行いながらもAIの進化に合わせ基盤強化を行うには、ソフトウェアの高い開発能力が必要であり、ソフトウェア開発へのこだわりのある方を募集します。
職務変更の範囲:会社の定める職務
求める経験・スキル
【MUST】
下記を全て満たすこと
・ 5年以上のソフトウェア開発・運用の実務経験
・ コンピュータサイエンスの修士号、または博士号、または同等の実務経験がある方
・ Kubernetesの利用経験
・ システムの運用設計・監視の経験
【WANT】
・ 大規模サイトなどでのSREとしての経験(ベアメタルサーバーでの開発経験があれば尚良いです)
・ Kubernetesのクラスタの運用経験
・ 数PB規模の分散ファイルシステムを用いたストレージの開発・運用の実績。
・ GPU関連処理技術への理解(CUDA、NCCL、MPI等)
・ Go言語での開発経験
・ オープンソースプロジェクトへの貢献(GithubのURLがあればプラス)
・ 各種の学習フレームワークへの理解(PyTorch等)
【求める人物像・ソフトスキル】
・コンピュータサイエンスに精通し、ソフトウェア開発への情熱のある方
・AIの可能性を信じ、AIで世界を変えたいと思っている方
・新しいテクノロジースタック群を追い続けられるだけの強い技術への好奇心を持っている方
・高い自主性を持ち、プロジェクトをともに推進して頂ける方