掲載日 ・ 2025/12/19
株式会社kubell
株式会社kubell:SRE(Chatwork)
非公開
東京都
会社名
株式会社kubell
会社概要
【会社概要】
2004年に設立、クラウド型ビジネスチャットツール「Chatwork」を主力事業として展開しているベンチャー企業。 現在、導入社数は38.6万社を超え(2022年12月末日時点)、"社会インフラ"として認知・利用されるプロダクトに成長しており、2014年に東証マザーズに上場。
中長期的には、クラウドストレージなどの「情報」や、採用・人事評価などの「HR(ヒト)」、請求管理や決済といった「ファイナンス(カネ)」など、様々なサービスと連携し、あらゆるビジネスの起点となるプラットフォーム、「ビジネス版スーパーアプリ」を目指しており、新規事業開発や周辺サービスとの提携やM&Aなども積極的に行っています。
【特徴】
働きやすさ:フレックスタイム制やテレワーク制度など、様々な働き方が選択可能。マッサージルームやライブラリなど、従業員の健康やリフレッシュをサポートする設備や様々な福利厚生制度が充実しています。
風通しの良いフラットな社風:役職や年齢に関係なく、意見を言い合える環境があります。また、社員同士の交流を深めるためのイベントや活動も盛ん。
成長可能性:現在急成長している企業の為、様々なポジションで人材を積極採用中であり、キャリアの成長余地も多くあります。若手社員でも活躍できる環境が整っています。
ポジション
SRE(Chatwork)
仕事内容
採用背景
SREグループは、Chatworkのサービスを安定して提供できるように、アプリケーションの実行基盤の整備を行います。また既存のシステムが稼働しながらアーキテクチャ刷新プロジェクトが並走する過渡期でもあります。
現在抱えている開発環境の課題は、開発組織の拡大に伴い、開発環境の再現性・ポータビリティの低さがボトルネックとなり、開発効率やプロジェクトの安定性に影響が出始めていることです。
その解消のために、以下の実行を推し進めている最中です。
・ システムリプレイスに向けた準備 将来的に必要となるシステムリプレイスに備え、既存システムのポータビリティ向上とIaC導入を進めることで、円滑な移行と効率的なシステム構築。
・ IaCノウハウの蓄積 既存システムを題材にIaCの導入と運用を経験することで、最適なモジュール構成や定義の管理フローに関するノウハウを蓄積。
・ 開発生産性の可視化 SLI/SLO/Four Keysといった指標に基づいた開発生産性の可視化を推進。
・ 運用コストの削減 HBase、Kafka、ZooKeeperといった複雑なサービスの運用コスト削減に取り組む。(例:HBaseの廃止、Aurora v2からv3への移行)
中長期では、以下の状態を目指します。
・定期的なEKS version upを少ない工数で回し続ける体制・仕組みの確立
・全てのアプリケーションがk8s上で動いている
・システム全体がIaCで管理されていて、AWS内であれば、アカウントやregionを気にすることなく、完全な環境のポータビリティを持っている
・Kafkaのフルマネージドサービス移行により、運用負荷の軽減・コストの圧縮・新アーキテクチャ移行に対する安定した基盤の提供が出来ている
・SLI/SLO/Four Keysといった指標が有効に活用され、改善の意思決定に利用されている
参考:Chatworkアカウント事業 プロダクト組織紹介(エンジニア向け)
ポジションの魅力
・ 社会貢献性の高いプロダクト 全国の中小企業の事業を支える、信頼性の高い「Chatwork」の開発・運用に携わることができる。
・ 高度な技術的挑戦 安定したKubernetesクラスターの運用、開発者体験の向上、開発生産性の可視化、AIを活用した運用効率化など、多岐にわたる技術的課題に取り組める。
・ 継続的な成長と改善 常に改善が求められるプロダクトに関わることで、自身の技術力や経験を向上させることができる。
業務内容
以下を目的とした技術的な課題解決です。
・開発や運用のレベルを維持し、品質の高いソフトウェアを安定的に稼働
・異常の早期検知
・組織横断的なインフラ整備と開発スピードの向上
・運用管理の自動化/自立化の仕組み設計・構築
・変更の即応性や信頼性の高いシステム基盤を設計
※対象領域が多岐にわたるため、スキルと経験によって専任/チーム化をして課題解決をおこないます。
具体的な業務としては‥
Kubernetes clusterの基盤整備
定期的なEKSのversion upのドライブ、version upフローの改善、CI/CDの整備を行なっています
AWSインフラの最適化、Infrastructre as codeの推進
全AWSリソースのTerraform化によるcode化を進めています
モニタリングの整備、インシデント対応
サービスの安定稼働のために、Datadog等のSaaSをフル活用して、様々な形でのモニタリングを行っています
インシデント発生時は、主にサーバサイドグループのメンバーと協力しながら、原因特定・解決・恒久対策を行います。
データストレージの運用
Amazon Aurora・AWS Elasticsearch service・Amazon DynamoDBなど、複数種類のストレージの監視や運用を行なっています
オンコール対応
主にKubernetes clusterの基盤障害への対応を行います
【変更の範囲】*雇用区分別に下記記載が必須になります
正社員:部署異動等により当社業務全般へ変更する場合があります(出向含む)
契約社員:雇入れ直後の業務内容に関連する業務に限り変更する場合があります(出向含む)
パートタイマー:原則として変更なし
使用ツール
Terraform, Datadog, ArgoCD, ArgoRollouts, GitHub Actions, DockerHub
開発環境
AWS, Golang, GitHub, Confluent Cloud, JIRA, Confluence
求める経験・スキル
必要なスキル・経験
システム運用、トラブルシューティングの経験があること
クラウドインフラの構築・運用経験
なんらかのプログミング言語を使用できること
Kubernetes等のコンテナオーケストレーションツールの構築・運用経験
あると望ましいスキル・経験
Webサービスの設計・開発・運用経験
大規模システムのモニタリング設計、障害発生時のトラブルシュート経験
CI/CDや開発環境を整備しチームの生産性向上に寄与されたご経験
SLI/SLO/Four Keysなどの指標を全社導入したご経験
技術系勉強会の登壇やOSSプロジェクトへのコントリビュートなど、コミュニティへ貢献したご経験