チャオ・レイ · Kit Kyo
AI・エージェント・LLM インフラエンジニア / フルスタック
基本情報
- チャオ・レイ / 男性 / 28歳
- JLPT N2
連絡先
自己紹介
AI エージェント / LLM 基盤エンジニア(フルスタック背景)。主権・オンプレミス型の AI エージェント基盤と、エッジでの LLM / MoE 推論(デプロイ可能性 × データ所在地 × close-to-metal)を専門としています。マルチノードの k3s クラスタ、A2A メッセージバス、統一 LLM 推論ゲートウェイ、可観測性基盤をゼロから構築・運用した経験があります。5 年にわたる Java / Go のフルスタック開発を土台に、現在は LLM エージェント工学と GPU 推論最適化に注力しています。
学歴
-
内蒙古農業大学 - コンピュータネットワーク技術
AI / エージェント / LLM
インフラ / Infra
バックエンド & フルスタック
職歴
-
TLZS株式会社
- プラットフォーム / インフラエンジニア(SRE)
-
日本愛知県Z-SOFT株式会社
- システム開発エンジニア
-
内蒙古環之宇科技有限責任公司
- Javaエンジニア
-
天津訊雅時空科技有限責任公司
- Javaエンジニア(インターン)
プロジェクト経験
-
主権AIクラスタ / フリート基盤エンジニアリング(SRE)
- 技術スタック:k3sPrometheus/GrafanalitellmKEDATailscale/Liqovast.ai A100
- 本番級の 8 ノードベアメタル k3s クラスタ(マルチコントロールプレーン + etcd、58 ネームスペース / 197 デプロイメント)をゼロから構築・運用。LVM ストレージ、nftables/PPPoE ネットワーク、Tailscale + Liqo によるクラスタ間フェデレーションを実装し、70 日間の安定稼働を達成。
- 可観測性・AI 基盤を自前で構築:Prometheus/Grafana/Loki/Jaeger + Tetragon eBPF、litellm による統一 LLM ゲートウェイ、Langfuse 可観測性、KEDA 自動スケーリング、Kaniko クラスタ内 CI、vast.ai A100 GPU オーケストレーション(vLLM/Ollama、Gemma の QLoRA ファインチューニング)。jp-schedule-hub・jp-esign-forge などの業務システムを納品。
-
まめログ — 在日向けソーシャルコンテンツプラットフォーム
- 技術スタック:GolangGoZeroFlutterKubernetes
- 小紅書(RED)型のコンテンツ共有アプリ。分散型の動画アップロード/処理、ショッピングモールと決済、Ollama + Gemini を用いた AI コンテンツ推薦・Q&A を実装。K8s でサーキットブレイク/負荷分散を構成し、100 並列をサポート。
-
総合AIツール統合プラットフォーム
- 技術スタック:GolangNextJSStable DiffusionChatGPT
- 画像生成・対話モデルなど複数の AI サービスを統合した統一プラットフォーム。ユーザー/トークン残高管理、リモート SD マルチインスタンス監視、ChatGPT API トークン配布を実装し、100 並列をサポート。
-
政府グリッド管理システム
- 技術スタック:JavaSpring BootReactCesium
- コミュニティの住宅/人口/グリッドワーカー業務フロー管理システム。GIS 地図とデータダッシュボードを統合し、フロントエンドでは Cesium による建物の 3D 可視化で都市の実景を再現。