チャオ・レイ · Kit Kyo

AI・エージェント・LLM インフラエンジニア / フルスタック

基本情報


  • チャオ・レイ / 男性 / 28歳
  • JLPT N2

連絡先


自己紹介


AI エージェント / LLM 基盤エンジニア(フルスタック背景)。主権・オンプレミス型の AI エージェント基盤と、エッジでの LLM / MoE 推論(デプロイ可能性 × データ所在地 × close-to-metal)を専門としています。マルチノードの k3s クラスタ、A2A メッセージバス、統一 LLM 推論ゲートウェイ、可観測性基盤をゼロから構築・運用した経験があります。5 年にわたる Java / Go のフルスタック開発を土台に、現在は LLM エージェント工学と GPU 推論最適化に注力しています。

学歴


  • 内蒙古農業大学 - コンピュータネットワーク技術

AI / エージェント / LLM


  • Claude Agent SDK
  • MCP
  • LangGraph / A2A
  • vLLM
  • Ollama
  • llama.cpp
  • MoE エッジ推論
  • Gemma / Qwen
  • RAG

インフラ / Infra


  • Kubernetes / k3s
  • NATS / JetStream
  • Docker / Kaniko
  • Tailscale / Liqo
  • nftables / PPPoE
  • Infisical
  • systemd / launchd
  • Linux (Debian/macOS)
  • vast.ai GPU

バックエンド & フルスタック


  • Go (Gin/GoZero)
  • Java (Spring Boot/Cloud)
  • Python
  • TypeScript / Node
  • React
  • Vue
  • Three.js / WebGL
  • Flutter
  • MySQL / Redis
  • RabbitMQ

職歴


  • TLZS株式会社

    • プラットフォーム / インフラエンジニア(SRE)
  • 日本愛知県Z-SOFT株式会社

    • システム開発エンジニア
  • 内蒙古環之宇科技有限責任公司

    • Javaエンジニア
  • 天津訊雅時空科技有限責任公司

    • Javaエンジニア(インターン)

プロジェクト経験


  • 主権AIクラスタ / フリート基盤エンジニアリング(SRE)

    • 技術スタック:k3sPrometheus/GrafanalitellmKEDATailscale/Liqovast.ai A100
    • 本番級の 8 ノードベアメタル k3s クラスタ(マルチコントロールプレーン + etcd、58 ネームスペース / 197 デプロイメント)をゼロから構築・運用。LVM ストレージ、nftables/PPPoE ネットワーク、Tailscale + Liqo によるクラスタ間フェデレーションを実装し、70 日間の安定稼働を達成。
    • 可観測性・AI 基盤を自前で構築:Prometheus/Grafana/Loki/Jaeger + Tetragon eBPF、litellm による統一 LLM ゲートウェイ、Langfuse 可観測性、KEDA 自動スケーリング、Kaniko クラスタ内 CI、vast.ai A100 GPU オーケストレーション(vLLM/Ollama、Gemma の QLoRA ファインチューニング)。jp-schedule-hub・jp-esign-forge などの業務システムを納品。
  • まめログ — 在日向けソーシャルコンテンツプラットフォーム

    • 技術スタック:GolangGoZeroFlutterKubernetes
    • 小紅書(RED)型のコンテンツ共有アプリ。分散型の動画アップロード/処理、ショッピングモールと決済、Ollama + Gemini を用いた AI コンテンツ推薦・Q&A を実装。K8s でサーキットブレイク/負荷分散を構成し、100 並列をサポート。
  • 総合AIツール統合プラットフォーム

    • 技術スタック:GolangNextJSStable DiffusionChatGPT
    • 画像生成・対話モデルなど複数の AI サービスを統合した統一プラットフォーム。ユーザー/トークン残高管理、リモート SD マルチインスタンス監視、ChatGPT API トークン配布を実装し、100 並列をサポート。
  • 政府グリッド管理システム

    • 技術スタック:JavaSpring BootReactCesium
    • コミュニティの住宅/人口/グリッドワーカー業務フロー管理システム。GIS 地図とデータダッシュボードを統合し、フロントエンドでは Cesium による建物の 3D 可視化で都市の実景を再現。