Kubernetes Deployment Template for Inference Service

This template generates Kubernetes manifests for deploying ML inference services.

Usage

# Generate deployment for a new model
copier copy --data-file model-configs/iris-model.yaml copier-template-k8s deployments/iris-model


# Or from your project root
copier copy copier-template-k8s deployments/iris-model

Testing

kubectl run test-model \
> --image=ghcr.io/slaclab/inference-service/test-client:latest \
> --rm -it --restart=Never \
> --env="INFERENCE_SERVICE_URL=http://<service name>:8000" \
> -n inference-service \
> python test_client.py

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
.github/workflows		.github/workflows
copier-template-k8s		copier-template-k8s
k8s		k8s
model-configs		model-configs
Dockerfile		Dockerfile
Dockerfile.client		Dockerfile.client
README.md		README.md
client.py		client.py
inference_service.py		inference_service.py
requirements.txt		requirements.txt
test_client.py		test_client.py
test_local.py		test_local.py
test_validation.py		test_validation.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Kubernetes Deployment Template for Inference Service

Usage

Testing

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Languages

slaclab/inference-service

Folders and files

Latest commit

History

Repository files navigation

Kubernetes Deployment Template for Inference Service

Usage

Testing

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Languages

Packages