-
Notifications
You must be signed in to change notification settings - Fork 23
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
部署完第一次执行PSI失败 #189
Comments
从日志中获取的job信息为wgjf kubectl get pod -a 查看一下wgjf相关pod信息,然后提供一下kubectl get pod -n xx {name} -oyaml日志 |
kubectl get pod -a 看下有没有pod信息,如果有可以执行kubectl get pod -n xx {name} -oyaml查询一下信息。 |
|
可以提供一下下方内容:
|
|
看起来是没问题的,执行一下kubectl get kj -n cross-domain wgjf -oyaml |
wgjf是很早的job,新的job是vhau:
|
|
|
|
尝试重新运行一个新任务,然后获取一下最新的kuscia日志看下 |
或者尝试stop 几个暂时不使用的docker 容器【清理一下内存】后在此运行PSI任务。 |
停了2个容器后,再执行PSI任务成功了,为什么?是内存资源不足吗?可以通过设置request limit资源限额解决 不通容器之间的资源隔离问题吗 |
任务发起节点是,提示错误的节点吗?还是合作方提示的错误。我需要确认一下。 |
任务发起节点是提示错误的节点。合作方节点的pod是正常running的,不过双方都是在同一个宿主机,不同的容器。 |
重新部署了一次,再次出现第一次PSI卡住。
|
重新部署后使用的部署模式有改变吗? |
部署模式没变,还是P2P
|
Mem: 31Gi 8.8Gi 5.2Gi 39Mi 17Gi 21Gi
|
由于您长时间没有回复,这边先关闭这个问题。后续有其他问题,欢迎再沟通! |
Issue Type
Running
Have you searched for existing documents and issues?
Yes
OS Platform and Distribution
centos 8
All_in_one Version
v1.11.0
Module type
secretpad
Module version
secretpad:0.12.0b0
What happend and What you expected to happen.
Log output.
The text was updated successfully, but these errors were encountered: