Skip to content

Commit 59b58fc

Browse files
committed
Deployed f46f6cc with MkDocs version: 1.6.0
1 parent 6e9b692 commit 59b58fc

File tree

16 files changed

+15
-3372
lines changed

16 files changed

+15
-3372
lines changed

admin/ghippo/audit/gproduct-audit/amamba.html

-542
This file was deleted.

admin/ghippo/audit/gproduct-audit/kairship.html

-527
This file was deleted.

admin/ghippo/audit/gproduct-audit/kangaroo.html

-417
This file was deleted.

admin/ghippo/audit/gproduct-audit/mcamel.html

-457
This file was deleted.

admin/ghippo/audit/gproduct-audit/mspider.html

-412
This file was deleted.

admin/ghippo/audit/gproduct-audit/skoala.html

-912
This file was deleted.

admin/ghippo/best-practice/authz-plan.html

+1-1
Original file line numberDiff line numberDiff line change
@@ -471,7 +471,7 @@
471471
</div>
472472
</div>
473473
</div>
474-
<div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc">
474+
<div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" hidden="">
475475
<div class="md-sidebar__scrollwrap">
476476
<div class="md-sidebar__inner">
477477
<nav aria-label="导航" class="md-nav md-nav--secondary">

admin/ghippo/platform-setting/about.html

+1-1
Original file line numberDiff line numberDiff line change
@@ -460,7 +460,7 @@ <h1 id="_1">关于平台<a class="headerlink" href="#_1" title="Permanent link">
460460
</li>
461461
<li>
462462
<p>点击 <strong>平台设置</strong> ,选择 <strong>关于平台</strong> ,查看产品版本、开源软件声明和技术团队。</p>
463-
<p><img alt="关于平台" src="../../images/about05.png"/></p>
463+
<p><img alt="关于平台" src="../images/about05.png"/></p>
464464
<p><strong>License 声明</strong></p>
465465
<p><img alt="license 声明" src="../../../images/about02.png"/></p>
466466
<p><strong>技术团队</strong></p>

admin/ghippo/platform-setting/security.html

+2-2
Original file line numberDiff line numberDiff line change
@@ -440,7 +440,7 @@
440440
</div>
441441
</div>
442442
</div>
443-
<div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc">
443+
<div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" hidden="">
444444
<div class="md-sidebar__scrollwrap">
445445
<div class="md-sidebar__inner">
446446
<nav aria-label="导航" class="md-nav md-nav--secondary">
@@ -468,7 +468,7 @@ <h1 id="_1">安全策略<a class="headerlink" href="#_1" title="Permanent link">
468468
<li>登录/退出策略:关闭浏览器的同时退出登录。</li>
469469
</ul>
470470
<p>进入全局管理后,在左侧导航栏点击 <strong>平台设置</strong> -&gt; <strong>安全策略</strong> ,即可设置密码策略和访问控制策略。</p>
471-
<p><img alt="安全策略" src="../../images/security-policy.png"/></p>
471+
<p><img alt="安全策略" src="../images/security-policy.png"/></p>
472472
</article>
473473
</div>
474474
<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>

end-user/baize/inference/models.html

+2-2
Original file line numberDiff line numberDiff line change
@@ -545,8 +545,8 @@ <h1 id="_1">了解模型支持情况<a class="headerlink" href="#_1" title="Perm
545545
<li>AI Lab v0.6.0 支持了完整版本的 vLLM 推理能力,支持诸多大语言模型,如 <code>LLama</code><code>Qwen</code><code>ChatGLM</code> 等。</li>
546546
</ul>
547547
<p>您可以在 AI Lab 中使用经过算丰 AI 算力平台验证过的 GPU 类型;
548-
更多细节参阅 <a href="../../../admin/kpanda/gpu/gpu_matrix.html">GPU 支持矩阵</a></p>
549-
<p><img alt="点击创建" src="../../images/inference-interface.png"/></p>
548+
更多细节参阅 <a href="../../kpanda/gpu/gpu_matrix.html">GPU 支持矩阵</a></p>
549+
<p><img alt="点击创建" src="../images/inference-interface.png"/></p>
550550
<h2 id="triton-inference-server">Triton Inference Server<a class="headerlink" href="#triton-inference-server" title="Permanent link"></a></h2>
551551
<p>通过 Triton Inference Server 可以很好的支持传统的深度学习模型,我们目前支持主流的推理后端服务:</p>
552552
<table>

end-user/baize/inference/triton-inference.html

+4-64
Original file line numberDiff line numberDiff line change
@@ -701,11 +701,11 @@ <h2 id="_1">前提条件<a class="headerlink" href="#_1" title="Permanent link">
701701
</code></pre></div>
702702
<h2 id="_2">创建推理服务<a class="headerlink" href="#_2" title="Permanent link"></a></h2>
703703
<p>目前已经支持表单创建,可以界面字段提示,进行服务创建。</p>
704-
<p><img alt="点击创建" src="../../images/triton-infer-0.png"/></p>
704+
<p><img alt="点击创建" src="../images/triton-infer-0.png"/></p>
705705
<h3 id="_3">配置模型路径<a class="headerlink" href="#_3" title="Permanent link"></a></h3>
706706
<p>模型路径 <code>model-repo/mnist-cnn/1/model.pt</code> 需要和数据集中的模型目录格式一致。</p>
707707
<h2 id="_4">模型配置<a class="headerlink" href="#_4" title="Permanent link"></a></h2>
708-
<p><img alt="点击创建" src="../../images/triton-infer-1.png"/></p>
708+
<p><img alt="点击创建" src="../images/triton-infer-1.png"/></p>
709709
<h3 id="_5">配置输入和输出参数<a class="headerlink" href="#_5" title="Permanent link"></a></h3>
710710
<div class="admonition note">
711711
<p class="admonition-title">Note</p>
@@ -714,31 +714,13 @@ <h3 id="_5">配置输入和输出参数<a class="headerlink" href="#_5" title="P
714714
<h3 id="_6">配置环境<a class="headerlink" href="#_6" title="Permanent link"></a></h3>
715715
<p>可以导入 <a href="../dataset/environments.html">环境管理</a> 中创建的环境作为推理时的运行环境。</p>
716716
<h2 id="_7">高级配置<a class="headerlink" href="#_7" title="Permanent link"></a></h2>
717-
<p><img alt="点击创建" src="../../images/triton-infer-2.png"/></p>
717+
<p><img alt="点击创建" src="../images/triton-infer-2.png"/></p>
718718
<h3 id="_8">配置认证策略<a class="headerlink" href="#_8" title="Permanent link"></a></h3>
719719
<p>支持 <code>API key</code> 的请求方式认证,用户可以自定义增加认证参数。</p>
720720
<h3 id="_9">亲和性调度<a class="headerlink" href="#_9" title="Permanent link"></a></h3>
721721
<p>支持 根据 GPU 资源等节点配置实现自动化的亲和性调度,同时也方便用户自定义调度策略。</p>
722722
<h2 id="_10">访问<a class="headerlink" href="#_10" title="Permanent link"></a></h2>
723-
<p><img alt="点击创建" src="../../images/triton-infer-3.png"/></p>
724-
<!-- 模型推理服务默认提供了多种访问方式,以便客户端可以通过不同的协议与推理服务进行交互。您可以通过以下方式访问服务:
725-
726-
1. **HTTP/REST API**
727-
728-
- Triton 提供了一个基于 REST 的 API,允许客户端通过 HTTP POST 请求进行模型推理。
729-
- 客户端可以发送 JSON 格式的请求体,其中包含输入数据和相关的元数据。
730-
731-
2. **gRPC API**
732-
733-
- Triton 还提供了 gRPC 接口,它是一种高性能、开源、通用的 RPC 框架。
734-
- gRPC 支持流式处理,可以更有效地处理大量数据。
735-
736-
3. **C++ 和 Python 客户端库**
737-
738-
- Triton 为 C++ 和 Python 提供了客户端库,使得在这些语言中编写客户端代码更加方便。
739-
- 客户端库封装了 HTTP/REST 和 gRPC 的细节,提供了简单的函数调用来执行推理。
740-
741-
每种访问方式都有其特定的用例和优势。例如,HTTP/REST API 通常用于简单和跨语言的场景,而 gRPC 则适用于需要高性能和低延迟的应用。C++ 和 Python 客户端库提供了更丰富的功能和更好的性能,适合在这些语言环境中进行深度集成。 -->
723+
<p><img alt="点击创建" src="../images/triton-infer-3.png"/></p>
742724
<h3 id="api">API 访问<a class="headerlink" href="#api" title="Permanent link"></a></h3>
743725
<ul>
744726
<li>Triton 提供了一个基于 REST 的 API,允许客户端通过 HTTP POST 请求进行模型推理。</li>
@@ -781,49 +763,7 @@ <h5 id="curl">示例 curl 命令<a class="headerlink" href="#curl" title="Perman
781763
<li><code>"datatype"</code> 要与模型配置中的输入参数的 <code>Data Type</code> 一致。</li>
782764
<li><code>"data"</code> 替换为实际的推理数据。</li>
783765
</ul>
784-
<!-- #### gRPC 访问
785-
786-
1. **生成客户端代码** :使用 Triton 提供的模型定义文件(通常是 `.pbtxt` 文件),生成 gRPC 客户端代码。
787-
788-
2. **创建 gRPC 客户端实例** :使用生成的代码创建 gRPC 客户端。
789-
790-
3. **发送 gRPC 请求** :构造 gRPC 请求,包含模型输入数据。
791-
792-
4. **接收响应** :等待服务器处理并接收响应。
793-
794-
##### 示例 gRPC 访问代码
795-
796-
<div class="highlight"><pre><span></span><code><a id="__codelineno-3-1" name="__codelineno-3-1" href="#__codelineno-3-1"></a><span class="kn">from</span> <span class="nn">triton_client.grpc</span> <span class="kn">import</span> <span class="o">*</span>
797-
<a id="__codelineno-3-2" name="__codelineno-3-2" href="#__codelineno-3-2"></a><span class="kn">from</span> <span class="nn">triton_client.utils</span> <span class="kn">import</span> <span class="o">*</span>
798-
<a id="__codelineno-3-3" name="__codelineno-3-3" href="#__codelineno-3-3"></a>
799-
<a id="__codelineno-3-4" name="__codelineno-3-4" href="#__codelineno-3-4"></a><span class="c1"># 初始化 gRPC 客户端</span>
800-
<a id="__codelineno-3-5" name="__codelineno-3-5" href="#__codelineno-3-5"></a><span class="k">try</span><span class="p">:</span>
801-
<a id="__codelineno-3-6" name="__codelineno-3-6" href="#__codelineno-3-6"></a> <span class="n">triton_client</span> <span class="o">=</span> <span class="n">InferenceServerClient</span><span class="p">(</span><span class="s1">&#39;localhost:8001&#39;</span><span class="p">)</span>
802-
<a id="__codelineno-3-7" name="__codelineno-3-7" href="#__codelineno-3-7"></a><span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
803-
<a id="__codelineno-3-8" name="__codelineno-3-8" href="#__codelineno-3-8"></a> <span class="n">logging</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;failed to create gRPC client: &quot;</span> <span class="o">+</span> <span class="nb">str</span><span class="p">(</span><span class="n">e</span><span class="p">))</span>
804-
<a id="__codelineno-3-9" name="__codelineno-3-9" href="#__codelineno-3-9"></a>
805-
<a id="__codelineno-3-10" name="__codelineno-3-10" href="#__codelineno-3-10"></a><span class="c1"># 构造输入数据</span>
806-
<a id="__codelineno-3-11" name="__codelineno-3-11" href="#__codelineno-3-11"></a><span class="n">model_name</span> <span class="o">=</span> <span class="s1">&#39;chatglm2-6b&#39;</span>
807-
<a id="__codelineno-3-12" name="__codelineno-3-12" href="#__codelineno-3-12"></a><span class="n">input_data</span> <span class="o">=</span> <span class="o">...</span> <span class="c1"># 你的模型输入数据</span>
808-
<a id="__codelineno-3-13" name="__codelineno-3-13" href="#__codelineno-3-13"></a>
809-
<a id="__codelineno-3-14" name="__codelineno-3-14" href="#__codelineno-3-14"></a><span class="c1"># 创建输入和输出</span>
810-
<a id="__codelineno-3-15" name="__codelineno-3-15" href="#__codelineno-3-15"></a><span class="n">inputs</span> <span class="o">=</span> <span class="p">[</span><span class="n">InferenceServerClient</span><span class="o">.</span><span class="n">Input</span><span class="p">(</span><span class="s1">&#39;input_names&#39;</span><span class="p">,</span> <span class="n">input_data</span><span class="o">.</span><span class="n">shape</span><span class="p">,</span> <span class="s2">&quot;TYPE&quot;</span><span class="p">)]</span>
811-
<a id="__codelineno-3-16" name="__codelineno-3-16" href="#__codelineno-3-16"></a><span class="n">outputs</span> <span class="o">=</span> <span class="p">[</span><span class="n">InferenceServerClient</span><span class="o">.</span><span class="n">Output</span><span class="p">(</span><span class="s1">&#39;output_names&#39;</span><span class="p">)]</span>
812-
<a id="__codelineno-3-17" name="__codelineno-3-17" href="#__codelineno-3-17"></a>
813-
<a id="__codelineno-3-18" name="__codelineno-3-18" href="#__codelineno-3-18"></a><span class="c1"># 发送推理请求</span>
814-
<a id="__codelineno-3-19" name="__codelineno-3-19" href="#__codelineno-3-19"></a><span class="n">results</span> <span class="o">=</span> <span class="n">triton_client</span><span class="o">.</span><span class="n">infer</span><span class="p">(</span><span class="n">model_name</span><span class="p">,</span> <span class="n">inputs</span><span class="p">,</span> <span class="n">outputs</span><span class="p">)</span>
815-
<a id="__codelineno-3-20" name="__codelineno-3-20" href="#__codelineno-3-20"></a>
816-
<a id="__codelineno-3-21" name="__codelineno-3-21" href="#__codelineno-3-21"></a><span class="c1"># 获取推理结果</span>
817-
<a id="__codelineno-3-22" name="__codelineno-3-22" href="#__codelineno-3-22"></a><span class="n">output_data</span> <span class="o">=</span> <span class="n">results</span><span class="o">.</span><span class="n">as_numpy</span><span class="p">(</span><span class="s1">&#39;output_names&#39;</span><span class="p">)</span>
818-
</code></pre></div>
819-
820-
- `localhost:8001` 是 Triton 默认的 gRPC 端口,如果配置不同,请相应更改。
821-
- `input_data` 是你的模型输入数据,需要根据模型要求进行预处理。
822-
- `TYPE` 是模型输入的数据类型,如 `FP32`、`INT32` 等。 -->
823766
<p>请注意,上述示例代码需要根据你的具体模型和环境进行调整,输入数据的格式和内容也需要符合模型的要求。</p>
824-
<!-- ### Web UI 访问(敬请期待)
825-
826-
> Web UI 访问正在开发中,敬请期待。-->
827767
</article>
828768
</div>
829769
<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>

end-user/baize/inference/vllm-inference.html

+3-3
Original file line numberDiff line numberDiff line change
@@ -547,11 +547,11 @@ <h2 id="_2">创建推理服务<a class="headerlink" href="#_2" title="Permanent
547547
<li>
548548
<p>选择 <code>vLLM</code> 推理框架,并在选择模型模块选择提前创建好的模型数据集 <code>hdd-models</code> 并填写数据集中模型所在的<code>路径</code>信息。</p>
549549
<p>本文推理服务的创建使用 ChatGLM3 模型。</p>
550-
<p><img alt="模型选择" src="../../images/vllm-infer-0.png"/></p>
550+
<p><img alt="模型选择" src="../images/vllm-infer-0.png"/></p>
551551
</li>
552552
<li>
553553
<p>配置推理服务的资源,并调整推理服务运行的参数。</p>
554-
<p><img alt="数据选择" src="../../images/vllm-infer-1.png"/></p>
554+
<p><img alt="数据选择" src="../images/vllm-infer-1.png"/></p>
555555
<table>
556556
<thead>
557557
<tr>
@@ -590,7 +590,7 @@ <h2 id="_2">创建推理服务<a class="headerlink" href="#_2" title="Permanent
590590
<h2 id="_3">验证推理服务<a class="headerlink" href="#_3" title="Permanent link"></a></h2>
591591
<p>推理服务创建完成之后,点击推理服务名称进入详情,查看 API 调用方法。通过使用 Curl、Python、Nodejs 等方式验证执行结果。</p>
592592
<p>拷贝详情中的 <code>curl</code> 命令,并在终端中执行命令发送一条模型推理请求,预期输出:</p>
593-
<p><img alt="推理接口" src="../../images/vllm-infer-2.png"/></p>
593+
<p><img alt="推理接口" src="../images/vllm-infer-2.png"/></p>
594594
</article>
595595
</div>
596596
<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>

end-user/insight/infra/cluster.html

+1-1
Original file line numberDiff line numberDiff line change
@@ -570,7 +570,7 @@ <h2 id="_3">操作步骤<a class="headerlink" href="#_3" title="Permanent link">
570570
<li><strong>资源消耗</strong> :所选集群的 CPU、内存、磁盘的实际使用量和总量;</li>
571571
<li><strong>指标说明</strong> :所选集群的 CPU、内存、磁盘读写、网络接收发送的变化趋势。</li>
572572
</ul>
573-
<p><img alt="集群监控" src="../../images/cluster.png" width="1000"/></p>
573+
<p><img alt="集群监控" src="../images/cluster.png" width="1000"/></p>
574574
</li>
575575
<li>
576576
<p>切换到 <strong>资源水位线监控</strong> 页签,可查看当前集群的更多监控数据。</p>

search/search_index.json

+1-1
Large diffs are not rendered by default.

sitemap.xml

-30
Original file line numberDiff line numberDiff line change
@@ -290,11 +290,6 @@
290290
<lastmod>2024-11-13</lastmod>
291291
<changefreq>daily</changefreq>
292292
</url>
293-
<url>
294-
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/amamba.html</loc>
295-
<lastmod>2024-11-13</lastmod>
296-
<changefreq>daily</changefreq>
297-
</url>
298293
<url>
299294
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/ghippo.html</loc>
300295
<lastmod>2024-11-13</lastmod>
@@ -305,36 +300,11 @@
305300
<lastmod>2024-11-13</lastmod>
306301
<changefreq>daily</changefreq>
307302
</url>
308-
<url>
309-
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/kairship.html</loc>
310-
<lastmod>2024-11-13</lastmod>
311-
<changefreq>daily</changefreq>
312-
</url>
313-
<url>
314-
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/kangaroo.html</loc>
315-
<lastmod>2024-11-13</lastmod>
316-
<changefreq>daily</changefreq>
317-
</url>
318303
<url>
319304
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/kpanda.html</loc>
320305
<lastmod>2024-11-13</lastmod>
321306
<changefreq>daily</changefreq>
322307
</url>
323-
<url>
324-
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/mcamel.html</loc>
325-
<lastmod>2024-11-13</lastmod>
326-
<changefreq>daily</changefreq>
327-
</url>
328-
<url>
329-
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/mspider.html</loc>
330-
<lastmod>2024-11-13</lastmod>
331-
<changefreq>daily</changefreq>
332-
</url>
333-
<url>
334-
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/skoala.html</loc>
335-
<lastmod>2024-11-13</lastmod>
336-
<changefreq>daily</changefreq>
337-
</url>
338308
<url>
339309
<loc>https://sophdoc.github.io/admin/ghippo/audit/gproduct-audit/virtnest.html</loc>
340310
<lastmod>2024-11-13</lastmod>

sitemap.xml.gz

-44 Bytes
Binary file not shown.

0 commit comments

Comments
 (0)