firecrawl
diff --git a/‎Dockerfile‎
Lines changed: 1 addition & 1 deletion b/‎Dockerfile‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎app/serverless.py‎
Lines changed: 14 additions & 12 deletions b/‎app/serverless.py‎
Lines changed: 14 additions & 12 deletions
@@ -1,6 +1,6 @@
 ARG POETRY_VERSION=1.6.1
 
-FROM lmsysorg/sglang:v0.4.9.post6-cu126
+FROM vllm/vllm-openai:v0.10.1.1
 # Allow statements and log messages to immediately appear in the logs
 ENV PYTHONUNBUFFERED True
 
 
@@ -22,23 +22,25 @@
 # except Exception:
 #     pass
 
-def _maybe_init_sglang_engine_in_main() -> None:
-    """Initialize sglang engine in the main process if requested via env.
+def _maybe_init_engine_in_main() -> None:
+    """Initialize VLM engine in the main process if requested via env.
 
     Per MinerU guidance, sglang-engine must be initialized in the main process.
     This avoids scheduler failures when workers spawn without prior initialization.
     """
     backend_env = os.getenv("MINERU_BACKEND", "pipeline").lower()
-    if backend_env == "vlm-sglang-engine":
-        try:
-            from mineru.backend.vlm.vlm_analyze import ModelSingleton
-            # Initialize once; ModelSingleton handles idempotency
-            ModelSingleton().get_model("sglang-engine", None, None)
-        except Exception:
-            # Defer detailed errors to runtime path to avoid import-time crashes
-            pass
+    from mineru.backend.vlm.vlm_analyze import ModelSingleton
+
+
+    try:
+
+        if backend_env == "vlm-vllm-async-engine":
+            ModelSingleton().get_model("vllm-async-engine", None, None)
+    except Exception:
+        # Defer detailed errors to runtime path to avoid import-time crashes
+        pass
 
-_maybe_init_sglang_engine_in_main()
+_maybe_init_engine_in_main()
 
 class TimeoutError(Exception):
     pass
@@ -184,7 +186,7 @@ async def convert_to_markdown_dispatch(pdf_bytes, filename=None, **kwargs):
     Prefer using aio_do_parse to match official MinerU entrypoints.
     """
     backend_env = os.getenv("MINERU_BACKEND", "pipeline").lower()
-    server_url = os.getenv("MINERU_SGLANG_SERVER_URL")
+    server_url = os.getenv("MINERU_VLM_SERVER_URL") or os.getenv("MINERU_SGLANG_SERVER_URL")
     lang = kwargs.get("lang", "en")
     parse_method = kwargs.get("parse_method", "auto")
     formula_enable = kwargs.get("formula_enable", True)