marqo-ai · farshidz · Oct 9, 2024 · Oct 7, 2024 · Oct 7, 2024 · Oct 8, 2024
diff --git a/Dockerfile b/Dockerfile
@@ -6,7 +6,7 @@ COPY vespa .
 RUN mvn clean package
 
 # Stage 2: Base image for Python setup
-FROM marqoai/marqo-base:30 as base_image
+FROM marqoai/marqo-base:33 as base_image
 
 # Allow mounting volume containing data and configs for vespa
 VOLUME /opt/vespa/var

diff --git a/requirements.dev.txt b/requirements.dev.txt
@@ -23,10 +23,10 @@ huggingface-hub==0.25.0
 more_itertools
 boto3==1.25.4
 botocore==1.28.4
-nltk==3.7
+nltk==3.9.1
 torch==1.12.1
 torchvision==0.13.1
-Pillow==9.3.0
+Pillow==10.4.0
 numpy==1.23.4
 validators==0.20.0
 sentence-transformers==2.2.2

diff --git a/src/marqo/s2_inference/processing/text.py b/src/marqo/s2_inference/processing/text.py
@@ -30,6 +30,12 @@ def _splitting_functions(split_by: str, language: str='english') -> FunctionType
  except LookupError:
  nltk.download("punkt")
 
+ # Punkt_tab needs to be downloaded after NLTK 3.8 and later
+ try:
+ nltk.data.find("tokenizers/punkt_tab")
+ except LookupError:
+ nltk.download("punkt_tab")
+
  MAPPING = {
  'character':list,
  'word': partial(word_tokenize, language=language),

diff --git a/src/marqo/version.py b/src/marqo/version.py
@@ -1,4 +1,4 @@
-__version__ = "2.12.1"
+__version__ = "2.12.2"
 
 def get_version() -> str:
  return f"{__version__}"