aigc-apps · Ceceliachenen · Jan 7, 2025 · Jan 8, 2025 · Jan 8, 2025 · Jan 8, 2025
diff --git a/src/pai_rag/app/api/query.py b/src/pai_rag/app/api/query.py
@@ -187,10 +187,7 @@ async def upload_data(
         for file in files:
             fn = file.filename
             data = await file.read()
-            file_hash = hashlib.md5(data).hexdigest()
-            tmp_file_dir = os.path.join(
-                tmpdir, f"{COMMON_FILE_PATH_FODER_NAME}/{file_hash}"
-            )
+            tmp_file_dir = os.path.join(tmpdir, f"{COMMON_FILE_PATH_FODER_NAME}")
             os.makedirs(tmp_file_dir, exist_ok=True)
             save_file = os.path.join(tmp_file_dir, fn)
 

diff --git a/src/pai_rag/app/api/v1/chat.py b/src/pai_rag/app/api/v1/chat.py
@@ -2,7 +2,6 @@
 from typing import Any, List
 from fastapi import APIRouter, Body, BackgroundTasks, UploadFile, Form
 import uuid
-import hashlib
 import os
 import tempfile
 import shutil
@@ -174,10 +173,7 @@ async def upload_data(
         for file in files:
             fn = file.filename
             data = await file.read()
-            file_hash = hashlib.md5(data).hexdigest()
-            tmp_file_dir = os.path.join(
-                tmpdir, f"{COMMON_FILE_PATH_FODER_NAME}/{file_hash}"
-            )
+            tmp_file_dir = os.path.join(tmpdir, f"{COMMON_FILE_PATH_FODER_NAME}")
             os.makedirs(tmp_file_dir, exist_ok=True)
             save_file = os.path.join(tmp_file_dir, fn)
 

diff --git a/src/pai_rag/integrations/readers/pai_markdown_reader.py b/src/pai_rag/integrations/readers/pai_markdown_reader.py
@@ -37,15 +37,18 @@ def __init__(
             f"PaiMarkdownReader created with enable_table_summary : {self.enable_table_summary}"
         )
 
-    def replace_image_paths(self, markdown_name: str, content: str):
+    def replace_image_paths(self, markdown_dir: str, markdown_name: str, content: str):
         markdown_image_matches = MARKDOWN_IMAGE_PATTERN.finditer(content)
         html_image_matches = HTML_IMAGE_PATTERN.finditer(content)
         for match in markdown_image_matches:
             full_match = match.group(0)  # 整个匹配
             local_url = match.group(1)  # 捕获的URL
+            image_name = os.path.basename(local_url)
+
+            local_path = os.path.join(markdown_dir, image_name)
 
             if self._oss_cache:
-                oss_url = self._transform_local_to_oss(markdown_name, local_url)
+                oss_url = self._transform_local_to_oss(markdown_name, local_path)
                 if oss_url:
                     content = content.replace(local_url, oss_url)
                 else:
@@ -55,9 +58,12 @@ def replace_image_paths(self, markdown_name: str, content: str):
         for match in html_image_matches:
             full_match = match.group(0)  # 整个匹配
             local_url = match.group(1)  # 捕获的URL
+            image_name = os.path.basename(local_url)
+
+            local_path = os.path.join(markdown_dir, image_name)
 
             if self._oss_cache:
-                oss_url = self._transform_local_to_oss(markdown_name, local_url)
+                oss_url = self._transform_local_to_oss(markdown_name, local_path)
                 if oss_url:
                     content = content.replace(local_url, oss_url)
                 else:
@@ -78,6 +84,7 @@ def _transform_local_to_oss(self, markdown_name: str, local_url: str):
     def parse_markdown(self, markdown_path):
         markdown_name = os.path.basename(markdown_path).split(".")[0]
         markdown_name = markdown_name.replace(" ", "_")
+        markdown_dir = os.path.dirname(markdown_path)
         text = ""
         pre_line = ""
         with open(markdown_path) as fp:
@@ -108,7 +115,7 @@ def parse_markdown(self, markdown_path):
                     line = fp.readline()
 
         text += pre_line
-        md_content = self.replace_image_paths(markdown_name, text)
+        md_content = self.replace_image_paths(markdown_dir, markdown_name, text)
         return md_content
 
     def load_data(