NevaMind-AI
diff --git a/‎example/client/chat.py‎
Lines changed: 66 additions & 3 deletions b/‎example/client/chat.py‎
Lines changed: 66 additions & 3 deletions
diff --git a/‎memu/__init__.py‎
Lines changed: 1 addition & 1 deletion b/‎memu/__init__.py‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎memu/sdk/javascript/examples/basic-usage.js‎
Lines changed: 0 additions & 33 deletions b/‎memu/sdk/javascript/examples/basic-usage.js‎
Lines changed: 0 additions & 33 deletions
diff --git a/‎memu/sdk/javascript/examples/response-usage.js‎
Lines changed: 103 additions & 0 deletions b/‎memu/sdk/javascript/examples/response-usage.js‎
Lines changed: 103 additions & 0 deletions
diff --git a/‎memu/sdk/javascript/examples/typescript-usage.ts‎
Lines changed: 47 additions & 0 deletions b/‎memu/sdk/javascript/examples/typescript-usage.ts‎
Lines changed: 47 additions & 0 deletions
diff --git a/‎memu/sdk/javascript/package.json‎
Lines changed: 1 addition & 1 deletion b/‎memu/sdk/javascript/package.json‎
Lines changed: 1 addition & 1 deletion
@@ -1,10 +1,11 @@
 import os
 import time
-
+from typing import ContextManager, Iterator
 from memu import MemuClient
+from memu.sdk.python.models import ChatResponse, ChatResponseStream
 
 
-def print_chat_response(response, message_num: int):
+def print_chat_response(response: ChatResponse, message_num: int):
     """Print chat response with detailed token usage."""
     print(f"\n🤖 Chat Response #{message_num}:")
     print(f"   {response.message}")
@@ -24,6 +25,40 @@ def print_chat_response(response, message_num: int):
         print(f"     - Retrieved Memory: {breakdown.retrieved_memory}")
 
 
+def print_chat_response_stream(response: ContextManager[Iterator[ChatResponseStream]], message_num: int):
+    print(f"\n🤖 Chat Response #{message_num} (Stream):")
+    print("   💬", end="", flush=True)
+
+    chat_token_usage = None
+
+    # Context manager version is safer for it ensures the .close() in the finally block is called
+    with response as response_iterator:
+        for chunk in response_iterator:
+            if chunk.error:
+                print(f"   ❌ Error: {chunk.error}")
+                break
+            if chunk.message:
+                print(f"{chunk.message}", end="", flush=True)
+            if chunk.chat_token_usage:
+                chat_token_usage = chunk.chat_token_usage
+            if chunk.stream_ended:
+                print()
+
+    if chat_token_usage:
+        print("\n📊 Token Usage:")
+        print(f"   Total Tokens: {chat_token_usage.total_tokens}")
+        print(f"   Prompt Tokens: {chat_token_usage.prompt_tokens}")
+        print(f"   Completion Tokens: {chat_token_usage.completion_tokens}")
+        
+        if chat_token_usage.prompt_tokens_breakdown:
+            breakdown = chat_token_usage.prompt_tokens_breakdown
+            print("   📈 Token Breakdown:")
+            print(f"     - Current Query: {breakdown.current_query}")
+            print(f"     - Short Term Context: {breakdown.short_term_context}")  
+            print(f"     - User Profile: {breakdown.user_profile}")
+            print(f"     - Retrieved Memory: {breakdown.retrieved_memory}")
+
+
 def main():
     """Main chat demonstration function."""
     print("🚀 MemU Chat API Demo")
@@ -73,7 +108,7 @@ def main():
     ]
 
     # Conduct the chat session
-    for i, example in enumerate(chat_examples, 1):
+    for i, example in enumerate(chat_examples[:3], 1):
         print(f"\n👤 User Message #{i}: {example['message']}")
         print(f"   Context: {example['description']}")
         print(f"   LLM Parameters: {example['kwargs']}")
@@ -99,6 +134,34 @@ def main():
         # Small delay between messages
         time.sleep(1)
 
+    # Conduct the chat session with stream
+    for i, example in enumerate(chat_examples[3:], 4):
+        print(f"\n👤 User Message #{i}: {example['message']}")
+        print(f"   Context: {example['description']}")
+        print(f"   LLM Parameters: {example['kwargs']}")
+        
+        try:
+            # Send chat message
+            response = memu_client.chat(
+                user_id=user_id,
+                user_name=user_name,
+                agent_id=agent_id,
+                agent_name=agent_name,
+                message=example['message'],
+                max_context_tokens=4000,
+                **example['kwargs'],
+                stream=True,
+            )
+            
+            # Print detailed response
+            print_chat_response_stream(response, i)
+            
+        except Exception as e:
+            print(f"   ❌ Chat error: {e}")
+            
+        # Small delay between messages
+        time.sleep(1)
+
     # Close the client
     memu_client.close()
 
 
@@ -6,7 +6,7 @@
 Simplified unified memory architecture with a single Memory Agent.
 """
 
-__version__ = "0.2.1"
+__version__ = "0.2.2"
 __author__ = "MemU Team"
 __email__ = "[email protected]"
 
 
@@ -145,39 +145,6 @@ export const basicExample = async () => {
       })
     })
 
-    console.log()
-
-    // Example 7: Chat with memory-enhanced conversation
-    console.log('💬 Starting memory-enhanced chat...')
-    const chatResponse = await client.chat({
-      agentId: 'assistant',
-      agentName: 'Assistant',
-      kwargs: {
-        temperature: 0.7,
-        maxTokens: 150,
-      },
-      message: 'What should I prepare for my next hiking trip?',
-      model: 'gpt-4o-mini', // Specify the chat model
-      system: 'You are a helpful hiking assistant with expertise in outdoor activities and safety.',
-      userId: 'user',
-      userName: 'Johnson',
-    })
-
-    console.log(`🤖 AI Response: ${chatResponse.message}`)
-    console.log('📊 Token Usage:')
-    console.log(`   Total Tokens: ${chatResponse.chatTokenUsage.totalTokens}`)
-    console.log(`   Prompt Tokens: ${chatResponse.chatTokenUsage.promptTokens}`)
-    console.log(`   Completion Tokens: ${chatResponse.chatTokenUsage.completionTokens}`)
-    
-    if (chatResponse.chatTokenUsage.promptTokensBreakdown) {
-      const breakdown = chatResponse.chatTokenUsage.promptTokensBreakdown
-      console.log('   Token Breakdown:')
-      console.log(`     - Current Query: ${breakdown.currentQuery || 0}`)
-      console.log(`     - Short Term Context: ${breakdown.shortTermContext || 0}`)
-      console.log(`     - User Profile: ${breakdown.userProfile || 0}`)
-      console.log(`     - Retrieved Memory: ${breakdown.retrievedMemory || 0}`)
-    }
-
     console.log('\n✨ Example completed successfully!')
   }
   catch (error) {
 
@@ -0,0 +1,103 @@
+/**
+ * Example usage of MemU SDK with streaming support (JavaScript)
+ */
+
+import { MemuClient } from '../dist/index.js'
+import { fileURLToPath } from 'url'
+import { dirname } from 'path'
+
+const __filename = fileURLToPath(import.meta.url)
+const __dirname = dirname(__filename)
+
+// Initialize the client
+const client = new MemuClient({
+  apiKey: 'your-api-key-here',
+  baseUrl: 'https://api.memu.so',
+})
+
+async function nonStreamingExample() {
+  console.log('=== Non-streaming Chat Example ===')
+  
+  try {
+    const request = {
+      userId: 'user123',
+      userName: 'John Doe',
+      agentId: 'agent456',
+      agentName: 'AI Assistant',
+      message: 'Hello, how are you today?',
+      system: 'You are a helpful assistant.',
+      model: 'gpt-4.1',
+      stream: false, // Explicit non-streaming
+    }
+
+    const response = await client.chat(request)
+    console.log('Response:', response.message)
+    console.log('Token usage:', response.chatTokenUsage)
+  } catch (error) {
+    console.error('Error:', error)
+  }
+}
+
+async function streamingExample() {
+  console.log('\n=== Streaming Chat Example ===')
+  
+  try {
+    const request = {
+      userId: 'user123',
+      userName: 'John Doe',
+      agentId: 'agent456',
+      agentName: 'AI Assistant',
+      message: 'Tell me a story about a brave knight.',
+      system: 'You are a creative storyteller.',
+      model: 'gpt-4.1',
+      stream: true, // Enable streaming
+    }
+
+    const streamResponse = await client.chat(request)
+    
+    let fullMessage = ''
+    
+    // Cast to AsyncGenerator for streaming response
+    for await (const chunk of streamResponse) {
+      if (chunk.error) {
+        console.error('Stream error:', chunk.error)
+        break
+      }
+      
+      if (chunk.message) {
+        process.stdout.write(chunk.message)
+        fullMessage += chunk.message
+      }
+      
+      if (chunk.streamEnded) {
+        console.log('\n\nStream ended.')
+        if (chunk.chatTokenUsage) {
+          console.log('Final token usage:', chunk.chatTokenUsage)
+        }
+        break
+      }
+    }
+    
+    console.log(`\nFull message received: ${fullMessage.length} characters`)
+  } catch (error) {
+    console.error('Stream error:', error)
+  }
+}
+
+async function main() {
+  // Run non-streaming example
+  await nonStreamingExample()
+  
+  // Wait a bit
+  await new Promise(resolve => setTimeout(resolve, 1000))
+  
+  // Run streaming example
+  await streamingExample()
+}
+
+// Run the examples if this file is executed directly
+if (import.meta.url === `file://${process.argv[1]}`) {
+  main().catch(console.error)
+}
+
+export { nonStreamingExample, streamingExample }
@@ -7,6 +7,7 @@
 
 import type {
   ChatResponse,
+  ChatResponseStream,
   DefaultCategoriesResponse,
   MemorizeResponse,
   MemorizeTaskStatusResponse,
@@ -231,6 +232,52 @@ export const typescriptExample = async (): Promise<void> => {
     }
 
     console.log('\n✨ TypeScript example completed successfully!')
+
+    // Example 7: Streaming chat example
+    console.log('\n🌊 Starting streaming chat example...')
+    const streamResponse = await client.chat({
+      agentId: 'ml_tutor',
+      agentName: 'ML Tutor',
+      kwargs: {
+        maxTokens: 300,
+        temperature: 0.7,
+      },
+      message: 'Tell me a detailed explanation about neural networks and how they work.',
+      model: 'gpt-3.5-turbo',
+      stream: true, // Enable streaming
+      system: 'You are an expert machine learning tutor. Provide detailed explanations.',
+      userId: 'student_456',
+      userName: 'Bob Smith',
+    }) as AsyncGenerator<ChatResponseStream, void, unknown>
+
+    console.log('🤖 Streaming AI Response:')
+    let fullStreamMessage = ''
+
+    for await (const chunk of streamResponse) {
+      if (chunk.error) {
+        console.error(`❌ Stream error: ${chunk.error}`)
+        break
+      }
+
+      if (chunk.message) {
+        process.stdout.write(chunk.message)
+        fullStreamMessage += chunk.message
+      }
+
+      if (chunk.streamEnded) {
+        console.log('\n\n🏁 Stream ended.')
+        if (chunk.chatTokenUsage) {
+          console.log('📊 Final Token Usage:')
+          console.log(`   Total Tokens: ${chunk.chatTokenUsage.totalTokens}`)
+          console.log(`   Prompt Tokens: ${chunk.chatTokenUsage.promptTokens}`)
+          console.log(`   Completion Tokens: ${chunk.chatTokenUsage.completionTokens}`)
+        }
+        break
+      }
+    }
+
+    console.log(`✅ Full streamed message received: ${fullStreamMessage.length} characters`)
+    console.log('\n✨ TypeScript example with streaming completed successfully!')
   }
   catch (error) {
     console.error('❌ Error occurred:')
 
@@ -1,7 +1,7 @@
 {
   "name": "memu-js",
   "type": "module",
-  "version": "0.2.1",
+  "version": "0.2.2",
   "packageManager": "[email protected]",
   "description": "MemU JavaScript SDK for interacting with MemU API services",
   "author": "MemU Team",
Original file line number	Diff line number	Diff line change
`@@ -1,7 +1,7 @@`
`1`	`1`	`{`
`2`	`2`	`"name": "memu-js",`
`3`	`3`	`"type": "module",`
`4`		`- "version": "0.2.1",`
	`4`	`+ "version": "0.2.2",`
`5`	`5`	`"packageManager": "[email protected]",`
`6`	`6`	`"description": "MemU JavaScript SDK for interacting with MemU API services",`
`7`	`7`	`"author": "MemU Team",`