-
-
Notifications
You must be signed in to change notification settings - Fork 2.4k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[Other] 关于缓存的建议(命中率) #1691
Comments
你好,我猜测可能是上下文滚动窗口导致无法命中前缀匹配。我需要再研究一下。 |
可以详细描述下你的使用习惯吗?越详细越好? |
我的使用习惯一般来说是: |
这确实是一个很好的习惯👍。我想问下你会在消息中附带代码文件吗?一般情况下你的一个话题的会有多少消息?以及你的设置中是否修改过上下文消息限制,如果修改了的话设置是多少?这些应该可以让我快速定位并复现你的问题。 |
|
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
首先感谢作者开发了优质的软件!🙏
最近我再查看我的deepseek的api记录时发现了一个比较神奇的问题:
注意观察:最后一点天和倒数第三天形成了鲜明的对比
这是详细的数据:
only ChatBox
only OpenWebUI
问题就出在这里——缓存命中率天差地别
deepseek的缓存:https://api-docs.deepseek.com/zh-cn/news/news0802
实际情况是,我在学校使用openwebui,在家使用chatbox
所以现在的情况是:在差不多的使用量下,chatbox 完全没有 命中缓存
我不太清楚时因为deepseek的缓存机制不通还是其他的问题?(使用Chatbox我没有频繁的切换话题)
有可能问题出在这里:
注意,只有当两个请求的前缀内容相同时(从第 0 个 token 开始相同),才算重复。中间开始的重复不能被缓存命中。
- deepseek文档希望开发者看到了可以解答一下QAQ
The text was updated successfully, but these errors were encountered: