faiss learn 学习文档

本仓部分资料是直接搬运过来部分材料是自己整理

https://github.com/facebookresearch/faiss/wiki

faiss版本

faiss-1.5.0

其他资料链接

百万级别向量检索 Indexing 1M vectors

当数据集中的向量个数在百万级别，暴力精确搜索的时间开销太大，比较好的选择是使用IndexIVFFlat索引类型。IndexIVFFlat也会返回精确的距离值，但返回的结果并不是完全正确的，可能会漏掉某个结果。 facebook官方通过一些实验，通过不同的检索类型在1百万向量的数据集上做检索，其中主要关注速度和精度的变化。实验结果展示在faiss wiki中。实验中使用特征提取器提取1百万张图片的特征表达，对每张图片提取4096维特征向量，然后使用PCA将4096维向量降维到256维。

faiss wiki:https://github.com/facebookresearch/faiss/wiki/Indexing-1M-vectors

1G级别向量检索 Indexing 1G vectors

对这一量级的数据集，必须使用向量的压缩编码形式，主要的方法有乘积量化（PQ）。使用Bigann和Deep1B分别进行实验。实验结果在faiss wiki。 faiss wiki:https://github.com/facebookresearch/faiss/wiki/Indexing-1G-vectors

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
pic		pic
1-初步学习.md		1-初步学习.md
10-ivfpq内存计算.md		10-ivfpq内存计算.md
11.并发情况.md		11.并发情况.md
2-基础算法.md		2-基础算法.md
3- index类型.md		3- index类型.md
3.1-faiss索引列表.md		3.1-faiss索引列表.md
4-faiss文件io.md		4-faiss文件io.md
5-数据预处理.md		5-数据预处理.md
6-ivfpq文件格式解析.md		6-ivfpq文件格式解析.md
7-ivfpq文件加载.md		7-ivfpq文件加载.md
8-gpu基本数据格式.md		8-gpu基本数据格式.md
9-GpuIVFPQ.md		9-GpuIVFPQ.md
ReadMe.md		ReadMe.md
faq.md		faq.md
向量index简介.md		向量index简介.md
安装 install.md		安装 install.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

faiss learn 学习文档

faiss版本

其他资料链接

LSH(Local Sensitive Hashing)

PQ论文

IVFPQ python 实现：

高纬度向量搜索性能横向比对

百万级别向量检索 Indexing 1M vectors

1G级别向量检索 Indexing 1G vectors

About

Releases

Packages

coolhok/faiss-learning

Folders and files

Latest commit

History

Repository files navigation

faiss learn 学习文档

faiss版本

其他资料链接

LSH(Local Sensitive Hashing)

PQ论文

IVFPQ python 实现：

高纬度向量搜索性能横向比对

百万级别向量检索 Indexing 1M vectors

1G级别向量检索 Indexing 1G vectors

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages