我正在使用langchain.Document_Loader加载pdf:
loader = DirectoryLoader( './files/', glob='*.pdf', loader_cls=PyPDFLoader)
个
然后拆分文档,创建嵌入,存储并加载它们:
docsearch = Chroma.from_documents(texts, embeddings, persist_directory=persist_directory)
...
docsearch = Chroma(persist_directory, embedding_function=embeddings )
retriever = docsearch.as_retriever( search_kwargs={"k": 5})
docs = retriever.get_relevant_documents( query )
len( docs)
我得到的答复是正确的,但我没有得到任何原始文档.