LlamaExtract

LlamaExtract LlamaExtract LlamaIndex

2024-01-01 1 分钟阅读

LlamaExtract是由LlamaIndex创建的一个API，旨在从非结构化文件中高效推断模式并提取数据。LlamaExtract直接与LlamaIndex集成。需要注意的是，LlamaExtract目前处于实验阶段，未来可能会有变化。

首先，登录并从https://cloud.llamaindex.ai获取一个API密钥。

然后安装LlamaExtract软件包：

pip install llama-extract

现在，你可以轻松地推断文件的模式并提取数据：

import nest_asyncio

nest_asyncio.apply()

from llama_extract import LlamaExtract

extractor = LlamaExtract( api_key=“llx-…”, # 也可以通过设置环境变量LLAMA_CLOUD_API_KEY来指定 num_workers=4, # 如果传递多个文件，将分解为num_workers个API调用 verbose=True, )

推断模式

schema = extractor.infer_schema( “my_schema”, ["./my_file1.pdf", “./my_file2.pdf”] )

results = extractor.extract(schema.id, ["./my_file1.pdf", “./my_file2.pdf”])

LlamaExtract的使用场景包括但不限于：

完整的文档和更多示例可以参考官方文档。