首页/🤖 AI 应用/LangExtract - Google 结构化信息提取

LangExtract - Google 结构化信息提取

109 次浏览
2026/3/4
🤖 AI 应用

LangExtract 是 Google 开源的 Python 库,专注于使用大语言模型从非结构化文本中精确提取结构化数据。


LangExtract 预览
LangExtract 预览

核心功能


Schema 驱动提取

定义目标数据的 Schema(如 Pydantic 模型),LLM 按照精确格式输出结构化结果。


多模型支持

兼容 Gemini、GPT、Claude 等主流 LLM,灵活切换底层模型。


高精度模式

采用多轮验证和约束生成技术,确保提取结果符合 Schema 定义的类型和格式。


使用场景


  • 从合同文档中提取关键条款
  • 解析非结构化日志为结构化数据
  • 批量处理简历提取候选人信息
  • 从新闻文章中提取实体和关系

  • 优势与不足


    优势

  • Google 出品,质量有保障
  • 34K Star,社区活跃
  • 精确模式保证输出格式

  • 不足

  • 依赖 LLM API 调用
  • 大批量处理成本较高

  • 类似项目


  • Instructor:结构化 LLM 输出
  • Marvin:AI 函数和提取工具
  • 免责声明

    本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

    • 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
    • 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
    • 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
    • 因不当使用引发的版权或合规风险,由使用者自行承担。
    • 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。

    转载或引用本文内容,请保留原文链接并注明来源。

    评论

    加载中...