如何使用AWS Textract从S3存储桶中的扫描文档中提取文本

发表于 2019年6 月16日星期日上午 2:43:36

亚马逊使用Python SDK Boto3的新OCR服务快速入门指南

本文演示了如何使用AWS Textract从S3存储桶中的扫描文档中提取文本。

这超出了亚马逊的文档 – 他们只使用涉及一个图像的示例。此博客中包含使用AWS Python SDK Boto3的示例代码段，可帮助您快速入门。

定义

Amazon Textract是一种自动从扫描文档中提取文本和数据的服务。
Amazon Simple Storage Service（Amazon S3）是一种对象存储服务，可提供业界领先的可扩展性，数据可用性，安全性和性能。

码

闭幕

Textract是一款令人惊叹的OCR（光学字符识别）工具。通过自动执行手动数据输入的繁琐且容易出错的任务，它可以为您的团队节省大量的工时。

感谢阅读 – 请关注我在Medium上获取更多有趣的软件工程文章

附：我们正在招聘通过https://studios.panya.me/了解我们目前的职位空缺

资讯来源：由0x资讯编译自HACKERNOON。版权归作者所有，原文链接：https://hackernoon.com/how-to-use-aws-textract-to-extract-text-from-scanned-documents-in-s3-buckets-5f85e8ba0a37?source=collection_category—4——0———————–。未经许可，不得转载