即时将提单提取为 JSON/CSV 格式。

解析来自 Maersk、MSC 和 CMA CGM 的集装箱 ID、通知方和 HS 编码。直接推送至 CargoWise 或 Flexport。

查看 API 文档 ->
EXTRACTION_MONITOR v2.1.0
READY
Source_File.pdf
BILL OF LADING
MSC MEDITERRANEAN SHIPPING CO.
B/L Number
MSCU9872341-001
Shipper
ACME MANUFACTURING CO LTD
Container
MSCU 987234-1
Type 40HC Weight 28,459 KG
Consignee
GLOBAL IMPORTS INC
BOL_MSCU9872341.pdf
// Extracted BOL Data
{
  "bl_number": "MSCU9872341-001",
  "container_id": "MSCU9872341"  99.8%
  "container_valid": true,
  "type": "40HC",
  "weight_kg": 28459,
  "shipper": "ACME Manufacturing Co.",
  "consignee": "Global Imports Inc.",
  "port_load": "CNSHA",
  "port_discharge": "USLGB"
}
bl_number,container_id,type,weight_kg,shipper,consignee
MSCU9872341-001,MSCU9872341,40HC,28459,"ACME Manufacturing","Global Imports"
POST /api/v1/shipments
Authorization: Bearer ••••••••

{
  "system": "cargowise",
  "payload": { ... }
}

→ 201 Created
COMPATIBLE_CARRIERS
MAERSK MSC CMA CGM +40 more
LINE_ITEMS
01 Electronics 1,200 KG
02 Textiles 850 KG

行项目提取

自动检测货物清单、重量和封条号。

VALIDATION
MSCU 123456-7 VALID
Check Digit: OK · ISO 6346

ISO 6346 验证

我们根据 ISO 标准校验每个集装箱 ID 以防止错误。

INTEGRATIONS
CargoWise Magaya Flexport

TMS 集成

Webhooks 将数据直接推送到您的运营系统。

处理流程

工作原理

STAGE_01 // INGEST
UPLOAD_QUEUE 3 files
bol_maersk_001.pdf
scan_invoice_44.jpg
attachment_fwd.eml

多渠道采集

支持通过 API、电子邮件或 SFTP 上传原始文件。

STAGE_02 // EXTRACT
ocr_engine.log
99.8%
> Detecting tables... OK
> Validating IDs... OK
> Mapping schema... OK
✓ Extraction complete

OCR + 逻辑验证

将非结构化像素映射为结构化 JSON 模式。

STAGE_03 // SYNC
SAP
SAP S/4HANA
ERP Integration
Live
NS
NetSuite
Cloud ERP
Live

ERP 和 Webhook 推送

将清洁数据直接传输到您的运营系统。

模式目录

支持的文档类型

提单

ACCURACY: 98.5%
EXTRACTED_ENTITIES:
Shipper Consignee Container_ID Gross_Weight Port_Codes
Ocean BOL • House BOL • Sea Waybill
View Schema

商业发票

ACCURACY: 97.2%
EXTRACTED_ENTITIES:
Line_Items Unit_Price Incoterms Currency Total_Value
FOB • CIF • EXW • DDP
View Schema

装箱单

ACCURACY: 96.8%
EXTRACTED_ENTITIES:
Carton_No Dimensions Net_Weight HS_Code CBM
Full Container • LCL • Palletized
View Schema

航空运单

ACCURACY: 95.4%
EXTRACTED_ENTITIES:
MAWB_No HAWB_No Flight_Route Chargeable_Wt
IATA • e-AWB • Consolidated
View Schema

报关单

ACCURACY: 94.1%
EXTRACTED_ENTITIES:
HS_Code Duty_Rate Country_Origin CIF_Value
CBP 7501 • ISF • Entry Summary
View Schema

送货单 / 签收单

ACCURACY: 93.6%
EXTRACTED_ENTITIES:
Signature Timestamp Status Receiver_Name
ePOD • Signed • GPS Verified
View Schema
BENCHMARK_MATRIX

提取方法分析

不同文档处理方法的性能比较指标。

指标 手动输入 传统 OCR / 区域 PDF2TEXT Neural
手写备注
0%
失败
96%
布局差异
高成本
断行
布局无关
设置时间
0h
40h 每个模板
零样本
处理速度
5 min/doc
2 min/doc
<0.8s/doc
多语言支持
依赖员工
有限
40+ 种语言
错误率
2-5%
8-15%
<0.5%

基准在标准化提单数据集(n=10,000)上测量。传统 OCR 使用 ABBYY FlexiCapture 测试。神经模型:pdf2text-v3-logistics。

INTEGRATION_GUIDE

由开发者为开发者打造。

开箱即用的 Webhooks、重试和速率限制。提供 Python、Node 和 Go SDK。

install_and_run.sh
# 1. Install the SDK
npm install @pdf2text/sdk

# 2. Extract a document
const pdf2text = require('@pdf2text/sdk');

const data = await pdf2text.extract({
  file: './bol_maersk.pdf',
  mode: 'ocr_dense'
});

console.log(data.container_id); // "MSCU9872341"
# Extract document via REST API
curl -X POST https://pdf2text.ai/api/v1/documents/upload/ \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F "file=@./bol_maersk.pdf" \
  -F "mode=ocr_dense"

# Response
{
  "container_id": "MSCU9872341",
  "confidence": 0.998
}
# 1. Install the SDK
pip install pdf2text-sdk

# 2. Extract a document
from pdf2text import Client

client = Client(api_key="your_api_key")
data = client.extract(
    file="./bol_maersk.pdf",
    mode="ocr_dense"
)

print(data.container_id)  # "MSCU9872341"
受到以下公司工程团队的信赖:
Flexport project44 Convoy Shippo
ROI_SIMULATOR

计算您的节省

根据您的文档处理量估算成本节省。

VOLUME_INPUTS
100 50,000
$
$15 $50
m
2m 15m
PROJECTED_SAVINGS
$
每月
节省的小时数
年度节省
成本对比
手动输入 $
PDF2TEXT $

基于平均提取延迟 1.2 秒对比人工平均 300 秒。估算使用专业版定价(约 $0.15/文档)。

使用您的数据进行测试。

上传杂乱的 PDF、图片或扫描件。无需 API 密钥。

LIVE_DEMO_v2.0
> Uploading... OK
> OCR... OK
> Extracting Entities...

将 PDF 提单拖放至此

或点击浏览

或试用我们的示例:
> Extraction complete. 12 fields parsed.
Container IDMSCU9872341
Type40HC
Weight28,459 KG
ShipperACME Manufacturing Co.
SSL
24h auto-delete
Max 50MB
SYSTEM_FAQ

运营规格

用于安全审查和集成规划的技术详情。

数据是否会被保留?

不会。零保留政策。文档在内存中处理,webhook 传输完成后立即清除。传输过程采用 AES-256 加密。

查看安全政策

是否支持本地部署?

支持。可通过 Docker 容器部署于隔离环境。提供 Kubernetes helm charts。最低需要 8GB 内存,GPU 可选。

联系销售

如何集成?

REST API 配合 webhooks。提供 Python、Node.js、Go SDK。内置 SAP、Oracle、NetSuite 连接器。通过 Zapier 或直接 API 同步 ERP。

查看 API 文档

支持手写识别吗?

支持。神经网络模型基于 200 万+ 手写样本训练。英文草书识别准确率达 96%。支持批注、印章和边注。

查看准确率报告

支持自定义文档类型吗?

支持。可针对专有格式进行微调。提供 50+ 样本,我们将在 48 小时内训练专用提取模型。

申请定制模型

有正常运行时间保证吗?

企业版 SLA 保证 99.9% 正常运行。多区域故障转移(美东、欧西、亚太)。实时状态页面并记录故障历史。

查看状态页面