Extrayez les connaissements en JSON/CSV instantanément.

Analyse les identifiants de conteneurs, parties à notifier et codes HS de Maersk, MSC et CMA CGM. Envoyez directement vers CargoWise ou Flexport.

Voir la documentation API ->
EXTRACTION_MONITOR v2.1.0
READY
Source_File.pdf
BILL OF LADING
MSC MEDITERRANEAN SHIPPING CO.
B/L Number
MSCU9872341-001
Shipper
ACME MANUFACTURING CO LTD
Container
MSCU 987234-1
Type 40HC Weight 28,459 KG
Consignee
GLOBAL IMPORTS INC
BOL_MSCU9872341.pdf
// Extracted BOL Data
{
  "bl_number": "MSCU9872341-001",
  "container_id": "MSCU9872341"  99.8%
  "container_valid": true,
  "type": "40HC",
  "weight_kg": 28459,
  "shipper": "ACME Manufacturing Co.",
  "consignee": "Global Imports Inc.",
  "port_load": "CNSHA",
  "port_discharge": "USLGB"
}
bl_number,container_id,type,weight_kg,shipper,consignee
MSCU9872341-001,MSCU9872341,40HC,28459,"ACME Manufacturing","Global Imports"
POST /api/v1/shipments
Authorization: Bearer ••••••••

{
  "system": "cargowise",
  "payload": { ... }
}

→ 201 Created
COMPATIBLE_CARRIERS
MAERSK MSC CMA CGM +40 more
LINE_ITEMS
01 Electronics 1,200 KG
02 Textiles 850 KG

Extraction ligne par ligne

Détecte automatiquement les listes de marchandises, poids et numéros de scellés.

VALIDATION
MSCU 123456-7 VALID
Check Digit: OK · ISO 6346

Validation ISO 6346

Nous vérifions chaque identifiant de conteneur par rapport aux normes ISO pour éviter les erreurs.

INTEGRATIONS
CargoWise Magaya Flexport

Intégration TMS

Les webhooks envoient les données directement à votre système d'exploitation.

PIPELINE_TRAITEMENT

Comment ça marche

STAGE_01 // INGEST
UPLOAD_QUEUE 3 files
bol_maersk_001.pdf
scan_invoice_44.jpg
attachment_fwd.eml

Capture multicanal

Accepte les fichiers bruts via API, e-mail ou téléchargement SFTP.

STAGE_02 // EXTRACT
ocr_engine.log
99.8%
> Detecting tables... OK
> Validating IDs... OK
> Mapping schema... OK
✓ Extraction complete

OCR + Validation logique

Convertit les pixels non structurés en schémas JSON structurés.

STAGE_03 // SYNC
SAP
SAP S/4HANA
ERP Integration
Live
NS
NetSuite
Cloud ERP
Live

Envoi ERP et Webhook

Fournit des données propres directement à votre système d'exploitation.

CATALOGUE_DE_SCHEMAS

Types de documents pris en charge

Connaissement

ACCURACY: 98.5%
EXTRACTED_ENTITIES:
Shipper Consignee Container_ID Gross_Weight Port_Codes
Ocean BOL • House BOL • Sea Waybill
View Schema

Facture commerciale

ACCURACY: 97.2%
EXTRACTED_ENTITIES:
Line_Items Unit_Price Incoterms Currency Total_Value
FOB • CIF • EXW • DDP
View Schema

Liste de colisage

ACCURACY: 96.8%
EXTRACTED_ENTITIES:
Carton_No Dimensions Net_Weight HS_Code CBM
Full Container • LCL • Palletized
View Schema

Lettre de transport aérien

ACCURACY: 95.4%
EXTRACTED_ENTITIES:
MAWB_No HAWB_No Flight_Route Chargeable_Wt
IATA • e-AWB • Consolidated
View Schema

Déclaration en douane

ACCURACY: 94.1%
EXTRACTED_ENTITIES:
HS_Code Duty_Rate Country_Origin CIF_Value
CBP 7501 • ISF • Entry Summary
View Schema

Bon de livraison / Preuve de livraison

ACCURACY: 93.6%
EXTRACTED_ENTITIES:
Signature Timestamp Status Receiver_Name
ePOD • Signed • GPS Verified
View Schema
BENCHMARK_MATRIX

Analyse des méthodes d'extraction

Métriques de performance comparatives pour les différentes approches de traitement de documents.

Métrique Saisie manuelle OCR traditionnel / Zonal PDF2TEXT Neural
Notes manuscrites
0%
Échec
96%
Variation de mise en page
Coût élevé
Casse
Indépendant de la mise en page
Temps de configuration
0h
40h par modèle
Zero-shot
Vitesse de traitement
5 min/doc
2 min/doc
<0.8s/doc
Support multilingue
Dépend du personnel
Limité
40+ langues
Taux d'erreur
2-5%
8-15%
<0.5%

Benchmarks mesurés sur un ensemble de données BOL standardisé (n=10 000). OCR traditionnel testé avec ABBYY FlexiCapture. Modèle neuronal : pdf2text-v3-logistics.

INTEGRATION_GUIDE

Conçu par des développeurs, pour des développeurs.

Webhooks, nouvelles tentatives et limitation de débit gérés nativement. SDK disponibles pour Python, Node et Go.

install_and_run.sh
# 1. Install the SDK
npm install @pdf2text/sdk

# 2. Extract a document
const pdf2text = require('@pdf2text/sdk');

const data = await pdf2text.extract({
  file: './bol_maersk.pdf',
  mode: 'ocr_dense'
});

console.log(data.container_id); // "MSCU9872341"
# Extract document via REST API
curl -X POST https://pdf2text.ai/api/v1/documents/upload/ \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F "file=@./bol_maersk.pdf" \
  -F "mode=ocr_dense"

# Response
{
  "container_id": "MSCU9872341",
  "confidence": 0.998
}
# 1. Install the SDK
pip install pdf2text-sdk

# 2. Extract a document
from pdf2text import Client

client = Client(api_key="your_api_key")
data = client.extract(
    file="./bol_maersk.pdf",
    mode="ocr_dense"
)

print(data.container_id)  # "MSCU9872341"
Adopté par les équipes techniques de :
Flexport project44 Convoy Shippo
ROI_SIMULATOR

Calculez vos économies

Estimez la réduction des coûts en fonction de votre volume de traitement de documents.

VOLUME_INPUTS
100 50,000
$
$15 $50
m
2m 15m
PROJECTED_SAVINGS
$
par mois
Heures économisées
Économies annuelles
Comparaison des coûts
Saisie manuelle $
PDF2TEXT $

Basé sur une latence d'extraction moyenne de 1,2s contre 300s pour un humain. L'estimation utilise le tarif du plan Pro (~0,15$/doc).

Testez avec vos propres données.

Téléchargez un PDF mal formaté, une image ou un scan. Aucune clé API requise.

LIVE_DEMO_v2.0
> Uploading... OK
> OCR... OK
> Extracting Entities...

Déposez votre connaissement PDF ici

ou cliquez pour parcourir

Ou essayez un des nôtres :
> Extraction complete. 12 fields parsed.
Container IDMSCU9872341
Type40HC
Weight28,459 KG
ShipperACME Manufacturing Co.
SSL
24h auto-delete
Max 50MB
SYSTEM_FAQ

Spécifications opérationnelles

Détails techniques pour l'examen de sécurité et la planification des intégrations.

Les données sont-elles conservées ?

Non. Politique de rétention zéro. Les documents sont traités en mémoire vive et supprimés immédiatement après la livraison du webhook. Chiffrement AES-256 en transit.

Voir la politique de sécurité

Disponible sur site ?

Oui. Déploiement par conteneur Docker pour les environnements isolés. Charts Kubernetes Helm disponibles. Minimum 8 Go de RAM, GPU optionnel.

Contacter les ventes

Comment intégrer ?

API REST avec webhooks. SDK pour Python, Node.js, Go. Connecteurs prêts à l'emploi pour SAP, Oracle, NetSuite. Synchronisation ERP via Zapier ou API directe.

Voir la documentation API

Support de l'écriture manuscrite ?

Oui. Modèle neuronal entraîné sur plus de 2 millions d'échantillons manuscrits. Précision de 96% sur l'anglais cursif. Supporte les annotations, tampons et notes en marge.

Voir le rapport de précision

Types de documents personnalisés ?

Oui. Ajustement fin disponible pour les formats propriétaires. Fournissez 50+ échantillons et nous entraînons un modèle d'extraction spécialisé en 48 heures.

Demander un modèle personnalisé

Garantie de disponibilité ?

SLA de 99,9% sur les plans Enterprise. Basculement multi-régions (US-Est, UE-Ouest, APAC). Page de statut en temps réel avec historique des incidents.

Voir la page de statut