doc_processer/Dockerfile at ef98f3752593db63dad07b19b3fa444c12a465ed

Files

liuyuanchuang ef98f37525 feat: aggressive image optimization for PPDocLayoutV3 only

- Remove doclayout-yolo (~4.8GB, torch/torchvision/triton)
- Replace opencv-python with opencv-python-headless (~200MB)
- Strip debug symbols from .so files (~300-800MB)
- Remove paddle C++ headers (~22MB)
- Use cuda:base instead of runtime (~3GB savings)
- Simplify dependencies: remove doc-parser extras
- Clean venv aggressively: no pip, setuptools, include/, share/

Expected size reduction:
  Before: 17GB
  After:  ~3GB (82% reduction)

Breakdown:
  - CUDA base: 0.4GB
  - Paddle: 0.7GB
  - PaddleOCR: 0.8GB
  - OpenCV-headless: 0.2GB
  - Other deps: 0.6GB
  Total: ~2.7-3GB

Co-Authored-By: Claude Haiku 4.5 <noreply@anthropic.com>

2026-03-10 11:33:50 +08:00

4.3 KiB

Raw Blame History

View Raw

4.3 KiB Raw Blame History

4.3 KiB

Raw Blame History