Baidu đã ra mắt phiên bản 3.5 của công cụ OCR mã nguồn mở của mình, PaddleOCR, giới thiệu những khả năng mới đáng kể. Bản cập nhật bao gồm việc phát hành PaddleOCR.js, một SDK suy luận trên trình duyệt cho phép PP-OCRv5 chạy trực tiếp trong các trình duyệt với tăng tốc WebGPU và Wasm, đảm bảo quyền riêng tư dữ liệu bằng cách giữ dữ liệu trong trình duyệt. Ngoài ra, PaddleOCR hiện hỗ trợ chuyển đổi tài liệu Word, Excel và PPT sang định dạng Markdown chỉ với một cú nhấp chuột. Bản cập nhật cũng tích hợp backend Transformers, cung cấp quyền truy cập vào 20 mô hình chính thông qua Hugging Face và cho phép chuyển đổi liền mạch giữa các chế độ đồ thị tĩnh, đồ thị động và Transformers của PaddlePaddle. Hơn nữa, kết quả từ loạt PaddleOCR-VL, PP-StructureV3 và PP-DocTranslation hiện có thể được xuất ra định dạng DOCX, nâng cao khả năng xử lý tài liệu.