Baidu đã ra mắt phiên bản 3.5 của công cụ OCR mã nguồn mở của mình, PaddleOCR, giới thiệu những khả năng mới đáng kể. Bản cập nhật bao gồm việc phát hành PaddleOCR.js, một SDK suy luận trên trình duyệt cho phép PP-OCRv5 chạy trực tiếp trong các trình duyệt với tăng tốc WebGPU và Wasm, đảm bảo quyền riêng tư dữ liệu bằng cách giữ dữ liệu trong trình duyệt. Ngoài ra, PaddleOCR hiện hỗ trợ chuyển đổi tài liệu Word, Excel và PPT sang định dạng Markdown chỉ với một cú nhấp chuột.
Bản cập nhật cũng tích hợp backend Transformers, cung cấp quyền truy cập vào 20 mô hình chính thông qua Hugging Face và cho phép chuyển đổi liền mạch giữa các chế độ đồ thị tĩnh, đồ thị động và Transformers của PaddlePaddle. Hơn nữa, kết quả từ loạt PaddleOCR-VL, PP-StructureV3 và PP-DocTranslation hiện có thể được xuất ra định dạng DOCX, nâng cao khả năng xử lý tài liệu.
PaddleOCR 3.5 của Baidu ra mắt với các tính năng trình duyệt và tài liệu được cải tiến
Tuyên bố miễn trừ trách nhiệm: Nội dung được cung cấp trên Phemex News chỉ nhằm mục đích cung cấp thông tin.Chúng tôi không đảm bảo chất lượng, độ chính xác hoặc tính đầy đủ của thông tin có nguồn từ các bài viết của bên thứ ba.Nội dung trên trang này không cấu thành lời khuyên về tài chính hoặc đầu tư.Chúng tôi đặc biệt khuyến khích bạn tự tiến hành nghiên cứu và tham khảo ý kiến của cố vấn tài chính đủ tiêu chuẩn trước khi đưa ra bất kỳ quyết định đầu tư nào.
