File PDF quá lớn để gửi email? 5 chiến lược nén hiệu quả
Tại sao file PDF của bạn có thể lớn hơn mức cần thiết
Hầu hết các máy chủ email đều giới hạn dung lượng tệp đính kèm từ 10 MB đến 25 MB. Gmail cho phép bạn 25 MB, Outlook "kẹt sỉ" hơn một chút với 20 MB, và các máy chủ email của công ty có thể là "sát thủ" thực sự – một số phòng IT áp đặt giới hạn cứng 10 MB. Ai trong chúng ta cũng từng trải qua: bạn nhấn 'gửi' một tệp quan trọng chỉ để nhận lại thông báo lỗi 'kích thước tin nhắn vượt quá giới hạn' đáng sợ đó. Sự bực bội là có thật. Thủ phạm gần như luôn là một trong ba điều sau. Đó có thể là hình ảnh độ phân giải cao. Có thể là toàn bộ phông chữ được nhúng vào khi chỉ cần vài chữ cái. Hoặc đó có thể là một bản scan được lưu với cài đặt lười biếng, không nén. Một cuốn brochure 40 trang được xuất thẳng từ InDesign với chất lượng in có thể dễ dàng phình to lên tới 80 MB. Cùng một tài liệu đó, khi được chuẩn bị đúng cách để xem trên màn hình, đáng lẽ phải dưới 5 MB. Trước khi bạn có thể khắc phục vấn đề, bạn phải chẩn đoán nó. Trên máy Mac, bạn có thể nhanh chóng kiểm tra bằng cách mở PDF trong Preview, vào File > Export as PDF, và xem kích thước tệp ước tính. Trong Adobe Acrobat, bảng Document Properties (Ctrl+D / Cmd+D) là một khởi đầu, nhưng sức mạnh thực sự nằm ở công cụ Preflight trong Tools > Print Production. Để có phân tích đầy đủ, các ứng dụng máy tính miễn phí như PDF Analyzer sẽ cho bạn thấy chính xác bao nhiêu byte đang bị chiếm bởi hình ảnh, phông chữ và dữ liệu khác. Việc biết vấn đề của bạn là một bức ảnh 15 MB so với một bộ sưu tập phông chữ cồng kềnh sẽ cho bạn biết chính xác chiến lược nào nên thử trước.
Chiến lược 1: Giảm độ phân giải hình ảnh và nén lại
Hình ảnh là nguyên nhân số một khiến các tệp PDF bị "phình to". Một bức ảnh được scan ở 600 DPI là quá mức cần thiết cho việc đọc trên màn hình. Đối với màn hình, 150 DPI là đủ, trong khi 300 DPI là tiêu chuẩn cho in ấn. Nếu PDF của bạn có ảnh 600 DPI, việc giảm mẫu (downsample) chúng xuống 150 DPI có thể cắt giảm kích thước dữ liệu hình ảnh tới khoảng 90%. Nếu bạn có Adobe Acrobat Pro, hãy vào Tools > Compress PDF và chọn Advanced Optimization. Trong bảng Images, đặt cả Hình ảnh màu và Hình ảnh thang độ xám thành Bicubic Downsampling ở 150 PPI cho các hình ảnh trên 225 PPI. Sau đó, thay đổi nén sang JPEG và đặt chất lượng là Medium (giá trị từ 45 đến 55 thường hoạt động tốt). Đối với hình ảnh đơn sắc như văn bản được quét hoặc line art, hãy sử dụng nén JBIG2; nó hiệu quả hơn nhiều so với tiêu chuẩn CCITT Group 4 cũ cho hầu hết các tài liệu. Không có Acrobat Pro ư? Công cụ PDF Compressor của CocoConvert tự động hóa toàn bộ quá trình này. Chỉ cần tải tệp của bạn lên, chọn cài đặt nén 'Screen' hoặc 'Web' đã định sẵn, và công cụ sẽ giảm mẫu hình ảnh xuống 150 DPI và áp dụng nén JPEG thông minh. Một cuốn brochure nặng ảnh 30 MB thường co lại còn khoảng 2–5 MB. Một lưu ý nhỏ: CocoConvert đủ thông minh để bỏ qua các tác phẩm nghệ thuật vector như logo và biểu đồ. Vì chúng không hưởng lợi từ loại nén này, công cụ sẽ không biến chúng thành raster một cách không cần thiết.
Chiến lược 2: Làm phẳng độ trong suốt và loại bỏ các lớp không cần thiết
Hiệu ứng đổ bóng mượt mà hay chuyển màu trong thiết kế của bạn? Nó có một chi phí ẩn về kích thước tệp. Các hiệu ứng trong suốt yêu cầu trình xem PDF phải làm thêm việc, nhưng tệ hơn, một số quy trình xuất tệp nhúng cả đối tượng trong suốt và bản xem trước đã làm phẳng, về cơ bản là nhân đôi dữ liệu cho các yếu tố đó. Đây là một nguồn gây "phình to" âm thầm nhưng đáng kể. Nếu bạn đang làm việc trong Adobe Illustrator hoặc InDesign, bạn có thể khắc phục điều này ngay từ nguồn. Khi bạn xuất tệp, hãy bật tùy chọn 'Flatten Transparency' (tìm thấy trong Advanced trong hộp thoại xuất PDF). Điều này có thể cắt giảm 10–30% kích thước tệp của một tài liệu nặng về thiết kế. Cài đặt High Resolution là lựa chọn tốt nhất nếu tệp có thể được in, trong khi Medium Resolution là ổn cho email. Các tệp PDF có nhiều lớp, thường từ CAD hoặc Visio, cũng mang thêm trọng lượng. Những lớp này vô hình đối với hầu hết người đọc nhưng vẫn chiếm không gian. Bạn có thể gộp chúng trong Acrobat Pro bằng cách vào View > Show/Hide > Navigation Panes > Layers. Chọn các lớp, sau đó sử dụng menu Options để Merge Layers và lưu nó dưới dạng một tệp mới. CocoConvert không có tính năng làm phẳng lớp chuyên dụng, vì vậy nếu kích thước tệp của bạn là do độ trong suốt phức tạp hoặc các lớp kỹ thuật, công cụ tốt nhất của bạn là Acrobat Pro hoặc Ghostscript – "ông trùm" mã nguồn mở. Một lệnh Ghostscript đơn giản sử dụng cờ '-dFlattenTransparency' sẽ hoàn thành công việc một cách đáng tin cậy và miễn phí.
Chiến lược 3: Nhúng một phần hoặc loại bỏ phông chữ đã nhúng
Phông chữ có thể nặng một cách đáng ngạc nhiên, thêm vào từ vài kilobyte đến vài megabyte. Vấn đề là việc nhúng toàn bộ phông chữ, nó nhét mọi ký tự (glyph) từ một kiểu chữ—tất cả hơn 65.000 ký tự trong một phông Unicode lớn—vào tệp của bạn, ngay cả khi bạn chỉ sử dụng các chữ cái từ A đến Z. Giải pháp là nhúng một phần phông chữ (font subsetting). Nó chỉ nhúng các ký tự bạn thực sự đã sử dụng, và đối với các tài liệu đã hoàn thiện, đây gần như luôn là động thái đúng đắn. Trong InDesign, bạn có thể buộc hành vi này trong Advanced > Fonts trong hộp thoại xuất PDF. Chỉ cần đặt 'Subset fonts when percent of characters used is less than' thành 100%. Trong Microsoft Word, đường dẫn là File > Options > Save > Embed fonts in the file; hãy đảm bảo 'Embed only the characters used in the document' được chọn, cùng với 'Do not embed common system fonts'. Nếu PDF đã được tạo, PDF Optimizer của Acrobat Pro (File > Save As Other > Optimized PDF) cho phép bạn bỏ nhúng phông chữ từ bảng Fonts của nó. Đây là một động thái mạnh tay, rủi ro. Nó chỉ hoạt động nếu người nhận đã cài đặt chính xác các phông chữ đó. Chỉ nên thử điều này đối với các tài liệu sử dụng phông chữ cực kỳ phổ biến như Arial hoặc Times New Roman. Đối với bất kỳ thứ gì có phông chữ tùy chỉnh hoặc có bản quyền, hãy gắn bó với việc nhúng một phần đúng cách. Hãy xem xét điều này: một bản tóm tắt pháp lý 12 trang sử dụng phông chữ serif tùy chỉnh có dung lượng 9.8 MB. Nó chỉ sử dụng 340 ký tự (glyph) trong số hơn 8.000 có trong tệp phông chữ. Sau khi nhúng một phần phông chữ, tệp PDF đã giảm xuống 1.2 MB mà không có sự khác biệt về mặt hình ảnh.
Chiến lược 4: Chuyển đổi sang định dạng nén trước, sau đó trở lại PDF
Nghe có vẻ phản trực giác, nhưng đôi khi cách tốt nhất để "dọn dẹp" một tệp PDF là xây dựng lại nó hoàn toàn. Cách tiếp cận "mạnh tay" này loại bỏ tất cả những "rác rưởi" tích tụ từ một tệp đã được chỉnh sửa nhiều lần: tài nguyên trùng lặp, đối tượng mồ côi, lịch sử sửa đổi và siêu dữ liệu ẩn. Phiên bản đơn giản nhất của điều này là mẹo 'in ra PDF'. Trên Windows, mở tệp của bạn, nhấn Ctrl+P, và chọn 'Microsoft Print to PDF'. Trên máy Mac, mở nó trong Preview và sử dụng 'File > Export as PDF'. Cả hai phương pháp đều render lại tài liệu từ đầu, loại bỏ tất cả những thứ không cần thiết. Nhược điểm lớn? Bạn sẽ mất văn bản có thể tìm kiếm, siêu liên kết và các trường biểu mẫu. Đây là một quá trình phá hủy. Một phương pháp mạnh mẽ hơn là sử dụng Ghostscript. Lệnh `gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf` xây dựng lại tệp một cách sạch sẽ. Cài đặt `/ebook` hướng đến hình ảnh 150 DPI, hoàn hảo cho email. Cài đặt `/screen` "mạnh tay" hơn ở 72 DPI, có thể trông quá mềm trên các màn hình hiện đại. Công cụ nén của CocoConvert sử dụng một quy trình render lại tương tự. Khi bạn tải lên một tệp PDF, công cụ của chúng tôi sẽ xây dựng lại nó, loại bỏ các đối tượng dư thừa và nén lại hình ảnh. Đối với các tệp PDF đã được truyền tay và chỉnh sửa trong Acrobat trong nhiều tuần, riêng bước này có thể dễ dàng cắt giảm kích thước tệp từ 40–60% mà không làm mất đi chất lượng có thể nhìn thấy.
Chiến lược 5: Chia tài liệu và sử dụng dịch vụ truyền tệp
Đôi khi, bạn chỉ cần chấp nhận thất bại. Một cuốn cẩm nang kỹ thuật 200 trang với các sơ đồ độ phân giải cao phải giữ ở 300 DPI sẽ không thể co lại còn 10 MB. Đừng cố gắng ép buộc nó nữa. Câu trả lời đúng không phải là nén tốt hơn; mà là một phương thức phân phối tốt hơn. Nếu nội dung cho phép, việc chia tài liệu là một chiến lược hoàn toàn hợp lệ. Một báo cáo 120 MB có thể trở thành năm chương 24 MB, mỗi chương dễ dàng gửi qua email. Trong Acrobat Pro, việc này được thực hiện thông qua Tools > Organize Pages > Split. CocoConvert cũng cung cấp một công cụ PDF Split đơn giản, nơi bạn có thể xác định các phạm vi trang nếu bạn không có Acrobat. Đối với các tệp không thể nén hoặc chia nhỏ, đã đến lúc từ bỏ tệp đính kèm email và sử dụng một dịch vụ truyền tệp phù hợp. Google Drive, Dropbox, OneDrive và WeTransfer đều có thể xử lý các tệp từ 2 GB trở lên. Chỉ cần gửi một liên kết chia sẻ. Để gửi tệp cho khách hàng bên ngoài, tôi thấy WeTransfer là con đường ít trở ngại nhất—gói miễn phí của nó xử lý tới 2 GB và không yêu cầu người nhận tạo tài khoản. Nếu bạn liên tục gặp phải những giới hạn này, vấn đề là quy trình làm việc của bạn. Ai đó đang xuất PDF ở chất lượng in trong khi chúng chỉ dành cho việc xem trên màn hình. Khắc phục vấn đề ngay từ nguồn. Tạo một cài đặt trước 'web export' trong InDesign, Word, hoặc bất kỳ công cụ nào nhóm của bạn sử dụng, và biến nó thành mặc định cho bất kỳ thứ gì được gửi qua email. Ngăn chặn vấn đề trước khi nó bắt đầu.
Chọn chiến lược phù hợp cho tình huống của bạn
Ở đây không có một "viên đạn thần kỳ" duy nhất. Giải pháp đúng đắn hoàn toàn phụ thuộc vào điều gì đang làm cho tệp của bạn quá lớn và mức độ chất lượng nào bạn tuyệt đối phải giữ gìn. PDF của bạn là bản scan của một hợp đồng, biểu mẫu, hay giấy tờ vật lý khác? Chiến lược 1 là câu trả lời của bạn. Bản scan chỉ là hình ảnh, vì vậy việc nén lại chúng là chìa khóa. Giảm độ phân giải từ 300 DPI xuống 150 DPI với nén JPEG sẽ giúp một bản scan 25 MB giảm xuống dưới 3 MB. Hãy sử dụng công cụ nén của CocoConvert hoặc công cụ 'Optimize Scanned PDF' của Acrobat. Đó có phải là một tệp thiết kế đầy đủ các hiệu ứng chuyển màu, phông chữ tùy chỉnh và độ trong suốt? Bạn cần kết hợp Chiến lược 2 và 3. Làm phẳng độ trong suốt và nhúng một phần phông chữ. Điều quan trọng là bạn nên thực hiện điều này trong ứng dụng tạo ban đầu trước khi xuất PDF. Cố gắng sửa chữa sau đó sẽ lộn xộn và khó đoán. Hãy sửa nó ngay từ nguồn. Tệp PDF đã cũ, đã được chỉnh sửa và truyền tay trong nhiều tuần? Hãy sử dụng Chiến lược 4. Việc render lại hoàn toàn thông qua Ghostscript hoặc một công cụ nén sẽ "phẫu thuật" loại bỏ tất cả những "rác rưởi" kỹ thuật số tích tụ và dữ liệu dư thừa mà các tối ưu hóa riêng lẻ thường bỏ sót. Cuối cùng, nếu bạn đang cố gắng gửi email các tài liệu kỹ thuật lớn hoặc tệp in độ phân giải cao, hãy dừng lại. Email là công cụ sai cho công việc đó. Thiết lập một thư mục chia sẻ trong Google Drive hoặc SharePoint và gửi một liên kết. Nó đáng tin cậy hơn, giữ nguyên chất lượng đầy đủ và giúp mọi người không phải "vật lộn" với hộp thư đến của họ. Đối với những trường hợp khẩn cấp chỉ cần gửi tệp *ngay bây giờ*, PDF Compressor của CocoConvert được xây dựng để xử lý các vấn đề "phình to" phổ biến nhất từ hình ảnh và tài liệu đa chỉnh sửa, mà không cần cài đặt phần mềm. Tải lên, nén và tiếp tục công việc của bạn.