Trang chủ » làm thế nào để » Cách trích xuất hình ảnh, văn bản và tệp nhúng từ tài liệu Word, Excel và PowerPoint

    Cách trích xuất hình ảnh, văn bản và tệp nhúng từ tài liệu Word, Excel và PowerPoint

    Giả sử ai đó đã gửi cho bạn một tài liệu Word có rất nhiều hình ảnh và bạn muốn bạn lưu những hình ảnh đó vào ổ cứng. Bạn có thể trích xuất hình ảnh từ tài liệu Microsoft Office bằng một mẹo đơn giản.

    Nếu bạn có tệp Word (.docx), Excel (.xlsx) hoặc PowerPoint (.pptx) có hình ảnh hoặc các tệp khác được nhúng, bạn có thể trích xuất chúng (cũng như văn bản của tài liệu), mà không phải lưu riêng từng tệp . Và tốt nhất, bạn không cần bất kỳ phần mềm bổ sung nào. Các định dạng tệp dựa trên Office XML - docx, xlsx và pptx - thực sự là các tệp lưu trữ được nén mà bạn có thể mở như mọi tệp .zip thông thường với Windows. Từ đó, bạn có thể trích xuất hình ảnh, văn bản và các tệp nhúng khác. Bạn có thể sử dụng hỗ trợ .zip tích hợp của Windows hoặc ứng dụng như 7-Zip nếu bạn thích.

    Nếu bạn cần trích xuất các tệp từ một tài liệu văn phòng cũ hơn - như tệp .doc, .xls hoặc .ppt - bạn có thể làm như vậy với một phần mềm nhỏ miễn phí. Chúng tôi sẽ trình bày chi tiết về quá trình ở cuối hướng dẫn này.

    Cách trích xuất nội dung của tệp văn phòng mới hơn (.docx, .xlsx hoặc .pptx)

    Để truy cập nội dung bên trong của tài liệu Office dựa trên XML, hãy mở File Explorer (hoặc Windows Explorer trong Windows 7), điều hướng đến tệp mà bạn muốn trích xuất nội dung và chọn tệp.

    Nhấn nút F2 F2 để đổi tên tập tin và thay đổi phần mở rộng (.docx, .xlsx hoặc .pptx) thành siêu .zip. Để lại phần chính của tên tệp một mình. Nhấn vào Enter Enter khi bạn hoàn thành.

    Hộp thoại sau hiển thị cảnh báo bạn về việc thay đổi phần mở rộng tên tệp. Nhấp vào Có Có.

    Windows tự động nhận ra tệp dưới dạng tệp nén. Để trích xuất nội dung của tệp, nhấp chuột phải vào tệp và chọn Chiết xuất Tất cả các dòng từ menu bật lên.

    Trên hộp thoại Chọn một tệp đích và giải nén tập tin, đường dẫn trong đó nội dung của tệp .zip sẽ được trích xuất hiển thị trong các tệp tin của tập tin sẽ được trích xuất vào thư mục này. Theo mặc định, một thư mục có cùng tên với tên của tệp (không có phần mở rộng tệp) được tạo trong cùng thư mục với tệp .zip. Để giải nén các tập tin vào một thư mục khác, hãy nhấp vào Duyệt Duyệt.

    Điều hướng đến nơi bạn muốn nội dung của tệp .zip được trích xuất, nhấp vào thư mục Mới của Bỉ để tạo thư mục mới, nếu cần. Nhấp vào Chọn Chọn Thư mục.

    Để mở cửa sổ File Explorer (hoặc Windows Explorer) với thư mục chứa các tệp được giải nén hiển thị sau khi chúng được giải nén, hãy chọn hộp thư được trích xuất Show Show khi hoàn thành hộp kiểm của vì thế có một dấu kiểm trong hộp. Nhấp vào trích xuất.

    Cách truy cập hình ảnh được trích xuất

    Bao gồm trong các nội dung được trích xuất là một thư mục có tên là từ word, nếu tệp gốc của bạn là một tài liệu Word (hoặc có nghĩa là xlith cho một tài liệu Excel hoặc một ppt mật cho một tài liệu PowerPoint). Nhấp đúp chuột vào thư mục từ ngữ của Wikipedia để mở nó.

    Nhấp đúp vào thư mục Media media.

    Tất cả các hình ảnh từ tập tin gốc đều nằm trong thư mục của Media media. Các tập tin được trích xuất là hình ảnh gốc được sử dụng bởi tài liệu. Trong tài liệu, có thể có kích thước thay đổi hoặc các thuộc tính khác được đặt, nhưng các tệp được trích xuất là hình ảnh thô mà không áp dụng các thuộc tính này.

    Cách truy cập văn bản trích xuất

    Nếu bạn chưa cài đặt Office trên PC và bạn cần trích xuất văn bản ra khỏi tệp Word (hoặc Excel hoặc PowerPoint), bạn có thể truy cập vào văn bản được trích xuất trong tệp Tài liệu.

    Bạn có thể mở tệp này trong trình soạn thảo văn bản, chẳng hạn như Notepad hoặc Wordman, nhưng dễ đọc hơn trong trình soạn thảo XML đặc biệt, chẳng hạn như chương trình miễn phí, Notepad Notepad. Tất cả văn bản từ tệp có sẵn trong các đoạn văn bản đơn giản bất kể kiểu và / hoặc định dạng được áp dụng trong chính tài liệu. Tất nhiên, nếu bạn định tải xuống phần mềm miễn phí để xem văn bản này, bạn cũng có thể tải xuống LibreOffice, có thể đọc tài liệu Microsoft Office.

    Cách trích xuất các đối tượng OLE nhúng hoặc tệp đính kèm

    Để truy cập các tệp được nhúng trong tài liệu Word khi bạn không có quyền truy cập vào Word, trước tiên hãy mở tệp Word trong Wordman (được tích hợp trong Windows). Bạn có thể nhận thấy rằng một số biểu tượng tệp nhúng không hiển thị, nhưng chúng vẫn ở đó. Một số tệp được nhúng có thể có tên tệp một phần. Wordman không hỗ trợ tất cả các tính năng của Word, vì vậy một số nội dung có thể được hiển thị không đúng cách. Nhưng bạn sẽ có thể truy cập các tập tin.

    Nếu chúng tôi nhấp chuột phải vào một trong các tệp được nhúng trong tệp Word mẫu của chúng tôi, một trong các tùy chọn là Đối tượng Mở Open PDF. Thao tác này sẽ mở tệp PDF trong chương trình đọc PDF mặc định trên PC của bạn. Từ đó, bạn có thể lưu tệp PDF vào ổ cứng của mình.

    Nếu Wordman không có tùy chọn để mở tệp của bạn, hãy lưu ý loại tệp của nó ở đây. Ví dụ: tệp thứ hai của chúng tôi trong tài liệu này là tệp .mp3.

    Sau đó, quay trở lại Tệp tin của bạn từ thư mục [Tài liệu] và bấm đúp vào thư mục của nhúng nhúng vào thư mục bên trong thư mục.

    Thật không may, các loại tệp không được bảo tồn trong tên tệp. Thay vào đó, tất cả chúng đều có phần mở rộng tập tin .bin. Nếu bạn biết loại tệp nào được nhúng trong tệp, có lẽ bạn có thể suy ra tệp nào là kích thước của tệp. Trong ví dụ của chúng tôi, chúng tôi đã có một tệp PDF và một tệp MP3 được nhúng trong tài liệu của chúng tôi. Vì tệp MP3 có khả năng lớn hơn tệp PDF, nên chúng tôi có thể tìm ra tệp nào bằng cách xem kích thước của tệp và sau đó đổi tên chúng bằng các phần mở rộng chính xác. Dưới đây, chúng tôi đổi tên tệp MP3.

    Lưu ý rằng không phải tất cả các tệp sẽ nhất thiết phải mở bằng quy trình này - ví dụ: tệp PDF của chúng tôi được mở chính xác từ Wordman, nhưng chúng tôi không thể mở tệp bằng cách đổi tên tệp .bin của nó.

    Khi bạn đã trích xuất nội dung của tệp nén, bạn có thể hoàn nguyên phần mở rộng của tệp gốc trở lại .docx, .xlsx hoặc .pptx. Các tập tin sẽ vẫn còn nguyên và có thể được mở bình thường trong chương trình tương ứng.

    Cách trích xuất hình ảnh từ các tài liệu văn phòng cũ hơn (.doc, .xls hoặc .ppt)

    Nếu bạn cần trích xuất hình ảnh từ tài liệu Office 2003 (hoặc cũ hơn), có một công cụ miễn phí có tên là Trình hướng dẫn trích xuất hình ảnh Office giúp thực hiện công việc này dễ dàng. Chương trình này cũng cho phép bạn trích xuất hình ảnh từ nhiều tài liệu (cùng loại hoặc khác nhau) cùng một lúc. Tải xuống chương trình và cài đặt nó (cũng có sẵn phiên bản di động nếu bạn không cài đặt nó).

    Chạy chương trình và màn hình Chào mừng hiển thị. Nhấn tiếp".

    Đầu tiên, chúng ta cần chọn tệp mà bạn muốn trích xuất hình ảnh. Trên màn hình Nhập & Xuất, nhấp vào nút Duyệt Duyệt (biểu tượng thư mục) ở bên phải hộp chỉnh sửa Tài liệu.

    Điều hướng đến thư mục chứa tài liệu bạn muốn, chọn nó và nhấp vào Mở Open.

    Thư mục chứa tệp đã chọn tự động trở thành thư mục đầu ra. Để tạo một thư mục con trong thư mục đó có tên giống như tệp đã chọn, hãy nhấp vào hộp thư Tạo một thư mục ở đây Hộp kiểm hình chữ nhật để có dấu kiểm trong hộp. Sau đó, nhấp vào Tiếp theo.

    Trên màn hình Sẵn sàng để Bắt đầu, nhấp vào Bắt đầu Bắt đầu trực tuyến để bắt đầu trích xuất hình ảnh.

    Màn hình sau hiển thị trong khi quá trình trích xuất.

    Trên màn hình Hoàn tất, nhấp vào Bấm vào đây để mở thư mục đích Danh sách để xem các tệp hình ảnh kết quả.

    Vì chúng tôi đã chọn tạo thư mục con, chúng tôi nhận được một thư mục chứa các tệp hình ảnh được trích xuất từ ​​tệp.

    Bạn sẽ thấy tất cả các hình ảnh dưới dạng các tập tin được đánh số.

    Bạn cũng có thể trích xuất hình ảnh từ nhiều tệp cùng một lúc. Để thực hiện việc này, trên màn hình Đầu vào & Đầu ra, hãy nhấp vào hộp kiểm Chế độ Batch Chế độ trực tuyến để có dấu kiểm trong hộp.

    Màn hình Batch Input & Output hiển thị. Nhấp vào Thêm Thêm tập tin.

    Trên hộp thoại Mở, điều hướng đến thư mục chứa bất kỳ tệp nào bạn muốn trích xuất hình ảnh, chọn các tệp bằng phím Shift Shift hoặc hoặc Ctrl Ctrl để chọn nhiều tệp và nhấp vào Mở Open.

    Bạn có thể thêm các tập tin từ một thư mục khác bằng cách nhấp vào Thêm Thêm tập tin vào một lần nữa, điều hướng đến thư mục trên hộp thoại Mở, chọn các tập tin mong muốn và nhấp vào.

    Khi bạn đã thêm tất cả các tệp mà bạn muốn trích xuất hình ảnh, bạn có thể chọn tạo một thư mục riêng cho từng tài liệu trong cùng một thư mục với mỗi tài liệu mà các tệp hình ảnh sẽ được lưu bằng cách nhấp vào thư mục Tạo thư mục cho mỗi hộp kiểm tài liệu, vì vậy có một dấu kiểm trong hộp.

    Bạn cũng có thể chỉ định thư mục đầu ra là giống nhau như thư mục đầu vào của từng tập tin, hoặc nhập hoặc chọn một thư mục tùy chỉnh bằng cách sử dụng hộp chỉnh sửa và nút Duyệt Duyệt, bên dưới tùy chọn đó. Nhấp vào Tiếp theo Tiếp theo khi bạn đã chọn các tùy chọn bạn muốn.

    Nhấp vào Bắt đầu ngay trên màn hình Sẵn sàng để Bắt đầu.

    Màn hình sau đây hiển thị tiến trình trích xuất.

    Số lượng hình ảnh được trích xuất hiển thị trên màn hình Hoàn thành. Nhấp vào Đóng Đóng Đóng để đóng Trình hướng dẫn trích xuất hình ảnh Office.

    Nếu bạn chọn tạo một thư mục riêng cho mỗi tài liệu, bạn sẽ thấy các thư mục có cùng tên với các tệp chứa hình ảnh, bất kỳ thư mục đầu ra nào bạn chỉ định.

    Một lần nữa, chúng tôi nhận được tất cả các hình ảnh dưới dạng tệp được đánh số cho mỗi tài liệu.

    Bây giờ bạn có thể đổi tên hình ảnh, di chuyển chúng và sử dụng chúng trong các tài liệu của riêng bạn. Chỉ cần đảm bảo rằng bạn có quyền sử dụng chúng một cách hợp pháp.