Cách kết hợp hoặc hợp nhất nhiều tệp văn bản
Có một số trường hợp bạn có thể cần hợp nhất nhiều tệp văn bản thành một tệp văn bản. Ví dụ: bạn có thể nhận được một đĩa CD chứa hàng trăm tệp văn bản, tất cả trong các thư mục khác nhau, mà bạn cần kết hợp thành một tệp để nhập vào Excel, v.v..
Nó cũng hữu ích nếu bạn có tệp nhật ký mạng, tệp nhật ký máy chủ hoặc nhật ký dự phòng mà bạn muốn kết hợp cho mục đích khai thác dữ liệu hoặc phân tích dữ liệu. Có một số cách khác nhau để bạn có thể tham gia các tệp văn bản với nhau và kết quả hơi khác nhau tùy thuộc vào phương pháp bạn chọn.
Trong bài viết này, tôi sẽ viết về một số cách kết hợp các tệp văn bản để nếu một phương thức không hoạt động tốt, bạn có thể thử một cách khác.
Phương pháp 1 - Dấu nhắc lệnh
Nếu bạn ổn bằng cách sử dụng dấu nhắc lệnh, thì có một vài lệnh đơn giản bạn có thể sử dụng để nhanh chóng hợp nhất một loạt các tệp văn bản. Ưu điểm của việc sử dụng dấu nhắc lệnh là bạn không phải cài đặt bất kỳ chương trình của bên thứ ba nào. Nếu bạn muốn sử dụng dấu nhắc lệnh một chút, hãy xem hướng dẫn cho người mới bắt đầu của tôi để sử dụng dấu nhắc lệnh.
Ngoài ra, vì dòng lệnh có thể có nhiều tham số, bạn thực sự có thể tạo một lệnh khá phức tạp để lọc và sắp xếp qua các tệp bạn muốn đưa vào trong quá trình nối. Tôi sẽ giải thích lệnh đơn giản nhất, nhưng cũng sẽ đi sâu vào một vài ví dụ để chỉ cho bạn cách làm những thứ phức tạp hơn.
Đầu tiên, mở Windows Explorer và đi đến thư mục chứa tệp văn bản của bạn. Nếu các tệp được lưu trữ trong nhiều thư mục con, hãy điều hướng đến thư mục mẹ. Bây giờ nhấn và giữ CTRL + Shift và sau đó nhấp chuột phải vào bất kỳ vị trí trống nào trong cửa sổ Explorer.
Điều này sẽ mở một cửa sổ lệnh đã được đặt vào thư mục bạn đang ở. Bây giờ tất cả những gì chúng ta phải làm là gõ lệnh. Như bạn có thể thấy ở trên, tôi có ba tài liệu văn bản trong thư mục cùng với một vài thư mục. Nếu tôi chỉ muốn kết hợp các tệp văn bản trong một thư mục này, tôi sẽ phát lệnh này:
đối với% f trong (* .txt), hãy gõ Loại %% f >> >> c: \ Test \ output.txt
Theo cách nói mã hóa, đây là một đơn giản CHO lặp vòng lặp qua tất cả các tệp kết thúc bằng .TXT và xuất chúng thành tệp có tên output.txt.
Như bạn có thể thấy ở trên, vòng lặp chỉ chạy một lệnh riêng cho mỗi tệp văn bản mà nó tìm thấy trong thư mục. Lưu ý rằng nếu bạn có tệp văn bản, nhưng nó có phần mở rộng khác nhau như .log hoặc .dat, v.v., thì bạn chỉ cần thay đổi giá trị * .txt trong lệnh. Cũng đáng lưu ý rằng đầu ra phải ở một vị trí khác với thư mục hiện tại, nếu không nó sẽ nối thêm tệp đầu ra với chính nó vì nó cũng là một tệp văn bản.
Bây giờ, giả sử bạn có các tệp văn bản không chỉ nằm trong một thư mục mà còn trong nhiều thư mục con. Trong trường hợp này, chúng ta có thể thêm một tham số vào lệnh, nó sẽ cho nó tìm kiếm đệ quy các tệp văn bản trong bất kỳ thư mục con nào của thư mục hiện tại.
cho / R% f trong (* .txt), hãy gõ Kiểu% f f >> >> c: \ Test \ output.txt
Bạn sẽ chú ý / R tham số ngay sau câu lệnh for. Bây giờ khi tôi chạy lệnh, bạn sẽ thấy rằng nó tìm thấy một vài tệp văn bản bổ sung trong ba thư mục nằm trong cùng một thư mục.
Như thường lệ với dấu nhắc lệnh, thực tế có một lệnh khác cho phép bạn thực hiện điều tương tự như CHO tuyên bố trên. Lệnh này thực sự đơn giản hơn rất nhiều và nếu nó hoạt động tốt với bạn, thì hãy sử dụng nó thay vì phương pháp trên.
sao chép * .txt output.txt
Lệnh này hoạt động tốt, nhưng không có nhiều tùy chọn như lệnh trước. Ví dụ: nó sẽ không cho phép bạn tìm kiếm đệ quy thông qua các thư mục con.
Phương pháp 2 - TXTCollector
TXTCollector là một công cụ hợp nhất tệp văn bản miễn phí với một bộ tính năng hợp lý. Nó rất dễ sử dụng và có thể được cấu hình để hoạt động theo một vài cách khác nhau.
Đầu tiên, nhập hoặc sao chép và dán đường dẫn thư mục vào Thư mục hộp ở trên cùng hoặc chỉ cần nhấp vào Duyệt các thư mục nút và chọn thư mục với các tập tin văn bản. Sau đó, bạn có thể chọn loại tệp bạn muốn kết hợp.
Theo mặc định, TXTCollector sẽ tìm kiếm tất cả các tệp TXT và kết hợp chúng. Tuy nhiên, bạn có thể chọn từ danh sách và kết hợp hoặc hợp nhất nhiều tệp CSV, BAT, HTM, LOG, REG, XML và INI thành một!
Kiểm tra Bao gồm các thư mục con nếu bạn muốn TXTCollector xem xét đệ quy vào từng thư mục con của thư mục chính. TXTCollector sẽ cho bạn thấy chính xác có bao nhiêu tệp được tìm thấy trong thư mục.
Tiếp theo, bạn có thể chọn một dấu phân tách sẽ xuất hiện giữa mỗi tệp đang được kết hợp. Đây là một tính năng hay mà bạn không có được bằng phương pháp dòng lệnh. Bạn có thể chọn từ menu thả xuống hoặc bạn có thể nhập bất cứ thứ gì bạn muốn vào hộp.
Theo mặc định, chương trình sẽ đặt tên thư mục, tên tệp và dấu phân cách giữa mỗi tệp. Nếu bạn muốn kết hợp các tệp liên tục mà không có bất kỳ ngắt giữa mỗi tệp, hãy kiểm tra Không có dấu phân cách, Không có tên tệp, và Không có vận chuyển trở lại.
Sau đó, bạn sẽ có lựa chọn thêm một ký tự khoảng trắng giữa các tệp hay không. Điều thú vị về TXTCollector là bạn thực sự có thể tùy chỉnh nó. Nếu bạn nhấp vào liên kết ở dưới cùng được gọi là Phần mở rộng và dấu phân cách, bạn có thể thêm tiện ích mở rộng của riêng mình vào TXTcollector.
Chỉnh sửa extend.txt tệp nằm trong thư mục dữ liệu ứng dụng TXTCollector. Lưu ý rằng TXTcollector chỉ xử lý các tệp văn bản thuần, bất kể phần mở rộng nào được sử dụng. Do đó, nó không thể kết hợp nhiều tệp XLS, ví dụ, trừ khi chúng được lưu dưới dạng văn bản thuần túy.
Hạn chế duy nhất của chương trình là nó chỉ có thể kết hợp 32.765 tệp văn bản cùng một lúc. Nếu bạn có nhiều hơn thế, bạn có thể kết hợp nhiều thứ đó thành một và sau đó kết hợp cái lớn hơn với cái nhỏ hơn, lên tới 32.765!
Nhìn chung, một ứng dụng phần mềm miễn phí rất đơn giản nhưng mạnh mẽ để kết hợp nhiều tệp văn bản. Hy vọng, hai phương pháp này sẽ làm việc cho hầu hết mọi người. Nếu bạn gặp phải một tình huống phức tạp hơn, hãy đăng bình luận và tôi sẽ cố gắng giúp đỡ.
Ngoài ra, hãy chắc chắn kiểm tra bài đăng khác của tôi về cách kết hợp nhiều bản trình bày PowerPoint. Thưởng thức!