Xóa các ký tự phù hợp với một mẫu

Java:
Xóa các ký tự phù hợp với một mẫu

Cách thực hiện:

Trong Java, chúng ta thường sử dụng phương thức String.replaceAll() với một mẫu regex để xóa ký tự. Dưới đây là một ví dụ nhanh:

public class PatternDeletionExample {
    public static void main(String[] args) {
        String originalString = "Hello, 123 World! This-is a test-string.";
        String pattern = "\\d|-"; // \d là một số, - là dấu gạch ngang

        String cleanedString = originalString.replaceAll(pattern, "");
        System.out.println(cleanedString); // In ra: Hello,  World! This is a teststring.
    }
}

Đoạn mã này loại bỏ các chữ số và dấu gạch ngang để làm sạch chuỗi của chúng ta.

Sâu hơn

Ngày xưa, mọi người thao tác với chuỗi mà không cần đến các phương thức tiện lợi và regex. Họ phải làm việc một cách khó khăn, từng ký tự một, điều này thật đau đớn. Sau đó, biểu thức chính quy (regex) xuất hiện, và mọi thứ trở nên dễ dàng hơn nhiều. Regex là một tiêu chuẩn khớp mẫu mạnh mẽ được sử dụng trong xử lý văn bản.

Vậy tại sao lại sử dụng replaceAll()? Nó là một phần của lớp String trong Java, và vì chuỗi xuất hiện mọi nơi, nên nó trở thành lựa chọn hàng đầu cho việc chỉnh sửa văn bản dựa trên mẫu. Nó nhận hai tham số: regex cho mẫu cần loại bỏ và thứ để thay thế vào đó—trong trường hợp của chúng ta, một chuỗi rỗng để xóa nó.

Có các phương án thay thế như lớp PatternMatcher cho công việc phức tạp hơn. Những cái này có ích cho các nhiệm vụ tinh tế hơn, như tìm mẫu mà không xóa chúng, hoặc thay thế chúng theo cách phức tạp hơn.

Việc triển khai phụ thuộc vào trình động cơ regex của Java, nó phân tích mẫu và áp dụng nó lên chuỗi mục tiêu. Đó là một nhiệm vụ tìm kiếm và tiêu diệt ký tự mini—tìm mẫu, sau đó loại bỏ nó.

Xem thêm