Trích xuất chuỗi con

Haskell:
Trích xuất chuỗi con

Làm thế nào:

Trong Haskell, bạn có thể cắt và chia chuỗi bằng các hàm có sẵn như take, drop, và substring (từ Data.Text).

import Data.Text (Text, pack, unpack, take, drop)

-- Chuỗi ví dụ của chúng tôi
let exampleStr = "Haskell makes sense!"

-- Lấy 7 ký tự đầu tiên
print $ unpack (take 7 (pack exampleStr)) -- "Haskell"

-- Bỏ 8 ký tự đầu tiên
print $ unpack (drop 8 (pack exampleStr)) -- "makes sense!"

-- Hàm tự tạo để trích xuất một chuỗi con theo vị trí và độ dài
substring :: Int -> Int -> Text -> Text
substring start length = take length . drop start

-- Trích xuất "makes" (bắt đầu từ vị trí thứ 8, độ dài 5)
print $ unpack (substring 8 5 (pack exampleStr)) -- "makes"

Đầu ra mẫu:

"Haskell"
"makes sense!"
"makes"

Đào sâu

Việc trích xuất các chuỗi con đã là một phần của Haskell từ lâu. Ban đầu, nó dựa vào danh sách, vì chuỗi là danh sách các ký tự. Hiệu suất không tốt lắm. Nhập Data.Text, cung cấp các thao tác chuỗi hiệu quả.

Các lựa chọn thay thế bao gồm các thao tác danh sách, biểu thức chính quy, và thư viện phân tích cú pháp. Thao tác danh sách đơn giản hơn nhưng chậm hơn với chuỗi lớn. Biểu thức chính quy mạnh mẽ nhưng quá mức cho các nhiệm vụ đơn giản. Thư viện phân tích cú pháp được sử dụng cho việc phân tích phức tạp nhưng cũng có thể xử lý các chuỗi con.

Việc thực hiện một hàm chuỗi con tùy chỉnh trong Haskell là đơn giản sử dụng takedrop từ Data.Text, cung cấp khả năng xử lý chuỗi nhanh hơn so với các thao tác dựa trên danh sách.

Tham khảo thêm