Python:
Làm việc với CSV
Cách thực hiện:
# Nhập mô-đun CSV
import csv
# Đọc một tệp CSV
with open('data.csv', 'r') as file:
reader = csv.reader(file)
for row in reader:
print(row)
# Kết quả đầu ra:
# ['Name', 'Age', 'City']
# ['Alice', '30', 'New York']
# ...
# Ghi vào một tệp CSV
with open('output.csv', 'w', newline='') as file:
writer = csv.writer(file)
writer.writerow(['Name', 'Age', 'City'])
writer.writerow(['Bob', '22', 'Los Angeles'])
# Kiểm tra output.csv để xem kết quả
Đi sâu hơn
Vào thời điểm truyền dữ liệu chậm và chi phí lưu trữ cao, CSV nhận được sự ủng hộ vì sự đơn giản và gánh nặng thấp của nó. Các lựa chọn khác như JSON và XML cung cấp cấu trúc nhưng phải trả giá bằng sự dài dòng. Đối với CSV, tốc độ phân tích là một ưu điểm, nhưng nó có thể gặp khó khăn với các cấu trúc phức tạp hoặc các loại dữ liệu.
Các thư viện như pandas
cũng có thể xử lý CSV, cung cấp nhiều sức mạnh hơn nhưng đòi hỏi nhiều tài nguyên hơn. Bên dưới bề mặt, csv.reader() là một generator, tạo ra các hàng một lần một - thông minh cho quản lý bộ nhớ.
Xem thêm
- Tài liệu đọc/viết CSV của Python: https://docs.python.org/3/library/csv.html
- Thư viện
pandas
để xử lý dữ liệu phức tạp: https://pandas.pydata.org/ - CSV vs. JSON vs. XML: Một so sánh giữa các định dạng dữ liệu: https://www.datacamp.com/community/tutorials/json-xml-csv