Xử lý dữ liệu với Spark Dataframe

 spark, dataframe, BIG DATA

Giống như viết SQL, đầy đủ chức năng như select, where ... đặc biệt là join với các DataFrame khác. Sử dụng các method như filter, select để trích xuất dữ liệu theo cột, hàng. Xử gọn các loại data như Log ... với groupBy → agg Thêm 1 cột dễ dàng với UDF(User Defined Function)