Mysql
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Mysql

Làm thế nào để chuyển đổi một bảng SQL 500GB thành Apache Parquet?

Apache Spark có thể được sử dụng để làm điều này:

1.load your table from mysql via jdbc
2.save it as a parquet file

Ví dụ:

from pyspark.sql import SparkSession
spark = SparkSession.builder.getOrCreate()
df = spark.read.jdbc("YOUR_MYSQL_JDBC_CONN_STRING",  "YOUR_TABLE",properties={"user": "YOUR_USER", "password": "YOUR_PASSWORD"})
df.write.parquet("YOUR_HDFS_FILE")


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Hibernate:sử dụng backticks cho MySQL nhưng không cho HSQL

  2. Làm cách nào để thoát% trong Knex nơi giống như truy vấn?

  3. Chèn MySQL trên bản cập nhật trùng lặp cho khóa không phải CHÍNH

  4. MySQL BLOB so với Tệp để lưu trữ hình ảnh PNG nhỏ?

  5. mysql, chuyển đổi / xoay hàng thành cột, các lựa chọn biến