PostgreSQL
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> PostgreSQL

Kết nối Pyspark với cơ sở dữ liệu Postgres trong máy tính xách tay ipython

Tôi không chắc tại sao câu trả lời ở trên không phù hợp với tôi nhưng tôi nghĩ tôi cũng có thể chia sẻ những gì thực sự hiệu quả với tôi khi chạy pyspark từ sổ ghi chép jupyter (Spark 2.3.1 - Python 3.6.3):

from pyspark.sql import SparkSession
spark = SparkSession.builder.config('spark.driver.extraClassPath', '/path/to/postgresql.jar').getOrCreate()
url = 'jdbc:postgresql://host/dbname'
properties = {'user': 'username', 'password': 'pwd'}
df = spark.read.jdbc(url=url, table='tablename', properties=properties)


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Làm thế nào để khôi phục dataframe.to_sql trong python trong SQLAlchemy?

  2. Cách cập nhật các hàng của hai bảng có hạn chế về khóa ngoại

  3. Nhập Thư viện psycopg2 không được tải:libssl.1.0.0.dylib

  4. Django số lượng lớn_create với các hàng bỏ qua gây ra lỗi IntegrityError?

  5. Tham chiếu đến các biến phiên (\ set var ='value') từ PL / PGSQL