PostgreSQL
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> PostgreSQL

Không thể kết nối với postgres bằng jdbc trong pyspark shell

Có thể nó sẽ hữu ích.

Trong môi trường của tôi, SPARK_CLASSPATH chứa đường dẫn đến trình kết nối postgresql

from pyspark import SparkContext, SparkConf
from pyspark.sql import DataFrameReader, SQLContext
import os

sparkClassPath = os.getenv('SPARK_CLASSPATH', '/path/to/connector/postgresql-42.1.4.jar')

# Populate configuration
conf = SparkConf()
conf.setAppName('application')
conf.set('spark.jars', 'file:%s' % sparkClassPath)
conf.set('spark.executor.extraClassPath', sparkClassPath)
conf.set('spark.driver.extraClassPath', sparkClassPath)
# Uncomment line below and modify ip address if you need to use cluster on different IP address
#conf.set('spark.master', 'spark://127.0.0.1:7077')

sc = SparkContext(conf=conf)
sqlContext = SQLContext(sc)

url = 'postgresql://127.0.0.1:5432/postgresql'
properties = {'user':'username', 'password':'password'}

df = DataFrameReader(sqlContext).jdbc(url='jdbc:%s' % url, table='tablename', properties=properties)

df.printSchema()
df.show()

Đoạn mã này cho phép sử dụng pyspark khi bạn cần. Ví dụ:tôi đã sử dụng nó trong dự án Django.



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Postgresql Drop View

  2. Django JSONField lọc

  3. Đối số dòng lệnh PSQL trong tập lệnh DO

  4. PostgreSQL:So sánh chuỗi phân biệt chữ hoa chữ thường

  5. PostgreSQL:sự cố mã hóa trên Windows khi sử dụng tiện ích dòng lệnh psql