Mysql
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Mysql

Spark JoinWithCassandraTable trên khóa phân vùng TimeStamp STUCK

Bằng cách sử dụng:

sc.parallelize(startDate to endDate)

Với startData và endDate as Longs được tạo từ Ngày theo định dạng:

("yyyy-MM-dd HH:mm:ss")

Tôi đã tạo ra tia lửa để xây dựng một mảng khổng lồ (hơn 100.000 đối tượng) để tham gia với bảng C * và nó không bị mắc kẹt gì cả- C * đã làm việc chăm chỉ để thực hiện liên kết và trả về dữ liệu.

Cuối cùng, tôi đã thay đổi phạm vi của mình thành:

case class TableKey(created_dh: String)
val data = Array("2015-10-29 12:00:00", "2015-10-29 13:00:00", "2015-10-29 14:00:00", "2015-10-29 15:00:00")
val snapshotsFiltered = sc.parallelize(data, 2).map(TableKey(_)).joinWithCassandraTable("listener","snapshots_tnew")

Và bây giờ nó ổn.




  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. thực thi tệp * .sql với python MySQLdb

  2. Làm thế nào để sử dụng câu lệnh CASE trong MySQL?

  3. Django, sau khi nâng cấp:Máy chủ MySQL đã biến mất

  4. Sử dụng Đếm để tìm số lần xuất hiện

  5. SQLSTATE [HY000]:Lỗi chung:1298 Múi giờ không xác định hoặc không chính xác:cửa sổ 'UTC'