Sự cố có thể là ở các phiên bản Avro khác nhau trong Hadoop của Dataproc (Avro 1.7.7) và Sqoop 1.4.7 (Avro 1.8.1).
Bạn có thể muốn hạ cấp Sqoop xuống 1.4.6 tùy thuộc vào Avro 1.7 và sử dụng avro-tools-1.7.7.jar trong quá trình nộp hồ sơ.
Đã chỉnh sửa:
Để giải quyết vấn đề tải lớp, bạn cần đặt mapreduce.job.classloader=true khi gửi công việc Dataproc:
gcloud dataproc jobs submit hadoop --cluster=<CLUSTER_NAME> \
--class=org.apache.sqoop.Sqoop \
--jars=gs://<BUCKET>/sqoop-1.4.7-hadoop260.jar \
--properties=mapreduce.job.classloader=true \
-- \
. . .