Mysql
 sql >> Cơ Sở Dữ Liệu >  >> RDS >> Mysql

Truy cập vào một bảng cụ thể trong thẻ html

Có vẻ như vấn đề với mã của alecxe là nó trả về một bảng là anh chị em trực tiếp của h2, nhưng bảng bạn muốn thực sự nằm trong một div (là anh chị em của h2). Điều này đã làm việc cho tôi:

import requests
from bs4 import BeautifulSoup

urls = [
    'https://www.hl7.org/fhir/valueset-account-status.html',
    'https://www.hl7.org/fhir/valueset-activity-reason.html',
    'https://www.hl7.org/fhir/valueset-age-units.html'
]


def extract_table(url):
    r = requests.get(url)
    soup = BeautifulSoup(r.content, 'lxml')

    h2 = soup.find(lambda elm: elm.name == 'h2' and 'Content Logical Definition' in elm.text)
    div = h2.find_next_sibling('div')
    return div.find('table')


for url in urls:
    print extract_table(url)



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Phiên bản Django MySQLdb không khớp với phiên bản _mysql Ubuntu

  2. Cách kết nối với cơ sở dữ liệu MySQL hoặc MariaDB

  3. Cách quản lý các quy trình phía máy chủ bằng MySQL

  4. SubSonic 3 và MySQL, xóa dấu gạch dưới khỏi tên cột trong phương thức CleanUp () gây ra ngoại lệ khi sử dụng thuộc tính trong truy vấn linq

  5. Kiểm tra sự tồn tại của cột / khóa?