sql >> データベース >  >> RDS >> Mysql

htmlタグ内の特定のテーブルへのアクセス

    alecxeのコードの問題は、h2の直接の兄弟であるテーブルを返すことですが、必要なテーブルは実際にはdiv(h2の兄弟)内にあります。これは私のために働いた:

    import requests
    from bs4 import BeautifulSoup
    
    urls = [
        'https://www.hl7.org/fhir/valueset-account-status.html',
        'https://www.hl7.org/fhir/valueset-activity-reason.html',
        'https://www.hl7.org/fhir/valueset-age-units.html'
    ]
    
    
    def extract_table(url):
        r = requests.get(url)
        soup = BeautifulSoup(r.content, 'lxml')
    
        h2 = soup.find(lambda elm: elm.name == 'h2' and 'Content Logical Definition' in elm.text)
        div = h2.find_next_sibling('div')
        return div.find('table')
    
    
    for url in urls:
        print extract_table(url)
    



    1. PyQtを使用したSQLデータベースの処理:基本

    2. mysqlでランダムな行を選択し、各グループ内で制限します

    3. mysqlで多くのフィールドを呼び出すときに*を使用するのが最適ですか?

    4. GDIリソースリークの処理