sql >> データベース >  >> NoSQL >> MongoDB

pysparkでfilter()を使用して空のツイートを削除するにはどうすればよいですか?

    このようなデータの場合

    tweets = sc.parallelize(["title1", "", "title2", "title3", ""])
    

    len(x)を使用できます フィルタ条件として:

    tweets.filter(lambda x: len(x) > 0).count()
    



    1. HerokuアプリをAtlasMongoDBクラウドサービスに接続する

    2. TravisCIでRedisを実行する

    3. RedisデータをMySQLに同期するための最良の戦略は何ですか?

    4. 埋め込みコレクションのMongoDB優先スキーマ。ドキュメントと配列