sql >> データベース > >> NoSQL >> MongoDB

pysparkでfilter（）を使用して空のツイートを削除するにはどうすればよいですか？

このようなデータの場合

tweets = sc.parallelize(["title1", "", "title2", "title3", ""])

len(x)を使用できますフィルタ条件として：

tweets.filter(lambda x: len(x) > 0).count()

コレクション全体から1つのドキュメントを検索し、1つの特定の値を複数の埋め込みサブドキュメント内にネストしますネストされたクエリを使用したMongo$lookupフィルター