データシーケンスは、ルールのいくつかの必要な値を抽出そこまたは短縮シーケンスを使用したいです
最も簡単な方法は、誘導された配列要素のフィルタリストを使用することです。
>>> mylist = [1, 4, -5, 10, -7, 2, 3, -1]
>>> [n for n in mylist if n > 0]
[1, 4, 10, 2, 3]
>>> [n for n in mylist if n < 0]
[-5, -7, -1]
潜在的な欠陥のリスト内包を使ってその入力が非常に大きな結果セットを持つことになり非常に大きい場合、メモリ集約的です。あなたは、メモリに対してより敏感である場合は、反復が要素をフィルタリング生成ジェネレータ式を使用することができます。例えば:
>>> pos = (n for n in mylist if n > 0)
>>> pos
<generator object <genexpr> at 0x1006a0eb0>
>>> for x in pos:
... print(x)
...
1
4
10
2
3
>>>
そして、得られた式のリストを生成することは、通常、データをフィルタリングするための最も簡単な方法です。実際に、彼らは時間をフィルタリングし、データを変換することができます。例えば:
>>> mylist = [1, 4, -5, 10, -7, 2, 3, -1]
>>> import math
>>> [math.sqrt(n) for n in mylist if n > 0]
[1.0, 2.0, 3.1622776601683795, 1.4142135623730951, 1.7320508075688772]
むしろそれらを捨てるよりも、所定の位置に新しい値で条件値を満たしていませんフィルタリング操作の変種です。たとえば、データには、あなただけではなく、正を見つけたい、だけでなく、指定された番号に置き換えられていない数をカウントすることもできます。条件式に行くための基準をフィルタリングすることにより、我々は簡単にこのように、この問題を解決することができます。
>>> clip_neg = [n if n > 0 else 0 for n in mylist]
>>> clip_neg
[1, 4, 0, 10, 0, 2, 3, 0]
>>> clip_pos = [n if n < 0 else 0 for n in mylist]
>>> clip_pos
[0, 0, -5, 0, -7, 0, 0, -1]
別の問題は、フィルタリングツールで itertools.compress()
とり、 iterable
オブジェクトと対応する Boolean
入力パラメータとしてセレクタ配列。そして、出力 iterable
オブジェクトのためのセレクタは、対応する True
要素を。あなたは、フィルタのシーケンスに関連する別のシーケンスを使用する必要がある場合は、この機能は非常に便利であるとき。今、あなたはに対応することを望む count
すべての出力の5つのアドレスより値の大きいが、その後、あなたがこれを行うことができます。
addresses = [
'5412 N CLARK',
'5148 N CLARK',
'5800 E 58TH',
'2122 N CLARK',
'5645 N RAVENSWOOD',
'1060 W ADDISON',
'4801 N BROADWAY',
'1039 W GRANVILLE',
]
counts = [ 0, 3, 10, 4, 1, 7, 6, 1]
>>> from itertools import compress
>>> more5 = [n > 5 for n in counts]
>>> more5
[False, False, True, False, False, True, True, False]
>>> list(compress(addresses, more5))
['5800 E 58TH', '1060 W ADDISON', '4801 N BROADWAY']
ここで重要なポイントは、作成することで Boolean
どの要素資格を示す、シーケンスを。次いで、 compress()
位置に対応する出力を選択するように、この配列に従って機能 True
素子のを。
そして、 filter()
同様の機能 compress()
も反復子を返します。あなたがリストを取得する必要があるのであれば、あなたは使用する必要がある list()
リスト型に結果を変換します。